خلاصه سازی چند سندی اخبار بر خط مبتنی بر توابع زیرپیمانه با قابلیت یادگیری
Publish place: 6th International Web Research Conference
Publish Year: 1399
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 614
This Paper With 8 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
IRANWEB06_018
تاریخ نمایه سازی: 16 مرداد 1399
Abstract:
با افزایش انتشار بر خط اطلاعات و گسترش کاربران اینترنت، نیاز به خلاصه سازی خودکار متن ضرورت بیشتری یافته است. در این مقاله، یک روش خلاصه سازی چند سندی مبتنی بر توابع زیرپیمانه قابل یادگیری ارایه می شود. با استفاده از زیرپیمانگی، امکان تضمین کیفیت راه حل وجود دارد. در روش ارایه شده ، سندهای متنی ورودی با استفاده از گراف های وزن دار مدل سازی می شوند که راس ها، بازنمایی کننده ی جملات و یال ها نشان دهنده ی شباهت بین جملات است. با استفاده از تین گراف، ویژگی هایی که نشان دهنده ی اهمیت و تاثیر هر جمله است، استخراج می شوند. ویژگی های اهمیت، ارزش هر جمله را مستقل از جملات دیگر در نظر می گیرند. برای مدل سازی این ویژگی ها، از توابع پیمانه ای استفاده می شود. ویژگی های تاثیر، ارزش هر جمله را با توجه به ارتباط آن با جملات دیگر در نظر می گیرند. برای مدل سازی این ویژگی ها از توابع زیرپیمانه ای استفاده می گردد. این ویژگی ها اجزای سازنده ی تابع هدف را تشکیل می دهند که معادل با یک شبکه ی عصبی متعارف است. از همین رو، از یک مجموعه ی آموزشی جهت آموزش شبکه استفاده می شود. پس از اجزای فرایند یادگیری، از این تابع به منظور خلاصه سازی استخراجی چند سندی استفاده می شود. این خلاصه ساز با استفاده از پیکره ی پاسخ و DUC 2004 آزمایش شده، و نتایج حاصل از آن ارایه گردیده است.
Keywords:
Authors
علیرضا قدیمی
پژوهشکده فناوری اطلاعات و ارتباطات جهاد دانشگاهی، تهران، ایران
حمید بیگی
دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شریف، تهران، ایران