خلاصه سازی چند سندی اخبار بر خط مبتنی بر توابع زیرپیمانه با قابلیت یادگیری

Publish Year: 1399
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 614

This Paper With 8 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

IRANWEB06_018

تاریخ نمایه سازی: 16 مرداد 1399

Abstract:

با افزایش انتشار بر خط اطلاعات و گسترش کاربران اینترنت، نیاز به خلاصه سازی خودکار متن ضرورت بیشتری یافته است. در این مقاله، یک روش خلاصه سازی چند سندی مبتنی بر توابع زیرپیمانه قابل یادگیری ارایه می شود. با استفاده از زیرپیمانگی، امکان تضمین کیفیت راه حل وجود دارد. در روش ارایه شده ، سندهای متنی ورودی با استفاده از گراف های وزن دار مدل سازی می شوند که راس ها، بازنمایی کننده ی جملات و یال ها نشان دهنده ی شباهت بین جملات است. با استفاده از تین گراف، ویژگی هایی که نشان دهنده ی اهمیت و تاثیر هر جمله است، استخراج می شوند. ویژگی های اهمیت، ارزش هر جمله را مستقل از جملات دیگر در نظر می گیرند. برای مدل سازی این ویژگی ها، از توابع پیمانه ای استفاده می شود. ویژگی های تاثیر، ارزش هر جمله را با توجه به ارتباط آن با جملات دیگر در نظر می گیرند. برای مدل سازی این ویژگی ها از توابع زیرپیمانه ای استفاده می گردد. این ویژگی ها اجزای سازنده ی تابع هدف را تشکیل می دهند که معادل با یک شبکه ی عصبی متعارف است. از همین رو، از یک مجموعه ی آموزشی جهت آموزش شبکه استفاده می شود. پس از اجزای فرایند یادگیری، از این تابع به منظور خلاصه سازی استخراجی چند سندی استفاده می شود. این خلاصه ساز با استفاده از پیکره ی پاسخ و DUC 2004 آزمایش شده، و نتایج حاصل از آن ارایه گردیده است.

Keywords:

خلاصه سازی چند سندی , زیرپیمانگی , شبکه عصبی , گراف وزن دار

Authors

علیرضا قدیمی

پژوهشکده فناوری اطلاعات و ارتباطات جهاد دانشگاهی، تهران، ایران

حمید بیگی

دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شریف، تهران، ایران