خلاصه سازی متون اخبار مبتنی بر استخراج کلمات کلیدی با استفاده از مدل ترکیبی گاوسی

Publish Year: 1396
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 866

This Paper With 9 Page And PDF and WORD Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

COMCO04_033

تاریخ نمایه سازی: 17 آبان 1396

Abstract:

خلاصه سازی متون اخبار، روند کاهش متون اخبار است که نتیجه آن ایجاد خلاصه ای با حفظ مهم ترین نکات اصلی اخبار می باشد. استخراج خلاصه از متون داده شده، استخراج جملاتی است که پیام اصلی متن را می رساند. بیشتر تکنیک های خلاصه سازی شامل مفاهیمی مثل یافتن کلمات کلیدی و استخراج جملاتی است که دارای بیشترین کلمات کلیدی هستند. استخراج کلمات کلیدی معمولا به بیشترین تکرار کلمه با توجه به میزان اهمیت آن کلمه وابسته است. در این مدل نیاز به حاشیه نویسی توسط انسان وجود دارد تا الگوریتم پیشنهادی را آموزش داده و اسناد را تجزیه و تحلیل کرده و کلمات کلیدی احتمالی را انتخاب کنند. این کلمات کلیدی به برچسب زن POS برای تحلیل اطلاعات داده می شود و مقادیر توزیع احتمال به عنوان مقدار احتمال تشخیص کلمات کلیدی محاسبه می شوند و نمره هر متن محاسبه شده و تعدادی از پر امتیازترین متون به عنوان یک کلمه کلیدی انتخاب می شود. در این مقاله از مدل ترکیبی گاوسی برای برچسب زنی POS استفاده می شود. عملکرد روش پیشنهادی در مقایسه با روش های پایه بهبود قابل توجهی داشته است.

Authors

سینا دامی

استادیار، دانشگاه آزاد اسلامی واحد تهران غرب، گروه کامپیوتر، تهران، ایران

المیرا کریمی

دانشجوی کارشناسی ارشد، دانشگاه آزاد اسلامی، واحد تهران غرب، گروه کامپیوتر، تهران، ایران