خلاصه سازی متون اخبار مبتنی بر استخراج کلمات کلیدی با استفاده از مدل ترکیبی گاوسی
Publish place: 5th International Conference on knowledge based research in Computer engineering and Information Technology
Publish Year: 1396
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 866
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
COMCO04_033
تاریخ نمایه سازی: 17 آبان 1396
Abstract:
خلاصه سازی متون اخبار، روند کاهش متون اخبار است که نتیجه آن ایجاد خلاصه ای با حفظ مهم ترین نکات اصلی اخبار می باشد. استخراج خلاصه از متون داده شده، استخراج جملاتی است که پیام اصلی متن را می رساند. بیشتر تکنیک های خلاصه سازی شامل مفاهیمی مثل یافتن کلمات کلیدی و استخراج جملاتی است که دارای بیشترین کلمات کلیدی هستند. استخراج کلمات کلیدی معمولا به بیشترین تکرار کلمه با توجه به میزان اهمیت آن کلمه وابسته است. در این مدل نیاز به حاشیه نویسی توسط انسان وجود دارد تا الگوریتم پیشنهادی را آموزش داده و اسناد را تجزیه و تحلیل کرده و کلمات کلیدی احتمالی را انتخاب کنند. این کلمات کلیدی به برچسب زن POS برای تحلیل اطلاعات داده می شود و مقادیر توزیع احتمال به عنوان مقدار احتمال تشخیص کلمات کلیدی محاسبه می شوند و نمره هر متن محاسبه شده و تعدادی از پر امتیازترین متون به عنوان یک کلمه کلیدی انتخاب می شود. در این مقاله از مدل ترکیبی گاوسی برای برچسب زنی POS استفاده می شود. عملکرد روش پیشنهادی در مقایسه با روش های پایه بهبود قابل توجهی داشته است.
Keywords:
Authors
سینا دامی
استادیار، دانشگاه آزاد اسلامی واحد تهران غرب، گروه کامپیوتر، تهران، ایران
المیرا کریمی
دانشجوی کارشناسی ارشد، دانشگاه آزاد اسلامی، واحد تهران غرب، گروه کامپیوتر، تهران، ایران