CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

خلاصه سازی خودکار چند سنی مبتنی بر مفاهیم

عنوان مقاله: خلاصه سازی خودکار چند سنی مبتنی بر مفاهیم
شناسه ملی مقاله: CSICC16_031
منتشر شده در شانزدهمین کنفرانس سالانه انجمن کامپیوتر ایران در سال 1389
مشخصات نویسندگان مقاله:

آصف پور معصومی - آزمایشگاه فناوری وب،دانشگاه فردوسی مشهد
محسن کاهانی - آزمایشگاه فناوری وب،دانشگاه فردوسی مشهد
محسن کامیار
حسین کامیار

خلاصه مقاله:
خلاصه سازی خودکار چندسندی روشی برای ارایه فشرده مطالبی است که در ارتباط با یک موضوع بوده ولی جهت دید آنها متفاوت از یکدیگر می باشند خلاصه خوب باید بیانگر زمینه کلی بوده و ضمن بیان دیدگاه های مختلف موجود در متن از خوانایی و پیوستگی بالایی برخوردار باشد دراین مقاله با بهره گیری شکل جدیدی از روش استخراج روابط معنایی موجود درمتن LSIیا LSA و تکنیک برچسب زنی معنایی نقش لغات sRL روشی جدید برای خلاصه سازی چند سندی شدها ست درابتدا با استفاده از ماتریس کلمه - سند به جای ماتریس کلمه - جمله و با بهره گیری از LSA جملات مهم مرتبط با زمینه استخراج می شود درگام بعدی با استفاده از تکنیک sRL و با استفاده از Word NET شباهت معنایی جملات استخراج شده و درنهایت جملات شبیه به هم حذف می شوند نتایج آزمایشها برروی داده های DUC2007 حاکی از افزایش چشمگیر دقت در قیاس با روشهای قبلی مبتنی بر LSA و سیستم های موجود در DUC2007می باشد.

کلمات کلیدی:
خلاصه سازی چند سندی،LSA،SRL

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/133775/