CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

سیستم خلاصه ساز خودکار متن های فارسی

عنوان مقاله: سیستم خلاصه ساز خودکار متن های فارسی
شناسه ملی مقاله: ACCSI14_082
منتشر شده در چهاردهمین کنفرانس سالانه انجمن کامپیوتر ایران در سال 1387
مشخصات نویسندگان مقاله:

مجید بهره پور - گروه تحقیقاتی سیستم های فراگیرنده، دانشگاه Twente هلند
الهام مهدی پور - کامپیوتر موسسه آموزش عالی خاوران مشهد
آزاده کامل - دانشگاه آزاد اسلامی واحد مشهد
ملیجه امیری - موسسه آموزش عالی خاوران مشهد

خلاصه مقاله:
امروزه با رشد سریع اطلاعات و داده ها، یافتن اطلاعات مناسب و کارا از اهمیت خاصی برخوردار است. هدف خلاصه سازی خودکار متن، فراهم کردن خلاصه ای از محتویات مطابق با اطلاعات مورد نیاز کاربر است. در این مقاله، نگارندگان ابتدا مفاهیم خلاصه سازی و انواع آن، سپس سیستم های خلاصه ساز موجود، و در نهایت روش خلاصه سازی خودکار متنهای فارسی پیشنهادی را بررسی نموده اند. روش پیشنهادی، ترکیبی از روشهای مبتنی بر گراف ،‌TF-IDF و الگوریتم ژنتیک (Genetic Algorithm) است. در این روش کلمات قبل از امتیازدهی جملات، ریشه یابی می شوند. پس از امتیازدهی، جملات خلاصه با استفاده از الگوریتم ژنتیک (GA )‌انتخاب می شوند. تابع برازندگی الگوریتم ژنتیک مبتنی بر سه فاکتور شباهت با عنوان، قابلیت خوانایی و پیوستگی است. ارزیابی خلاصه های حاصل از پیاده سازی سیستم پیشنهادی در انتهای مقاله آورده شده است.

کلمات کلیدی:
الگوریتم ژنتیک، تابع برازندگی، خلاصه سازی، TF-IDF ،Genetic Algorithm

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/60830/