محاسبه شباهت جملات با استفاده از کاهش آنها وWordNet

Publish Year: 1396
نوع سند: مقاله ژورنالی
زبان: Persian
View: 534

This Paper With 12 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

JR_ARTE-2-7_006

تاریخ نمایه سازی: 27 مرداد 1397

Abstract:

خلاصه سازی متن، متن کوتاه تری را از متن اصلی ایجاد می کند در حالیکه اطلاعات و معنای کلی حفظ می شوداخیرا نیاز به خلاصه سازی خودکار متن با توجه به رشد سریع اطلاعات اینترنت افزایش یافته است. خلاصه سازی خودکار متن، یک روش کاربردی است زیرا باعث کاهش حجم و افزایش سرعت دسترسی میشود. جهت ایجاد خلاصه برای یک سند و یا چند سند، دو روش وجود دارد: مستخرج و چکیده ای (1). روش خلاصه سازی استخراجی شامل انتخاب جملات مهم و یا پاراگراف و الحاق آنها به متن های کوتاه تر است. اما خلاصه سازی چکیده ای، شامل درک متن اصلی و دوباره فرموله کردن آن در متن کوتاه تر است. در این مقاله ابتدا به بررسی کوتاهسازی ومفاهیم خلاصه سازی پرداخته، سپس به بررسی عملکرد الگوریتم های Rank کننده جملات در خلاصه سازی متن میپردازیم. در این روش با به کارگیری نرم افزارWordNet نشان می دهیم که کیفیت خلاصه های رتبه بندی شده بهبود یافته است. ما سیستم خود را بر روی مجموعه داده DUC2007 بررسی نمودیم و برای ارزیابی نیز از معیار ROUGE استفاده شده است .نتایج آزمایش ها نشان می دهد که سیستم پیشنهادی در معیار ارزیابی ROUGE_2 و بر روی داده های DUC2007 حداقل به میزان 3. 4 درصد و در معیار ROUGE_SU4 حداقل به میزان 2. 74 درصد بهبود داشته است. همچنین با بررسی و ارزیابی نتایج ROUGE اینگونه استنباط میشود که سیستم پیشنهادی قابلیت مقایسه با سیستمهای شرکت کننده در DUC2007 را دارد. در مدل پیشنهادی قصد داریم ابتدا یک روش برای کاهش جملات ارایه کنیم .سپس از راهکار کاهش جمله برای تعیین میزان شباهت بین جملات پردازش شده استفاده کنیم. هدف از انجام این مقاله بهبود دقت در تشخیص شباهت بین جملات متن می باشد

Keywords:

کاهش جمله , خلاصه سازی مبتنی بر کاربر , خلاصه سازی چند سندی , WordNet

Authors

کوثر دوست محمدی

کارشناس ارشد، گروه مهندسی کامپیوتر، دانشگاه آزاد اسلامی، واحد ایلام، ایران

هدی علی نژادی

کارشناس ارشد، گروه مهندسی کامپیوتر، دانشگاه آزاد اسلامی، واحد ایلام، ایران

محمدرضا ولیزاده

گروه مهندسی کامپیوتر، هیات علمی دانشگاه ایلام، ایران