اثربخشی بسط پرسوجو مبتنی بر خوشه بندی اسناد شبه بازخورد با الگوریتم K-NN

Publish Year: 1395
نوع سند: مقاله ژورنالی
زبان: Persian
View: 370

This Paper With 9 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

JR_TJEE-46-1_010

تاریخ نمایه سازی: 10 تیر 1396

Abstract:

بسط پرسوجو یکی از روشهای موثر در بهبود اثربخشی نتایج بازیابی اطلاعات است. روش بازخورد شبه مرتبط (PRF) فرض می کند کهاسناد رتبه بالا از نتایج اولیه بازیابی شده مرتبط به پرسوجو است و تعدادی کلمه مرتبط را از اسناد رتبه بالا برای بسط انتخاب می کند. وجود اسنادنامرتبط در بین اسناد رتبه بالا محققان را به ارایه روش هایی برای انتخاب بهترین اسناد به عنوان منبع برای انتخاب کلمه بسط سوق می دهد کهانتخاب بهترین اسناد برای استخراج کلمات مرتبط برای بسط، موضوع مهمی در روشهای بسط پرسوجو هست. در این مقاله، از خوشه بندی اسنادشبه بازخورد (CPRF) حاصل از نتایج اولیه، بر اساس شباهت مبتنی بر کلمه برای قرار دادن شبیه ترین اسناد کنار هم استفاده می شود. تعدادی از خوشهها طبق محتوایشان به عنوان خوشه های بازخورد انتخاب می شوند و از خوشه های بازخورد، اسناد رتبه بالا به عنوان اسناد بازخورد انتخابمی شوند. سپس، یک سند ترکیبی از روی اسناد انتخابی تشکیل می شود و کلمات سند ترکیبی بر اساس تابع رتبه بندی TF-IDFمرتب می شوند. بعد، کلمات رتبه بالا برای بسط انتخاب می شوند. آزمایش های انجام گرفته روی مجموعه داده پزشکی MED نشان می دهد روش پیشنهادی معیار متوسط میانگین دقت (MAP) بالاتری نسبت به روش بازخورد شبه مرتبط (PRF) دارد.

Authors

رضا خدایی

دانشجوی کارشناسی ارشد، دانشکده مهندسی برق و کامپیوتر - دانشگاه تبریز - تبریز - ایران

محمدعلی بالافر

استادیار، دانشکده مهندسی برق و کامپیوتر - دانشگاه تبریز - تبریز - ایران

سیدناصر رضوی

استادیار، دانشکده مهندسی برق و کامپیوتر - دانشگاه تبریز - تبریز - ایران