CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

اثربخشی بسط پرسوجو مبتنی بر خوشه بندی اسناد شبه بازخورد با الگوریتم K-NN

عنوان مقاله: اثربخشی بسط پرسوجو مبتنی بر خوشه بندی اسناد شبه بازخورد با الگوریتم K-NN
شناسه ملی مقاله: JR_TJEE-46-1_010
منتشر شده در شماره 1 دوره 46 فصل بهار در سال 1395
مشخصات نویسندگان مقاله:

رضا خدایی - دانشجوی کارشناسی ارشد، دانشکده مهندسی برق و کامپیوتر - دانشگاه تبریز - تبریز - ایران
محمدعلی بالافر - استادیار، دانشکده مهندسی برق و کامپیوتر - دانشگاه تبریز - تبریز - ایران
سیدناصر رضوی - استادیار، دانشکده مهندسی برق و کامپیوتر - دانشگاه تبریز - تبریز - ایران

خلاصه مقاله:
بسط پرسوجو یکی از روشهای موثر در بهبود اثربخشی نتایج بازیابی اطلاعات است. روش بازخورد شبه مرتبط (PRF) فرض می کند کهاسناد رتبه بالا از نتایج اولیه بازیابی شده مرتبط به پرسوجو است و تعدادی کلمه مرتبط را از اسناد رتبه بالا برای بسط انتخاب می کند. وجود اسنادنامرتبط در بین اسناد رتبه بالا محققان را به ارایه روش هایی برای انتخاب بهترین اسناد به عنوان منبع برای انتخاب کلمه بسط سوق می دهد کهانتخاب بهترین اسناد برای استخراج کلمات مرتبط برای بسط، موضوع مهمی در روشهای بسط پرسوجو هست. در این مقاله، از خوشه بندی اسنادشبه بازخورد (CPRF) حاصل از نتایج اولیه، بر اساس شباهت مبتنی بر کلمه برای قرار دادن شبیه ترین اسناد کنار هم استفاده می شود. تعدادی از خوشهها طبق محتوایشان به عنوان خوشه های بازخورد انتخاب می شوند و از خوشه های بازخورد، اسناد رتبه بالا به عنوان اسناد بازخورد انتخابمی شوند. سپس، یک سند ترکیبی از روی اسناد انتخابی تشکیل می شود و کلمات سند ترکیبی بر اساس تابع رتبه بندی TF-IDFمرتب می شوند. بعد، کلمات رتبه بالا برای بسط انتخاب می شوند. آزمایش های انجام گرفته روی مجموعه داده پزشکی MED نشان می دهد روش پیشنهادی معیار متوسط میانگین دقت (MAP) بالاتری نسبت به روش بازخورد شبه مرتبط (PRF) دارد.

کلمات کلیدی:
بازیابی اطلاعات، بسط پرسوجو، بازخورد شبه مرتبط، کلمات بسط، اسناد بازخورد

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/601033/