سیویلیکا را در شبکه های اجتماعی دنبال نمایید.

اثربخشی بسط پرسوجو مبتنی بر خوشه بندی اسناد شبه بازخورد با الگوریتم K-NN

Publish Year: 1395
Type: Journal paper
Language: Persian
View: 457

This Paper With 9 Page And PDF Format Ready To Download

Export:

Link to this Paper:

Document National Code:

JR_TJEE-46-1_010

Index date: 1 July 2017

اثربخشی بسط پرسوجو مبتنی بر خوشه بندی اسناد شبه بازخورد با الگوریتم K-NN abstract

بسط پرسوجو یکی از روشهای موثر در بهبود اثربخشی نتایج بازیابی اطلاعات است. روش بازخورد شبه مرتبط (PRF) فرض می کند کهاسناد رتبه بالا از نتایج اولیه بازیابی شده مرتبط به پرسوجو است و تعدادی کلمه مرتبط را از اسناد رتبه بالا برای بسط انتخاب می کند. وجود اسنادنامرتبط در بین اسناد رتبه بالا محققان را به ارایه روش هایی برای انتخاب بهترین اسناد به عنوان منبع برای انتخاب کلمه بسط سوق می دهد کهانتخاب بهترین اسناد برای استخراج کلمات مرتبط برای بسط، موضوع مهمی در روشهای بسط پرسوجو هست. در این مقاله، از خوشه بندی اسنادشبه بازخورد (CPRF) حاصل از نتایج اولیه، بر اساس شباهت مبتنی بر کلمه برای قرار دادن شبیه ترین اسناد کنار هم استفاده می شود. تعدادی از خوشهها طبق محتوایشان به عنوان خوشه های بازخورد انتخاب می شوند و از خوشه های بازخورد، اسناد رتبه بالا به عنوان اسناد بازخورد انتخابمی شوند. سپس، یک سند ترکیبی از روی اسناد انتخابی تشکیل می شود و کلمات سند ترکیبی بر اساس تابع رتبه بندی TF-IDFمرتب می شوند. بعد، کلمات رتبه بالا برای بسط انتخاب می شوند. آزمایش های انجام گرفته روی مجموعه داده پزشکی MED نشان می دهد روش پیشنهادی معیار متوسط میانگین دقت (MAP) بالاتری نسبت به روش بازخورد شبه مرتبط (PRF) دارد.

اثربخشی بسط پرسوجو مبتنی بر خوشه بندی اسناد شبه بازخورد با الگوریتم K-NN Keywords:

اثربخشی بسط پرسوجو مبتنی بر خوشه بندی اسناد شبه بازخورد با الگوریتم K-NN authors

رضا خدایی

دانشجوی کارشناسی ارشد، دانشکده مهندسی برق و کامپیوتر - دانشگاه تبریز - تبریز - ایران

محمدعلی بالافر

استادیار، دانشکده مهندسی برق و کامپیوتر - دانشگاه تبریز - تبریز - ایران

سیدناصر رضوی

استادیار، دانشکده مهندسی برق و کامپیوتر - دانشگاه تبریز - تبریز - ایران