CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بسط پرس وجو با خوشه بندی اسناد شبه بازخورد با شباهت حساس به پرس وجو

عنوان مقاله: بسط پرس وجو با خوشه بندی اسناد شبه بازخورد با شباهت حساس به پرس وجو
شناسه ملی مقاله: JR_JME-14-47_018
منتشر شده در شماره 47 دوره 14 فصل زمستان در سال 1395
مشخصات نویسندگان مقاله:

رضا خدایی - کارشناس ارشد مهندسی کامپیوتر (نرم افزار)، دانشگاه تبریز
محمدعلی بالافر - استادیار، دانشکده برق و کامپیوتر، دانشگاه تبریز
سیدناصر رضوی - استادیار، دانشکده برق و کامپیوتر، دانشگاه تبریز

خلاصه مقاله:
بسط پرس و جو به عنوان یکی از روشهای انطباق پرس وجو، اثربخشی جستجو را در بازیابی اطلاعات افزایش می دهد. بازخورد شبه مرتبط (PRF) روشی برای بسط پرس و جو است که فرض می کند اسناد رتبه بالا از نتایج اولیه مرتبط به موضوع پرس و جو هستند و کلمات بسط را از این اسناد انتخاب می کند. در حالی که ممکن است اسناد نامرتبط به پرس و جو در اسناد رتبه بالا وجود داشته باشد. روش هایی برای انتخاب اسناد مرتبط و نادیده گرفتن اسناد خطا از اسناد رتبه بالا ارایه شده است که از خوشه بندی و یا طبقه بندی اسناد استفاده کرده اند. مهم ترین موضوع در بسط پرس وجو، انتخاب کلمات بسط از مرتبط ترین استاد است. در این مقاله ما خوشه بندی اسناد شبه بازخورد را براساس شباهت حساس به پرس وجو ارایه می کنیم که در قرار دادن شبیه ترین اسناد در کنار هم موثر است. شباهت حساس به پرس وجو که نسبت به شباهت مبتنی بر کلمه نتایج بهتری را در بازیابی اسناد بدست آورده است، دلیل استفاده در این مقاله است. خوشه ها را مطابق با شباهت درونی شان رتبه بندی کرده و تعدادی از خوشه های رتبه بالا را برای بسط انتخاب می کنیم. کلمات بسط را از اسناد خوشه های انتخاب شده، براساس تابع رتبه بندیTF- IDF استخراج می کنیم. آزمایش های انجام شده روی مجموعه داده ی پزشکی MED نشان میدهد که نتایج جستجو برای پرس و جوهای بسط داده شده با اسناد انتخاب شده از خوشه ها، نسبت به روش بازخورد شبه مرتبط (PRF) و بازیابی اولیه (VSM) بهتر است و اثربخشی جستجو را افزایش میدهد.

کلمات کلیدی:
بازیابی اطلاعات، بسط پرس و جو، شباهت حساس به پرس وجو، بازخورد شبه مرتبط

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/795478/