CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بازیابی و رتبه بندی افراد خبره با استفاده از مدل ترجمه مبتنی بر خوشه بندی

عنوان مقاله: بازیابی و رتبه بندی افراد خبره با استفاده از مدل ترجمه مبتنی بر خوشه بندی
شناسه ملی مقاله: JR_TJEE-49-3_012
منتشر شده در در سال 1398
مشخصات نویسندگان مقاله:

مهدی دهقان - دانشکده مهندسی و علوم کامپیوتر - دانشگاه شهید بهشتی
احمدعلی آبین - دانشکده مهندسی و علوم کامپیوتر - دانشگاه شهید بهشتی

خلاصه مقاله:
استخراج دانش از میان داده های موجود در وب باتوجه به حجم و تنوع بالای آن به یک چالش در حوزه ی بازیابی اطلاعات تبدیل شده است. در این میان، مساله ی بازیابی و رتبه بندی افراد خبره با هدف بازیابی و رتبه بندی افراد خبره در زمینه ی موضوع پرس وجوی کاربر، به عنوان یکی از مهم ترین مسائل موجود در این حوزه توجه بسیاری از پژوهشگران را به خود جلب نموده است. مهم ترین چالش در مسئله ی بازیابی افراد خبره تشخیص میزان ارتباط بین کلمات پرس وجو و سند های نوشته شده توسط نامزد های خبرگی است. یک مشکل اساسی در این حوزه فاصله ی واژگانی میان کلمات پرس وجو و سند های نامزد های خبرگی است. در این مقاله دو مدل ترجمه ی جدید برای مدل سازی فاصله ی واژگانی ارائه شده است. مدل اول یک مدل احتمالاتی مبتنی بر خوشه بندی و مدل دوم مبتنی بر مدل سازی موضوعی است. در هر دو مدل، کلمات پرس وجو به مجموعه ای از کلمات مرتبط با پرس وجو که بیشتر نشان دهنده ی یک زمینه ی خبرگی هستند ترجمه شده است. پس از ترجمه ی کلمات، از یک مدل ترکیب کننده به منظور بازیابی استفاده شده است. مدل های ارائه شده بر روی مجموعه ی آزمون Stack Overflow ارزیابی و تحلیل شده است. نتایج به دست آمده بیانگر افزایش میانگین متوسط دقت روش ارائه شده در مقایسه با سایر روش های بازیابی افراد خبره است.

کلمات کلیدی:
بازیابی افراد خبره, مدل ترجمه , خوشه بندی, مدل سازی موضوعی, فاصله ی واژگانی, سیستم های پاسخ به پرسش

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1697306/