CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

رتبه بندی صفحات وب با استفاده از الگوریتم جستجوی فاخته

عنوان مقاله: رتبه بندی صفحات وب با استفاده از الگوریتم جستجوی فاخته
شناسه ملی مقاله: CRSTCONF02_028
منتشر شده در دومین کنفرانس بین المللی پژوهش در علوم و تکنولوژی در سال 1394
مشخصات نویسندگان مقاله:

جواد پاکسیما - دانشکده فنی و مهندسی، دانشگاه پیام نور یزد، یزد
هما خواجه - دانشکده فنی و مهندسی، دانشگاه علم و هنر، یزد

خلاصه مقاله:
در بازیابی اطلاعات، یک موتور جستجو نیاز به رتبه بندی و بازگرداندن اسناد مرتبط به پرس وجو ارسال شده توسط کاربر دارد. روش رتبه بندی مبتنی بر یاادگیری پیشنهادی RankCS نامیده می شود دراین روش ازالگوریتم جستجوی فاخته برای آموزش تابع رتبه بندی استفاده می شود. روش پیشنهادی به طور مستقیم معیارهای ارزیابی MAP ، P@n و NDCG@n را بهبود می دهد و نیازی به روش های تخمینی برای تابع هزینه نیست.دراین مقاله ترکیبی از سه معیار ارزیابی به عنوان تابع هزینه در نظر گرفته دده است و در تابع هزینه برای رتبه های بالاتر ارزش بیشتری منظور شده است. در طی روند یادگیری برای هر ویژگی وزنی نشان دهنده ی درجه اهمیت آن تعیین میشود و در نهایت با ترکیب خطی از ویژگی ها که شامل ویژگی های وابسته به پرس وجو و مستقل ازپرس و جو است رتبه بندی مناسبی برای پرس وجوهای دیده نشده فراهم می کند روش RankCS بااستفاده ازمجموعه داده استاندارد LETOR2 ارزیابی می شود. نتایج تجربی نشان دهنده ی عملکرد بهتر روش رتبه بندی پیشنهادی نسبت به الگوریتم های رتبه بندی قبلی مانند SwarmRank ، RankSVM ، BM25 ، AdaRank.MAP و AdaRank.NDCG بر روی دو مجموعه داده TD2003 و TD2004 است.

کلمات کلیدی:
الگوریتم جستجوی فاخته، بازیابی اطلاعات، رتبه بندی مبتنی بر یادگیری، موتور جستجو

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/504826/