CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ترکیب خطی ویژگیهای اسناد وب با استفاده از کمینه کردن گرادیان

عنوان مقاله: ترکیب خطی ویژگیهای اسناد وب با استفاده از کمینه کردن گرادیان
شناسه ملی مقاله: CSICC15_228
منتشر شده در پانزدهمین کنفرانس کامپیوتر سالانه انجمن کامپیوتر ایران در سال 1388
مشخصات نویسندگان مقاله:

علی محمد زارع بیدکی - دانشکده مهندسی برق و کامپیوتر، دانشگاه یزد

خلاصه مقاله:
امروزه به دلیل وجود حجم عظیم اطلاعات در وب و همچنین پویا بودن اطلاعات، مهمترین چالش در بازیابی اطلا عات وب، خصوصاً موتور های جستجو، رتبه بندی نتایج در پاسخ به پرس وجوی کاربرمیباشد. تاکنون الگوریتم های متنوعی که مبتنی بر محتو ا و اتصال می باشند، ارائه شده اند. در روش ارائه شده در این مقاله ما رابطه ی نسبی جفت اسناد و ویژگی هایشان را جهت ترکیب خطی ویژگی های ساختاری و محتوایی استفاده کرده ایم. این روش ۴۴ ویژگی یک صفحه شامل ویژگیهای پیچیده مانند روشهای رتبه بندی BM25 و PageRank و یا ساده مانند تکرار واژه ها و طول سند را به صورت خطی با هم ترکیب می کن د. فرآیند یادگیری جهت ترکیب ویژگیهای مختلف با توجه به کاربران یا نظر افراد خبره در مورد درجه ی ارتباط پرس وجو و سند انجام می شود. روش مینیمم نمودن گرادیان جهت کمینه کردن تابع هزینه و در نهایت پیدا کردن بردار وز ن دار مناسب استفاده شده است . پیاده سازی روش ارائه شده ساده میباشد و با استفاده از داده ی محک LETOR ارزیابی شده است.

کلمات کلیدی:
الگوریتم های رتبه بندی وب ،رتبه بندی ترکیبی، یادگیری جهت رتبه بندی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/79160/