ترکیب خطی ویژگیهای اسناد وب با استفاده از کمینه کردن گرادیان

Publish Year: 1388
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,125

This Paper With 8 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CSICC15_228

تاریخ نمایه سازی: 26 مهر 1388

Abstract:

امروزه به دلیل وجود حجم عظیم اطلاعات در وب و همچنین پویا بودن اطلاعات، مهمترین چالش در بازیابی اطلا عات وب، خصوصاً موتور های جستجو، رتبه بندی نتایج در پاسخ به پرس وجوی کاربرمیباشد. تاکنون الگوریتم های متنوعی که مبتنی بر محتو ا و اتصال می باشند، ارائه شده اند. در روش ارائه شده در این مقاله ما رابطه ی نسبی جفت اسناد و ویژگی هایشان را جهت ترکیب خطی ویژگی های ساختاری و محتوایی استفاده کرده ایم. این روش ۴۴ ویژگی یک صفحه شامل ویژگیهای پیچیده مانند روشهای رتبه بندی BM25 و PageRank و یا ساده مانند تکرار واژه ها و طول سند را به صورت خطی با هم ترکیب می کن د. فرآیند یادگیری جهت ترکیب ویژگیهای مختلف با توجه به کاربران یا نظر افراد خبره در مورد درجه ی ارتباط پرس وجو و سند انجام می شود. روش مینیمم نمودن گرادیان جهت کمینه کردن تابع هزینه و در نهایت پیدا کردن بردار وز ن دار مناسب استفاده شده است . پیاده سازی روش ارائه شده ساده میباشد و با استفاده از داده ی محک LETOR ارزیابی شده است.

Keywords:

الگوریتم های رتبه بندی وب , رتبه بندی ترکیبی , یادگیری جهت رتبه بندی

Authors

علی محمد زارع بیدکی

دانشکده مهندسی برق و کامپیوتر، دانشگاه یزد