ترکیب خطی ویژگیهای اسناد وب با استفاده از کمینه کردن گرادیان
Publish place: 15th Annual Conference of Computer Society of Iran
Publish Year: 1388
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,125
This Paper With 8 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CSICC15_228
تاریخ نمایه سازی: 26 مهر 1388
Abstract:
امروزه به دلیل وجود حجم عظیم اطلاعات در وب و همچنین پویا بودن اطلاعات، مهمترین چالش در بازیابی اطلا عات وب، خصوصاً موتور های جستجو، رتبه بندی نتایج در پاسخ به پرس وجوی کاربرمیباشد. تاکنون الگوریتم های متنوعی که مبتنی بر محتو ا و اتصال می باشند، ارائه شده اند. در روش ارائه شده در این مقاله ما رابطه ی نسبی جفت اسناد و ویژگی هایشان را جهت ترکیب خطی ویژگی های ساختاری و محتوایی استفاده کرده ایم. این روش ۴۴ ویژگی یک صفحه شامل ویژگیهای پیچیده مانند روشهای رتبه بندی BM25 و PageRank و یا ساده مانند تکرار واژه ها و طول سند را به صورت خطی با هم ترکیب می کن د. فرآیند یادگیری جهت ترکیب ویژگیهای مختلف با توجه به کاربران یا نظر افراد خبره در مورد درجه ی ارتباط پرس وجو و سند انجام می شود. روش مینیمم نمودن گرادیان جهت کمینه کردن تابع هزینه و در نهایت پیدا کردن بردار وز ن دار مناسب استفاده شده است . پیاده سازی روش ارائه شده ساده میباشد و با استفاده از داده ی محک LETOR ارزیابی شده است.
Keywords:
Authors
علی محمد زارع بیدکی
دانشکده مهندسی برق و کامپیوتر، دانشگاه یزد