ارایه ی الگوریتمی به منظور خوشه بندی صفحات وب براساس محتوا و لینک

Publish Year: 1396
نوع سند: مقاله ژورنالی
زبان: Persian
View: 470

This Paper With 8 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

JR_SJIE-33-1_016

تاریخ نمایه سازی: 1 مرداد 1397

Abstract:

وجود یک موتور جست و جوی کارا می تواند سبب افزایش رضایت کاربران از خدمات تحت وب باشد. چالش اصلی موتورهای جست وجو، انتخاب مناسب ترین صفحات در مواجهه با پرسش های چند وجهی کاربران است. خوشه بندی صفحات براساس محتوا و لینک رویکردی است که برای حل چنین مسایلی در ادبیات پیشنهاد شده است. در این نوشتار، بر یکی از الگوریتم های موجود، به نام CohsMix، تمرکز شده و این الگوریتم برای ارتقای کیفیت پاسخ ها و افزایش سرعت حل بهبود داده شده است. تعیین نقطه ی شروع مناسب، استفاده از خواص شبکه های پیچیده به منظور ساده سازی محاسبات، و محاسبه ی مقدار واقعی انحراف استاندارد از جمله تغییرات پیشنهادی برای بهبود الگوریتم است. نتایج تجربی نشان می دهد که الگوریتم بهبود یافته، کیفیت جواب ها را ارتقا داده و باعث افزایش سرعت حل می شود. همچنین، به عنوان مطالعه ی موردی، داده های مربوط به وبلاگ های فارسی استخراج و الگوریتم بهبود یافته روی این داده ها اجرا خواهد شد.

Authors

محمد فتحیان

استاد، دانشکده ی مهندسی صنایع، دانشگاه علم و صنعت ایران

امیرمحسن کریمی مجد

دانشجوی دکتری، دانشکده ی مهندسی صنایع، دانشگاه علم و صنعت ایران