ارایه مدلی جهت خوشه بندی جریان صفحات وب برای موتورهای جستجو با استفاده از محیط های توزیع شده

Publish Year: 1393
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 360

This Paper With 5 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

BIGDATA01_015

تاریخ نمایه سازی: 26 مرداد 1397

Abstract:

امروزه وب جهانی مهمترین محیط جهت تولید و نشراطلاعات است. موتورهای جستجو بهترین ابزار برای دسترس ی بهاین اطلاعات میباشند. حجم و تغییرات زیاد از مهمترین ویژگیهای وب میباشد که بازیابی و پردازش اطلاعات را با چالش ها یجدیدیمانند پیچیدگی محاسباتی زیاد مواجه ساخته است.خوشه بندی صفحات از جمله این پردازش هاست که تاث یر قابلقبولی در کیفیت موتورهای جستجو دارد.در این مقاله مدلی جهت خوشه بندی مناسب صفحات وب ارایهشده است. در این مدل مجموعه مناسبی از صفحات وب با استفادهاز الگوریتم FICA خزش شده و در ادامه با استفاده از تکنیک خوشه بندی افزایشی، صفحات در خوشه های مناسب قرار می-گیرند. با توجه به تاثیر عبارات مهم در کیفیت خوشه بندی، ازچهارچوب توزیع شده MapReduce جهت استخراج عبارات مهم استفاده شده است. همچنین در مدل ارایه شده میتوان از محیطتوزیع شده پردازش گراف PowerGraph جهت افزایش کارایی الگوریتم FICA استفاده کرد.

Authors

سعید رحمانی

دانشجوی دکتری، دانشگاه شیراز

محمدهادی صدرالدینی

دانشیار، دانشگاه شیراز