پیمایش موضوعی وب با استفاده از اتوماتای یادگیر توزیع شده و پارتیشن بندی گراف

Publish Year: 1391
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 968

This Paper With 7 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ICS11_167

تاریخ نمایه سازی: 14 مهر 1392

Abstract:

پیمایش وب جهت یافتنی صفحاتی که توسط موتور جستجو شاخص گذاری شوند، از اهمیت بالایی برخوردار است. از آن جا که حجم صفحات وب بسیار بالا و همواره رو به افزایش است، موتورهای جستجو قادر به شاخص گذاری صفحات محدودی هستند. پیمایشگرهای موضوعی با پیمایشگرهای متمرکز، در روند پیمایش خود به صورت انتخاب گر عمل می کنند و صفحاتی را برای پیمایش انتخاب می کنند که تا حد ممکن در ارتباط با موضوعی خاص باشند. در این مقاله روشی ترکیبی مبتنی بر اتوماتای یادگیر توزیع شده و پارتیشن بندی گراف برای پیمایش موضوعی صفحات وب پیشنهاد می گردد. روش پیشنهادی با استفاده از الگوریتم HITSو ساختار پیوند بین صفحات که از طریق رفتار کاربر در مشاهده این صفحات به دست آمده است، صفحاتی را برای پیمایش انتخاب می کند. در این مقاله از پارتیشن بندی گراف وب برای بهبود کارایی استفاده شده است. به منظور ارزیابی، نتایج روش پیشنهادی با نتایج الگوریتم عرض اول، Best Firstو الگوریتمی دیگری مبتنی بر اتوماتای یادگیر توزیع شده مقایسه شده است. نتایج آزمایش ها حاکی از کارایی روش پیشنهادی دارد

Keywords:

پیمایش موضوعی وب , اتوماتای یادگیر توزیع شده , پارتیشن بندی گراف , داده های استفاده از وب , الگوریتم HITS

Authors

مجید تاران

شرکت خدمات انفورماتیک، تهران، ابران

شهرزاد معتمدی مهر

دانشکده فنی و مهندسی، دانشگاه خوارزمی، تهران، ایران

علی برادران هاشمی

دانشکده مهندسی کامپیوتر و فناوری اطلاعات،دانشگاه صنعتی امیرکبیر، تهران، ایران

محمد رضا میبدی

دانشکده مهندسی کامپیوتر و فناوری اطلاعات،دانشگاه صنعتی امیرکبیر، تهران، ایران