CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بررسی روشهای پیش بینی موضوع صفحات وب در خزشگرهای کانونی

عنوان مقاله: بررسی روشهای پیش بینی موضوع صفحات وب در خزشگرهای کانونی
شناسه ملی مقاله: CSITM01_449
منتشر شده در همایش ملی مهندسی رایانه و مدیریت فناوری اطلاعات در سال 1393
مشخصات نویسندگان مقاله:

رامین دلیر - دانشجوی کارشناسی ارشد دانشگاه جامع امام حسین (ع)
محمدرضا حسنی آهنگر - استادیار گروه کامپیوتر دانشگاه جامع امام حسین (ع)

خلاصه مقاله:
در چند سال گذشته، حجم و مقیاس اینترنت به صورت نمایی رشد کرده است و این رشد، دستیابی به اطلاعات مرتبط را روز بهروز مشکل تر نموده است. موتور جستجوها برای ارائه اطلاعات مرتبط با موضوع از خزشگرهای کانونی بهره میبرند. مسئله اصلیدر طراحی خزشگرهای کانونی چگونگی پیش بینی موضوع صفحات وب قبل از واکشی و جلوگیری از مشاهده صفحات غیر مرتبطاست. در این مقاله روشهای خزشگرهای کانونی در پیش بینی موضوع صفحات وب، بطور کامل مورد بررسی قرار می گیرد. سپسبراساس پارامتر ها و تحلیل متن، طبقه بندی خزشگرهای کانونی ارائه میشود. بر اساس این تحقیق، پیشنهادی برای چگونگیتوسعه های آینده در تحقیقات خزشگرهای کانونی ارائه می گردد.

کلمات کلیدی:
طبقه بندی متن، خزشگر، خزشگر کانونی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/282990/