CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

کاوشگر وب : مروری بر معماری و الگوریتم های کاوش

عنوان مقاله: کاوشگر وب : مروری بر معماری و الگوریتم های کاوش
شناسه ملی مقاله: CEIC03_076
منتشر شده در سومین همایش ملی مهندسی برق کامپیوتر و فناوری اطلاعات در سال 1389
مشخصات نویسندگان مقاله:

امید جلیلیان - دانشکده فنی مهندسی دانشگاه آزاد اسلامی واحد همدان
حسن ختن لو - دانشگاه بوعلی سینا همدان

خلاصه مقاله:
موتورهای جستجو یکی از رایج ترین راه حلهای به منظور جستجوی اطلاعات در اینترنت هستند دراین مقاله کاوشگر وب به عنوان یک جزء کلیدی درمعماری متمرکز موتورهای جستجو شرح داده می شود کاوشگرهای وب برنامه هایی هستند که با تعقیب ابر پیوندهای موجود در اسناد و صفحات وب با کاوش صفحه به صفحه ساختاری به شکل گراف از وب ایجاد می نمایند تا متعاقبا صفحات واکشی شده توسط موتور جستجو شاخص گذاری شود و نتایج مشابه با درخواست کاربران از طریق موتورهای جستجو در اختیار آنان قرار گیرددر اینجا کاوش وب به دو شکل پایه و متمرکز بیان شده و معماری آنها همراه با الگوریتم های کاوش مورد بررسی قرار می گیرد.

کلمات کلیدی:
بازیابی اطلاعات وب، موتور جستجو، کاوش وب، کاوشگر وب، کاوش وب متمرکز، الگوریتم های کاوش

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/106073/