الگوریتم جدید خزنده های وب برای بهبود نتایج جستجو
Publish Year: 1393
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,161
This Paper With 9 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CSITM01_290
تاریخ نمایه سازی: 10 شهریور 1393
Abstract:
خزش فرآیندی ست که اطلاعات را از وب جمع آوری و اندیس گذاری می کند تا بعدا توسط موتورهای جست و جو به عنوان منبعداده استفاده شوند. هدف فرآیند خزش این است که تا حد امکان، مفیدترین و مرتبطترین صفحات را با سرعت بالا و به صورتبهینه جمع آوری کند. با افزایش حجم اطلاعات در وب، اهمیت دسترسی به این اطلاعات هم بسیار افزایش پیدا کرده است. داشتنیک خزنده ی قوی، یعنی داشتن یک موتور جست و جوی قوی. سرعت بالای به روز رسانی اطلاعات و محدودیت منابعی نظیرزمان و حافظه باعث شده است تا تنها 8 تا 12 درصد از حجم عظیم صفحات وب توسط خزنده ها در مخزن محلی ذخیره شوند.عملیات خزش همیشه در عمق محدودی متوقف می شود، دلیل آن هم بسیار واضح است: محدودیت منابع. پس یک الگوریتمخوب باید پیش از اینکه به محدودیت منابع برخورد کند، بیشترین و مرتبط ترین صفحات را پیدا کند. در نتیجه پس از توقففرآیند خزش می توان مطمئن بود که بهترین مخزن محلی را در اختیار داریم. در این متن الگوریتمی بهینه با اهداف مذکورطراحی شده است که در ادامه به آن می پردازیم.
Keywords:
Authors
اسماء قیصری گودرزی
دانشجوی کارشناسی ارشد دانشگاه پیام نور
مهدی جوانمرد
استادیار دانشگاه پیام نور
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :