A Focused Crawler Based on Topic Mining Approach
Publish place: 3rd International Conference on Applied Research in Computer Engineering and Information Technology
Publish Year: 1394
نوع سند: مقاله کنفرانسی
زبان: English
View: 590
This Paper With 5 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CITCONF03_263
تاریخ نمایه سازی: 12 تیر 1395
Abstract:
A focused crawler is a crawler that returns relevant pages related to a specific topic. This kind of crawler hasadvantages over a general crawler because of low cost and efficiency. In this paper, we present and implement asimple, focused crawler that works based on topic mining approach. This focused crawler, starts from specific seeds,calculates the similarity of each page with a specific page that we have given as our initial topic. With thesecalculations that are based on vectors dot products, we sort all of the pages based on this score, and therefore at theend we have a set of relevant pages to the specific page.
Keywords:
Authors
Alireza Asgharian
Computer Department of Isfahan University
Amir Savari
Computer Department of Isfahan University
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :