CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

مروری بر تکنیک ها و ابزارهای کاوش محتوای وب

عنوان مقاله: مروری بر تکنیک ها و ابزارهای کاوش محتوای وب
شناسه ملی مقاله: PNUOPEN01_030
منتشر شده در نخستین سمپوزیوم ملی رباتیک و هوش مصنوعی در سال 1393
مشخصات نویسندگان مقاله:

النا بنی نعمه - دانشجوی کارشناسی ارشد مهندسی کامپیوتر نرم افزار، دانشگاه آزاد اسلامی واحد اهواز
محمد مهدی لطفی نژاد - عضو هیات علمی گروه کامپیوتر و فناوری اطلاعات دانشگاه پیام نور، تهران، ایران

خلاصه مقاله:
امروزه شبکه جهانی وب به سرعت در حال رشد است و کاربران را با حجم عظیمی از اطلاعات روبرو کرده است. در حال حاضر،میلیاردها سند HTML، فایل های متنی، فایل های تصویری و چندرسانه ای در وب موجود است و هنوز هم اشکال مختلفی از داده هابه آن اضافه می شود. داده کاوی روشی به منظور استخراج داده های موجود در اینترنت می باشد. وب کاوی بخشی از داده کاوی استکه با حوزه های تحقیقاتی مختلفی مانند بازیابی اطلاعات، سیستم مدیریت پایگاه داده و هوش مصنوعی در ارتباط می باشد. وب کاویبسیاری از روش ها و تکنیک های داده کاوی را به منظور کشف اطلاعات مفید از محتوای وب، تعمیم می دهد. در این مقاله، مفاهیموب کاوی به همراه دسته بندی آن مورد بحث قرار می گیرد. البته این مقاله بیشتر بر کاوش محتوای وب متمرکز است و به توضیح درمورد روش ها و ابزارهای آن می پردازد.

کلمات کلیدی:
وب کاوی، کاوش محتوای وب، تکنیک ها،استخراج اطلاعات، ابزارهای کاوش، داده کاوی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/370367/