استخراج اطلاعات از وب سایت های خبری با استفاده از روش مبتنی بر آنتولوژی

ویدا مظاهری; چنگیز دل آرا

استخراج اطلاعات از وب سایت های خبری با استفاده از روش مبتنی بر آنتولوژی

Publish place: The 7th National Conference on Computer Science and Engineering and Information Technology - January 2019

Publish Year: 1398

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 7 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/913308

شناسه ملی سند علمی:

CECCONF07_003

تاریخ نمایه سازی: 24 مرداد 1398

Abstract:

در سال های اخیر با رشد روز افزون داده، منابع اطلاعاتی اهمیت بسزایی برای سازمان ها پیدا کرده است. بنابراین یافتن روش ها و تکنیک هایی برای دستیابی کارا به داده ها، اشتراک داده، استخراج اطلاعات از داده و استفاده از این اطلاعات، مورد توجه دانشمندان و پژوهشگران این حوزه قرار گرفته است. با ایجاد و گسترش وب و افزایش چشمگیر حجم اطلاعات، نیاز به این روش ها و تکنیک ها بیش از پیش احساس می شود. در حال حاضر بیش از دو بیلیون صفحه در وب موجود است و این تعداد با نرخ بالایی در روز در حال افزایش می باشند. با توجه به حجم وسیع اطلاعات در وب، مدیریت آن با ابزارهای سنتی تقریبا غیر ممکن است و ابزارها و روش هایی نو برای مدیریت آن مورد نیاز است . در این مقاله روشی با استفاده از آنتولوژی برای استخراج اطلاعات از وب سایت های خبری فارسی ارائه گردیده است، که متن اصلی صفحات خبری وب مورد نظر کاربر را با دقت بالایی منعکس می نماید.

Keywords:

وب کاوی , خبر فارسی , آنتولوژی

Authors

ویدا مظاهری

گروه مهندسی کامپیوتر، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران، ایران

چنگیز دل آرا

گروه مهندسی کامپیوتر، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران، ایران