استخراج اطلاعات از وب سایت های خبری با استفاده از روش مبتنی بر آنتولوژی

Publish Year: 1398
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 657

This Paper With 7 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CECCONF07_003

تاریخ نمایه سازی: 24 مرداد 1398

Abstract:

در سال های اخیر با رشد روز افزون داده، منابع اطلاعاتی اهمیت بسزایی برای سازمان ها پیدا کرده است. بنابراین یافتن روش ها و تکنیک هایی برای دستیابی کارا به داده ها، اشتراک داده، استخراج اطلاعات از داده و استفاده از این اطلاعات، مورد توجه دانشمندان و پژوهشگران این حوزه قرار گرفته است. با ایجاد و گسترش وب و افزایش چشمگیر حجم اطلاعات، نیاز به این روش ها و تکنیک ها بیش از پیش احساس می شود. در حال حاضر بیش از دو بیلیون صفحه در وب موجود است و این تعداد با نرخ بالایی در روز در حال افزایش می باشند. با توجه به حجم وسیع اطلاعات در وب، مدیریت آن با ابزارهای سنتی تقریبا غیر ممکن است و ابزارها و روش هایی نو برای مدیریت آن مورد نیاز است . در این مقاله روشی با استفاده از آنتولوژی برای استخراج اطلاعات از وب سایت های خبری فارسی ارائه گردیده است، که متن اصلی صفحات خبری وب مورد نظر کاربر را با دقت بالایی منعکس می نماید.

Authors

ویدا مظاهری

گروه مهندسی کامپیوتر، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران، ایران

چنگیز دل آرا

گروه مهندسی کامپیوتر، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران، ایران