استخراج اطلاعات از وب سایت های خبری با استفاده از روش مبتنی بر آنتولوژی
Publish place: The 7th National Conference on Computer Science and Engineering and Information Technology - January 2019
Publish Year: 1398
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 657
This Paper With 7 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CECCONF07_003
تاریخ نمایه سازی: 24 مرداد 1398
Abstract:
در سال های اخیر با رشد روز افزون داده، منابع اطلاعاتی اهمیت بسزایی برای سازمان ها پیدا کرده است. بنابراین یافتن روش ها و تکنیک هایی برای دستیابی کارا به داده ها، اشتراک داده، استخراج اطلاعات از داده و استفاده از این اطلاعات، مورد توجه دانشمندان و پژوهشگران این حوزه قرار گرفته است. با ایجاد و گسترش وب و افزایش چشمگیر حجم اطلاعات، نیاز به این روش ها و تکنیک ها بیش از پیش احساس می شود. در حال حاضر بیش از دو بیلیون صفحه در وب موجود است و این تعداد با نرخ بالایی در روز در حال افزایش می باشند. با توجه به حجم وسیع اطلاعات در وب، مدیریت آن با ابزارهای سنتی تقریبا غیر ممکن است و ابزارها و روش هایی نو برای مدیریت آن مورد نیاز است . در این مقاله روشی با استفاده از آنتولوژی برای استخراج اطلاعات از وب سایت های خبری فارسی ارائه گردیده است، که متن اصلی صفحات خبری وب مورد نظر کاربر را با دقت بالایی منعکس می نماید.
Authors
ویدا مظاهری
گروه مهندسی کامپیوتر، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران، ایران
چنگیز دل آرا
گروه مهندسی کامپیوتر، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران، ایران