استخراج معنایی رکوردهای داده از صفحات وب توصیف محصول

Publish Year: 1387
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 2,047

This Paper With 7 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ACCSI14_140

تاریخ نمایه سازی: 26 مهر 1387

Abstract:

با استفاده از سیستم های استخراج اطلاعات می توان پرس و جوهای خود را به جای داده های وب، بر روی اطلاعات ساخت یافته انجام داد. با استفاده از هستان شناسی می توان استخراج اطلاعات را به صورت معنایی انجام داد. در این مقاله به کمک هستان شناسی و با استفاده از معیار آماری واریانس یک روش هوشمند جهت استخراج رکوردهای داده، در صفحات توصیف محصول که نوعی از صفحات وب نیمه ساخت یافته هستند، ارائه شده است. در روش پیشنهادی ابتدا ناحیه اصلی صفحه وب که شامل رکوردهای داده است به کمک هستان شناسی و با استفاده از واریانس تشخیص داده می شود و در مرحله بعد با استفاده از الگوریتم تطبیق برچسب، رکوردهای داده موجود در ناحیه اصلی استخراج می شوند. این روش بر عکس روش های موجود علاوه بر ساختار صفحات وب، محتوای آن ها را نیز درنظر می گیرد و دارای دقت وپوشش بالاتری است.

Authors

امین کشاورزی

عضو هیات علمی دانشگاه آزاد اسلامی

فرزاد پیروی

عضو هیات علمی دانشگاه آزاد اسلامی

امیر مسعود رحمانی

عضو هیات علمی دانشگاه آزاد اسلامی

راضیه کشاورزی

دانشگاه پیام نور