استخراج معنایی رکوردهای داده از صفحات وب توصیف محصول
Publish place: 14th Annual Conference of Computer Society of Iran
Publish Year: 1387
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 2,047
This Paper With 7 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ACCSI14_140
تاریخ نمایه سازی: 26 مهر 1387
Abstract:
با استفاده از سیستم های استخراج اطلاعات می توان پرس و جوهای خود را به جای داده های وب، بر روی اطلاعات ساخت یافته انجام داد. با استفاده از هستان شناسی می توان استخراج اطلاعات را به صورت معنایی انجام داد. در این مقاله به کمک هستان شناسی و با استفاده از معیار آماری واریانس یک روش هوشمند جهت استخراج رکوردهای داده، در صفحات توصیف محصول که نوعی از صفحات وب نیمه ساخت یافته هستند، ارائه شده است. در روش پیشنهادی ابتدا ناحیه اصلی صفحه وب که شامل رکوردهای داده است به کمک هستان شناسی و با استفاده از واریانس تشخیص داده می شود و در مرحله بعد با استفاده از الگوریتم تطبیق برچسب، رکوردهای داده موجود در ناحیه اصلی استخراج می شوند. این روش بر عکس روش های موجود علاوه بر ساختار صفحات وب، محتوای آن ها را نیز درنظر می گیرد و دارای دقت وپوشش بالاتری است.
Keywords:
Authors
امین کشاورزی
عضو هیات علمی دانشگاه آزاد اسلامی
فرزاد پیروی
عضو هیات علمی دانشگاه آزاد اسلامی
امیر مسعود رحمانی
عضو هیات علمی دانشگاه آزاد اسلامی
راضیه کشاورزی
دانشگاه پیام نور