ارائه الگوریتمی جدید برای یادگیری قواعد استخراج اطلاعات از متن
Publish Year: 1395
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 856
This Paper With 14 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
MCCONF02_058
تاریخ نمایه سازی: 26 شهریور 1395
Abstract:
با رشد سریع حجم متون قابل دسترس به خصوص در شبکه ی جهانی اینترنت، کار استخراج اطلاعات از متن اهمیتروز افزون یافته است . عملیات اصلی سیستم های استخراج اطلاعات از دو مرحله ساخت پایگاه دانش مورد نیاز برای استتخراجاطلاعات و استفاده از پایگاه دانش برای استخراج اطلاعات از متون ورودی تشکیل شده است . در این مقاله برای تولید خودکارپایگاه دانش مورد نیاز الگوریتمی ارائه شده است که می تواند قواعد لازم برای استخراج اطلاعات از متون نیمه ساختارمند (مانندصفحات) وب طول یک فرآیند یادگیری بانظارت تولید کند . در این الگوریتم که یک الگوریتم استقرای قاعده است، از یکقاعده عمومی شروع می شود و بر اساس ورودی و خروجی هایی که درمثال های آموزشی وجود دارد و نیز معیارهای ارزیابیقواعد، آن قاعده و ATP اختصاصی تر و دقیق تر می شود . تعریف معیارهای جدید برای مقایسته و ارزیابی قواعد استخراجاطلاعات، تعریف AATP پس پردازش نهایی برای بهتر کردن قاعده و استفاده از یادگیری به روش تعاملی با کاربر برایبدست آوردن نتیجه بهتر از دیگر موارد طراحی شده در این الگوریتم است . هر قاعده استخراج اطلاعات به صورت الگویی استکه باید در متن جستجو شود و در صورت تطبیق با قسمتی از متن، اطلاعات مورد نیاز بر اساس پارامترهای تعریف شده در الگواستخراج یابد . برای ارزیابی این الگوریتم، نتایج به دست آمده بر یکی از سیستم های روی مثال های آزمایشی با نتایج سیستمWHISK (یکی از سیستم های موفق در استخراج اطلاعات) مقایسه شده است که بهبود قابل توجهی را درهر دو معیارRecall و Precision نشان می دهد.
Keywords:
استخراج اطلاعات از متن , متن کاوی , وب کاوی , یادگیری قواعد , استقرای قاعده , سیستم های استخراج اطلاعات از متن
Authors
فاطمه حیدری کیا
دانشجوی کارشناسی ارشد نرم افزار دانشگاه آزاد اسلامی قزوین
مریم حیدری کیا
دکتری مدیریت دولتی منابع انسانی
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :