مروری بر سیستم های استخراج اطلاعات و روش های استخراج رابطه

Publish Year: 1397
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 570

This Paper With 11 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

NCAEC04_093

تاریخ نمایه سازی: 29 اردیبهشت 1398

Abstract:

داده های غیرساخت یافته، که اکثرا به شکل داده های متنی هستند، حدود 80 درصد از اطلاعات دیجیتالی موجود را تشکیل می دهند. اما یافتن، دسترسی، تحلیل یا استفاده از این داده های غیرساخت یافته به راحتی امکان پذیر نیست. بنابراین به ابزارها و روش هایی نیازمند هستیم که اطلاعات را پیدا کرده و آنها را به پایگاه های دانشی تبدیل کند که قابل استفاده توسط الگوریتم ها باشد. در این نوشتار، ابتدا به معرفی سیستم های استخراج اطلاعات می پردازیم و معماری و اجزای مختلف سیستم های استخراج اطلاعات و همچنین task های اصلی سیستم های استخراج اطلاعات شامل تشخیص موجودیت های نام دار، تشخیص اشاره های مختلف به موجودیت های نام دار، استخراج رابطه و استخراج رخدادها را معرفی می کنیم. و در ادامه روش های مختلف استخراج رابطه ( که یکی از Task های مهم استخراج اطلاعات است )، از جمله، روش های استخراج رابطه بوسیله ی الگوهای نوشته شده با دست، روش های با ناظر برای استخراج رابطه، روش های Bootstrapping و مبتنی بر یادگیری الگو و روش های نظارت از راه دور برای استخراج رابطه، را معرفی می کنیم. در نهایت با توجه به محدودیت هایی که در روش های استخراج اطلاعات کلاسیک وجود دارند به معرفی روش های استخراج اطلاعات باز می پردازیم که با کمترین پیش فرض ها تنها مجموعه ای از اسناد ورودی را به عنوان ورودی می پذیرند و تمام روابط موجود در این اسناد غیرساخت یافته را استخراج می کنند.

Authors

افشین شهرکی

عضو هییت علمی، گروه فناوری اطلاعات، دانشگاه غیرانتفاعی و غیردولتی هاتف، زاهدان

میثم محمودی

دانشجوی کارشناسی ارشد، دانشگاه غیرانتفاعی و غیردولتی هاتف، زاهدان