استخراج اطلاعات: روش ها و کاربردها

Publish Year: 1395
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 2,748

This Paper With 7 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

IIIRC01_002

تاریخ نمایه سازی: 6 اردیبهشت 1396

Abstract:

استخراج اطلاعات اشاره به استخراج خودکار اطلاعات ساختار یافته همچون موجودیت ها، روابط بین موجودیت ها، و موجودیت های توصیف ویژگی از منابع غیرساختاریافته دارد. این امر قالب های پرس و جو برای منابع غیر ساختاریافته را نسبت به جستجوهای کلید واژه های مجرد، بسیار غنی تر می سازد. هنگامی که داده های ساختاریافته و غیرساختاریافته با هم موجود هستند، استخراج اطلاعات، یکپارچه سازی این دو نوع منبع و اعمال جستجو بین آنها را امکان پذیر می سازد. استخراج خودکار اطلاعات از منابع غیر ساختار یافته راه های جدیدی را برای جستجو، سازمان دهی و تجزیه و تحلیل دادهها با بهره گیری از علم معناشناسی از پایگاه دادههای ساختار یافته و داده های غیرساختاریافته گشوده است. امروزه، تمایل زیادی به تبدیل دسکتاپ شخصی به پایگاه داده های ساختاریافته، تبدیل دانش انتشارات علمی به پیشینه های ساختاریافته، و مهار اینترنت برای پرس و جوهای کشف حقایق ساختاریافته وجود دارد. در نتیجه، جوامع مختلف زیادی از پژوهشگران وجود دارند که درصدد استفاده از فنون یادگیری ماشین، بازیابی اطلاعات، و زبان شناسی رایانشی برای جنبه های مختلف مشکل استخراج اطلاعات هستند. استخراج اطلاعات شامل دو نوع استخراج هدفمند اطلاعات و استخراج آزاد اطلاعات است. استخراج هدفمند اطلاعات نوع خاصی از اطلاعات را که احتمالا به شکل واضحی در متن بیان شده اند، برای اهداف مشخصی استخراج می کند. سه روش عمده برای استخراج هدفمند اطلاعات عبارتند از: استخراج اطلاعات مبتنی بر قاعده، مدل های گرافی و تعریف تابع هسته در استخراج آزاد اطلاعات با تعدادی نمونه آغازین مربوط به هر رابطه و بدون هیچ داده ای برای آموزش، اطلاعات را استخراج می کنند. در استخراج آزاد اطلاعات از سامانه های بی ناظر، نیمه نظارتی و خود ناظر استفاده می شود. کاربردهای استخراج هدفمند اطلاعات را در چهار گروه کاربردهای تجاری (شامل پیگیری اخبار، مراقبت از مشتری، تمایز داده ها و تبلیغات طبقه بندی شده)، کاربردهای شخصی، کاربردهای علمی، و کاربردهای مبتنی بر وب (شامل پایگاه های استنادی، پایگاه داده های نظریه ای، وب سایت های اجتماع ها، خرید مقایسه ای، گنجاندن تبلیغ در صفحات وب، و جستجوهای وب ساختار یافته) دسته بندی می شود. کاربردهای استخراج آزاد اطلاعات شامل استخراج دانش و استنتاج از متن زبان طبیعی است. چالش های استخراج ازاد اطلاعات نیز شامل عدم دخالت انسان، ناهمگونی در پیکره، و کارایی است. در مقاله حاضر هریک از موارد گفته شده به تفصیل معرفی و بحث شده اند.

Authors

داود حاصلی

دانشجوی دکترای علم اطلاعات و دانش شناسی دانشگاه تهران

ملوک السادات حسینی بهشتی

استادیار پژوهشگاه علوم و فناوری اطلاعات ایران

سمیه پاک نهاد

دانشجوی دکترای علم اطلاعات و دانش شناسی دانشگاه شیراز

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • نویان، ع.. (199)، استخراج آزاد اطلاعات" پایان‌نامه کارشناسی ارشد، دانشگاه ...
  • _ ا"تشابه یابی متون با توصیف رابطه‌ای". پایان‌نامه کارشناسی ارشد، ...
  • ایمانی، م. 1929)، _ و ارزیابی اطلاعات استخراج شده از ...
  • Sarawagi, S. (2008), :Information extraction", Foundations and trends in databases, ...
  • Suchanek, F. M., Kasneci, _ & Weikum, G. (2008), :Yago: ...
  • Peng, F.. & McCallum, A. (2006) , "Information extraction from ...
  • Collins, M., & Duffy, N. (200 _), :Convolution kernels for ...
  • Zelenko, D., Aone, C.. & Richardella, A. (2003), :Kernel methods ...
  • Shinyama, Y., & Sekine, S. (2006, June) , :Preemptive information ...
  • S choenmackers, S., Etzioni, O., & Weld, D. S. (2008, ...
  • Hoffart, J., Suchanek, F. M., Berberich, K., & Weikum, G. ...
  • Banko, M., Cafarella, M. J., Soderland, S., Broadhead, _ & ...
  • Agichtein, E.. & Gravano, L. (2000, June). Snowball: Extracting relations ...
  • نمایش کامل مراجع