ارائه الگوریتمی جدید برای یادگیری قواعد استخراج اطلاعات از متن

مجتبی شکری; احمد عبداله زاده

ارائه الگوریتمی جدید برای یادگیری قواعد استخراج اطلاعات از متن

Publish place: 15th Annual Conference of Computer Society of Iran

Publish Year: 1388

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 8 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > متن کاوی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/79199

شناسه ملی سند علمی:

CSICC15_268

تاریخ نمایه سازی: 26 مهر 1388

Abstract:

با رشد سریع حجم متون قابل دسترس به خصوص در شبکه ی جهانی اینترنت، کار استخراج اطلاعات از متن اهمیت روز افزون یافته است. عملیات اصلی سیستم های استخراج اطلاعات از دو مرحله ساخت پایگاه دانش مورد نیاز برای استخراج اطلاعات و استفاده از پایگاه دانش برای استخراج اطلاعات از متون ورودی تشکیل شده است. در این مقاله برای تولید خودکار پایگاه دانش مورد نیاز الگوریتمی ارائه شده است که می تواند قواعد لازم برای استخراج اطلاعات از متون نیم هساختارمند (مانند صفحات وب) را در طول یک فرآیند یادگیری بانظارت تولید کند.در این الگوریتم که یک الگوریتم استقرای قاعده است، از یک قاعده عمومی شروع می شود و بر اساس ورودی و خروجی هایی که درمثال های آموزشی وجود دارد و نیز معیارهای ارزیابی قواعد، آن قاعده اختصاصی تر و دقیق تر می شود. تعریف معیارهای جدید ATP,AATP برای مقایسه و ارزیابی قواعد استخراج اطلاعات، تعریف پس پردازش نهایی برای بهتر کردن قاعده و استفاده از یادگیری به روش تعاملی با کاربر برای بدست آوردن نتیجه بهتر از دیگر موارد طراحی شده در این الگوریتم است. هر قاعده استخراج اطلاعات به صورت الگویی است که باید در متن جستجو شود و در صورت تطبیق با قسمتی از متن، اطلاعات مورد نیاز بر اساس پارامترهای تعریف شده در الگو استخراج یابد. برای ارزیابی این الگوریتم، نتایج به دست آمده برروی مثالهای آزمایشی با نتایج سیستم WHISK ( یکی از سیستم های موفق در استخراج اطلاعات) مقایسه شده است که بهبود قابل توجهی را در هر دو معیار Recall,Precision نشان میدهد.

Keywords:

استخراج اطلاعات از متن , متن کاوی , وب کاو ی , یادگیری قواعد , استقرای قاعده , سیستم های استخراج اطلاعات از متن

Authors

مجتبی شکری

کارشناسی ارشد نرم افزار دانشگاه صنعتی امیرکبیرهیئت علمی دانشگاه آزا

احمد عبداله زاده

هیئت علمی دانشکده مهندسی کامپیوترو فناوری اطلاعات دانشگاه صنعتی ام

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

شکری، مجتبی؛ یادگیری قواعد استخراج اطلاعات از متون ساختارمند، پایان ...
یک روش پیشنهادی برای استخراج مفاهیم دامنه [مقاله کنفرانسی]
بکارگیری تکنیکی از داده کاوی برای بهبود کارآیی سیستم های استخراج اطلاعات از متن [مقاله کنفرانسی]
I5] قادریان، میثم؛ درویشی، احسان؛ ابوالحسنی، حسن؛ "استخراج اطلاعات از ...
مرادی، مینا؛ بهبود کشف اطلاعات از متون نیمه ساختارمند، XML ...
Califf M. E.; Mooney R. J., "Bottom-up relational learning Artificial ...
Sarawagi S.; Cohen W. W. "Semi-markoy conditional random fields for ...
McCallum A.; Freitag D.; Pereira F., "Maximum Entropy Markov Models ...
McCallum A.; Jensen D., "A note _ the unification of ...
Ertraction, Doctoral Dissertation Proposal, Department of Computer Sciences, University of ...
Bunescu R.; Mooney R., "Collective Information Extraction with Relational Markov ...
Yangarber R.; Lin W.; Grishman R., "Unsupervised _ Generalized Names", ...
Bunescu R.:; Ge R.; Kate R. J.; Marcotte E. M.; ...
Yakushiji A.; Miyao Y.; Ohta T.; Tateisi Y.; Tsujii J., ...
Mooney R. J.;Nahm U. Y. "Text Mining with Information Extraction", ...
Mooney R. J.; Bunescu R. "Mining Knowledge from Text Using ...
Nahm U. Y.; _ _ inforation extraction, PhD thesis, Department ...
Patwardhan; Riloff E.. "Learning Domain -Specific Information Extraction Patterns from ...
Iranmanesh Z.; Piri R.; Abolhassani H., "An Approach for Seantic ...
Soderland S., "Learning Information Extraction Rules for S emi-structured and ...

نمایش کامل مراجع