سازوکاری برای بهینه سازی استخراج ویژگی برای تشخیص هممرجعی ضمیر و اسم اشاره در زبان فارسی

لادن مداح; بهروز مینایی

سازوکاری برای بهینه سازی استخراج ویژگی برای تشخیص هممرجعی ضمیر و اسم اشاره در زبان فارسی

Publish place: Fifth Conference on Knowledge Engineering and Innovation

Publish Year: 1397

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 8 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/988924

شناسه ملی سند علمی:

KBEI05_039

تاریخ نمایه سازی: 27 بهمن 1398

Abstract:

تشخیص هم مرجعی یکی از پایه های مهم در پردازش زبانطبیعی می باشد. کاربردهای مهمی در حوزه هایی مانند پاسخ گویی به سوال،ترجمه ماشین، خلاصه سازی اتوماتیک و استخراج موجودیت نامدار دارد.وظیفه ی تشخیص هم مرجعی حل و فصل عبارت های اسمی و ضمایر در متناست که به موجودیت یکسان ارجاع می دهد. روش های تشخیص هم مرجعیرا می توان به دو دسته ی روش های زبان شناسی و روش های یادگیری ماشینتقسیم نمود. روش های زبان شناسی بیشتر به اطلاعات زبانشناسی نیاز دارند،البته مشکلی که این روشها دارند این است که احتمال خطا در آنها بیشتراست همچنین اجرای این روشها زمان بر می باشند، درحالی که روش هاییادگیری ماشین کمتر به اطلاعات زبانشناسی نیاز دارند. در این مقالهسیستمی ارائه می شود که اسم های هم مرجعی موجود در متن را شناساییکرده و با درنظرگرفتن ویژگی های مشخص شده نمونه های مثبت و منفی رااز پیکره استخراج می کند. از جمله نوآوری هایی که انجام شد اضافه کردنویژگی هایی به سیستم می باشد که از آن ها برای عمل تشخیص مرجعضمیر استفاده می شود. این ویژگی ها از نقش نحوی عبارت اسمی کاندید وضمیر استفاده کرده است. با تغییر دادن این ویژگی ها در سیستم دربهترین حالت میتوان به دقت 59.4 درصد دست پیدا کردیم.

Keywords:

پردازش زبان طبیعی , پیکره زبان فارسی , تشخیص مرجع ضمیر , یادگیری ماشین

Authors

لادن مداح

دانشکده مهندسی کامپیوتر، دانشگاه علم و صنعت استان تهران تهران، ایران

بهروز مینایی

دانشکده مهندسی کامپیوتر،دانشگاه علم و صنعت استان تهران تهران، ایران