سازوکاری برای بهینه سازی استخراج ویژگی برای تشخیص هممرجعی ضمیر و اسم اشاره در زبان فارسی

Publish Year: 1397
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 605

This Paper With 8 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

KBEI05_039

تاریخ نمایه سازی: 27 بهمن 1398

Abstract:

تشخیص هم مرجعی یکی از پایه های مهم در پردازش زبانطبیعی می باشد. کاربردهای مهمی در حوزه هایی مانند پاسخ گویی به سوال،ترجمه ماشین، خلاصه سازی اتوماتیک و استخراج موجودیت نامدار دارد.وظیفه ی تشخیص هم مرجعی حل و فصل عبارت های اسمی و ضمایر در متناست که به موجودیت یکسان ارجاع می دهد. روش های تشخیص هم مرجعیرا می توان به دو دسته ی روش های زبان شناسی و روش های یادگیری ماشینتقسیم نمود. روش های زبان شناسی بیشتر به اطلاعات زبانشناسی نیاز دارند،البته مشکلی که این روشها دارند این است که احتمال خطا در آنها بیشتراست همچنین اجرای این روشها زمان بر می باشند، درحالی که روش هاییادگیری ماشین کمتر به اطلاعات زبانشناسی نیاز دارند. در این مقالهسیستمی ارائه می شود که اسم های هم مرجعی موجود در متن را شناساییکرده و با درنظرگرفتن ویژگی های مشخص شده نمونه های مثبت و منفی رااز پیکره استخراج می کند. از جمله نوآوری هایی که انجام شد اضافه کردنویژگی هایی به سیستم می باشد که از آن ها برای عمل تشخیص مرجعضمیر استفاده می شود. این ویژگی ها از نقش نحوی عبارت اسمی کاندید وضمیر استفاده کرده است. با تغییر دادن این ویژگی ها در سیستم دربهترین حالت میتوان به دقت 59.4 درصد دست پیدا کردیم.

Authors

لادن مداح

دانشکده مهندسی کامپیوتر، دانشگاه علم و صنعت استان تهران تهران، ایران

بهروز مینایی

دانشکده مهندسی کامپیوتر،دانشگاه علم و صنعت استان تهران تهران، ایران