A Semi-Supervised Method for Persian Homograph Disambiguation

Publish Year: 1391
نوع سند: مقاله کنفرانسی
زبان: English
View: 1,626

متن کامل این Paper منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل Paper (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ICEE20_476

تاریخ نمایه سازی: 14 مرداد 1391

Abstract:

One of the major challenges in the most natural languages processing (NLP) tasks such as machine translation, text to speech and text mining is Word Sense Disambiguation(WSD). Supervised methods are the most common solutions for WSD. However, they need large tagged corpuses which are notavailable in some languages such as Persian. The Semi- Supervised methods can solve this problem by using small tagged corpus and large untagged corpus. This paper presents a coarsegrainedwork in WSD that uses tri-training as the semisupervised method and decision list as supervised classifier for training. The proposed method was evaluated on a corpus. The results show that the proposed method is more precise than the conventional Decision list when the tagged corpus is small

Keywords:

Authors

Noushin Riahi

Alzahra University

Fatemeh Sedghi

Alzahra University

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • T. Mosavi Miangah , "Solving the Polysemy Problem of Persian ...
  • M. Hamidi, A. Borji and S. Shiry Ghidary, "Persian word ...
  • D. Yarowsky, "Unsupervised word Sense disambiguation rivaling supervised methods:. Proceeding ...
  • M. Li and Z. H. Zhou, "Tri-training: exploiting unlabeled data ...
  • ACL Conference Short Papers, Association for Computational Linguistics, _ _ ...
  • نمایش کامل مراجع