تجزیهی بیمربی کلمات زبان فارسی به واژهای تشکیل دهنده

Publish Year: 1386
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,341

This Paper With 6 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ACCSI13_232

تاریخ نمایه سازی: 25 آبان 1386

Abstract:

در این مقاله، روشی جدید برای تجزیهی بیمربی کلمات زبان فارسی به واژهای سازنده، پیشنهاد میشود. در تئوری ریختشناسی زبان، به کوچکترین اجزای یک کلمه که هنوز دارای معنی باشند، واژ گفته میشود. در نظر گرفتن واژ به عنوان واحد حاوی اطلاعات، الگوریتمهای پردازش زبان طبیعی را قادر میسازد تا اطلاعات آماری کاملتری از دادههای آموزشی به دست آورند. تاکنون تحقیقات بسیار کمی در زمینه تجزیهی خودکار و بیمربی کلمات زبان فارسی به واژها انجام گرفته و نتایج به دست آمده چندان مطلوب نیست. روش پیشنهادی در این مقاله دارای دو مرحله است. در هرکدام از مراحل روی خاصیت مشخصی از مفهوم واژ تأکید شده است. در مرحلهی اول، تعدادی از زیررشتهها با استفاده از ساختمان دادهی ترای و معیار توان پیشبینی، برای برگزیده شدن به عنوان واژ، کاندید میشوند. در مرحلهی دوم، از بین زیررشتههای کاندید شده با استفاده از ساختمان دادهی گراف جهتدار بدون دور، زیر رشتههایی که میتوان آنها را در تعداد بیشتری کلمه مشاهده کرد، به عنوان واژ انتخاب میشوند. نتایج عملی نشان میدهد که الگوریتم پیشنهادی، معیارهای دقت و پوشش را حدود ۲۰ % نسبت به تنها روش پیشین بکار رفته برای زبان فارسی، بهبود میدهد.

Authors

مسعود فیض بخش

دانشگاه صنعتی شریف

رضا صدرائی

دانشگاه صنعتی شریف

غلامرضا قاسم ثانی

دانشگاه صنعتی شریف

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • _ Goldsmith, J., _ _ U nSupervised learning of the ...
  • Harris, Z., "From phoneme _ morpheme", Language, vol 31, 190-222, ...
  • Harris, Z., "Morpheme boundaries within words: report on a computer ...
  • Hafer, M. A., Weiss, S. F. "Word segmentation by letter ...
  • Deerwester, S., Susan, D., Furnas, G., Landauer, T., Harshmann, R., ...
  • Schone, P., Jurafsky, D., _ _ L anguage- independent induction ...
  • Jacquemin, C., "Guessing morphology from terms and corpora", Proceedings of ...
  • Gaussier, E., _ _ U nSupervised learning of derivational morphology ...
  • Creutz, M., _ U nSupervised _ gmentation of words using ...
  • Brent, M., "Minimal generative models: A middle ground between neurons ...
  • Arabsorkhi, M., Shamsfard, M., _ _ U nSupervised Discovery Of ...
  • نمایش کامل مراجع