بهبود تصحیح غلط املایی در زبان کردی با تغییر وزندهی در کمترین فاصله ویرایشی

Publish Year: 1396
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,166

This Paper With 6 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CSCG02_012

تاریخ نمایه سازی: 7 اسفند 1396

Abstract:

دراین مقاله روشی برای تصحیح خودکارغلط های املایی زبان کردی ارایه شده است درروش پیشنهادی ازSoundex برای کدگذاری کلمات وپیشنهادکلمات کاندید برای تصحیح غلط املایی استفاده شده است برای اولویت دادن به کلمات پیشنهادی نخست فاصله ویرایشی لونشتاین به کارگرفته شد سپس با تغییر درهزینه ی جایگزینی حروف ویژه ی زبان کردی نرخ تصحیح خطا و کارایی سیستم افزایش داده شد برای آزمودن الگوریتم ارایه شده یک مجموعه آزمون با تعداد 399 کلمه دارای خطای املایی جمع اوری گردیده است برای ایجادفرهنگ لغات کردی گزینش کلمات براساس تعداد تکرار وقواعد زبانی انجام گرفته تا ازقرارگیری واژه نامعتبر درفرهنگ لغات جلوگیری شود درروش پیشنهادی نسبت به روشهای عمومی برای دیگرزبانها مانند لونشتاین درنرخ تصحیح خطا 3.76 درصد بهبود داشته و وجود کلمه ی درست دراولین پیشنهاد 10.03 درصد بهبود یافته است

Authors

آرش امانی

دانشجوی کارشناسی ارشد، دانشگاه آزاد واحد علوم و تحقیقات تهران، تهران

عباس کوچاری

استادیار، دانشگاه آزاد واحد علوم و تحقیقات تهران، تهران