طراحی و پیاده سازی سیستم تصحیح املا در زبان کردی با استفاده از روش کد گذاریsoundex

Publish Year: 1391
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 799

This Paper With 7 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ICS11_056

تاریخ نمایه سازی: 14 مهر 1392

Abstract:

اگرچه برای تشخیص و تصحیح خطا تا کنون الگوریتم های زیادی پیشنهاد شده است ولی در این میان الگوریتم هایی که از روشهای کد گذاری استفاده می کنند جایگاه ویژهای دارند. روش کد گذاری Soundex یکی از شناخته شده ترین و پرکاربردترین الگوریتم های کد گذاری است که بویژه در زبان هایی که نظام آوایی خاصی دارند، همچون انگلیسی، مفید واقع شده است. با توجه به نحوه کد گذاری در این روش و همچنین ساختار ویژه زبان کردی، میتوان از این الگوریتم به شکل مناسب در سیستم تصحیح گر املای کردی استفاده کرد و درصد بالایی از خطاهای نوشتاری در این زبان را شناسایی و تصحیح نمود. اساس کد گذاری soundex بر پایه نحوه تلفظ کردن همخوان هاست. در این روش به چهار همخوان اول مطابق جدول از پیش تعریف شده ای، کد تعلق گرفته در حالی که به واکه ها هیچ کدی تعلق نمی گیرد. شناسایی و تصحیح خطا بر اساس کد تعلق گرفته به کلمه و مقایسه با کدهای موجود در پایگاه داده است. مطابق با آمارها و مطالعاتمان، 85.54 درصد از کل خطاهای موجود در متون کردی مربوط به واکه ها و چند همخوان ویژه زبان کردی می باشد؛ بدین معنا که در کلمات مختلف، واکه ها و آن چند همخوان که شیوه نگارش آنها به هم نزدیک است، به اشتباه به جای همدیگر مورد استفاده قرار می گیرند. بنابراین با استفاده از روش soundex درصد بسیار قابل توجهی از خطاها را می توان اصلاح نمود. نتایج شبیه سازی ها نشان می دهد که 94.36 درصد از کل خطاها با استفاده از این روش قابل اصلاح می باشد

Keywords:

Authors

ئاسو بزرگ پناه

دانشکده فنی مهندسی، دانشگاه کردستان

فردین اخلاقیان

دانشکده فنی مهندسی، دانشگاه کردستان

وفا بارخدا

دانشکده فناوری اطلاعات، دانشگاه صنعتی کرمانشاه

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • K. Kukich, "Techniques for automatically correcting words in text, " ...
  • A. Bol'shakov, "automatic error correctioh in inflected languages, " Journal ...
  • D. Jurafsky and J. H. Martin, Speech and Language Processing ...
  • R. Mitton, "Spellchecking by Computer, " Journal of the Simplified ...
  • _ :/www.cs .kent.ac _ _ _ ...
  • T. H. Cormen, C. E. Leiserson, R. L. Rivest, and ...
  • D. E. Kmuth, the Art of Computer Programming, Addison-Wesley, Vol. ...
  • J. Pedler, "Computer spellcheckers and dyslexics: A performance survey, _ ...
  • نمایش کامل مراجع