طراحی و پیاده سازی سیستم تصحیح املا در زبان کردی با استفاده از روش کد گذاریsoundex
Publish place: 11th Intelligent Systems Conference
Publish Year: 1391
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 799
This Paper With 7 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICS11_056
تاریخ نمایه سازی: 14 مهر 1392
Abstract:
اگرچه برای تشخیص و تصحیح خطا تا کنون الگوریتم های زیادی پیشنهاد شده است ولی در این میان الگوریتم هایی که از روشهای کد گذاری استفاده می کنند جایگاه ویژهای دارند. روش کد گذاری Soundex یکی از شناخته شده ترین و پرکاربردترین الگوریتم های کد گذاری است که بویژه در زبان هایی که نظام آوایی خاصی دارند، همچون انگلیسی، مفید واقع شده است. با توجه به نحوه کد گذاری در این روش و همچنین ساختار ویژه زبان کردی، میتوان از این الگوریتم به شکل مناسب در سیستم تصحیح گر املای کردی استفاده کرد و درصد بالایی از خطاهای نوشتاری در این زبان را شناسایی و تصحیح نمود. اساس کد گذاری soundex بر پایه نحوه تلفظ کردن همخوان هاست. در این روش به چهار همخوان اول مطابق جدول از پیش تعریف شده ای، کد تعلق گرفته در حالی که به واکه ها هیچ کدی تعلق نمی گیرد. شناسایی و تصحیح خطا بر اساس کد تعلق گرفته به کلمه و مقایسه با کدهای موجود در پایگاه داده است. مطابق با آمارها و مطالعاتمان، 85.54 درصد از کل خطاهای موجود در متون کردی مربوط به واکه ها و چند همخوان ویژه زبان کردی می باشد؛ بدین معنا که در کلمات مختلف، واکه ها و آن چند همخوان که شیوه نگارش آنها به هم نزدیک است، به اشتباه به جای همدیگر مورد استفاده قرار می گیرند. بنابراین با استفاده از روش soundex درصد بسیار قابل توجهی از خطاها را می توان اصلاح نمود. نتایج شبیه سازی ها نشان می دهد که 94.36 درصد از کل خطاها با استفاده از این روش قابل اصلاح می باشد
Keywords:
Authors
ئاسو بزرگ پناه
دانشکده فنی مهندسی، دانشگاه کردستان
فردین اخلاقیان
دانشکده فنی مهندسی، دانشگاه کردستان
وفا بارخدا
دانشکده فناوری اطلاعات، دانشگاه صنعتی کرمانشاه
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :