CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

طراحی و پیاده سازی سیستم تصحیح املا در زبان کردی با استفاده از روش کد گذاریsoundex

عنوان مقاله: طراحی و پیاده سازی سیستم تصحیح املا در زبان کردی با استفاده از روش کد گذاریsoundex
شناسه ملی مقاله: ICS11_056
منتشر شده در یازدهمین کنفرانس سراسری سیستم های هوشمند در سال 1391
مشخصات نویسندگان مقاله:

ئاسو بزرگ پناه - دانشکده فنی مهندسی، دانشگاه کردستان
فردین اخلاقیان - دانشکده فنی مهندسی، دانشگاه کردستان
وفا بارخدا - دانشکده فناوری اطلاعات، دانشگاه صنعتی کرمانشاه

خلاصه مقاله:
اگرچه برای تشخیص و تصحیح خطا تا کنون الگوریتم های زیادی پیشنهاد شده است ولی در این میان الگوریتم هایی که از روشهای کد گذاری استفاده می کنند جایگاه ویژهای دارند. روش کد گذاری Soundex یکی از شناخته شده ترین و پرکاربردترین الگوریتم های کد گذاری است که بویژه در زبان هایی که نظام آوایی خاصی دارند، همچون انگلیسی، مفید واقع شده است. با توجه به نحوه کد گذاری در این روش و همچنین ساختار ویژه زبان کردی، میتوان از این الگوریتم به شکل مناسب در سیستم تصحیح گر املای کردی استفاده کرد و درصد بالایی از خطاهای نوشتاری در این زبان را شناسایی و تصحیح نمود. اساس کد گذاری soundex بر پایه نحوه تلفظ کردن همخوان هاست. در این روش به چهار همخوان اول مطابق جدول از پیش تعریف شده ای، کد تعلق گرفته در حالی که به واکه ها هیچ کدی تعلق نمی گیرد. شناسایی و تصحیح خطا بر اساس کد تعلق گرفته به کلمه و مقایسه با کدهای موجود در پایگاه داده است. مطابق با آمارها و مطالعاتمان، 85.54 درصد از کل خطاهای موجود در متون کردی مربوط به واکه ها و چند همخوان ویژه زبان کردی می باشد؛ بدین معنا که در کلمات مختلف، واکه ها و آن چند همخوان که شیوه نگارش آنها به هم نزدیک است، به اشتباه به جای همدیگر مورد استفاده قرار می گیرند. بنابراین با استفاده از روش soundex درصد بسیار قابل توجهی از خطاها را می توان اصلاح نمود. نتایج شبیه سازی ها نشان می دهد که 94.36 درصد از کل خطاها با استفاده از این روش قابل اصلاح می باشد

کلمات کلیدی:
تشخیص خطا، تصحیح خطا، سیستم کنترل خطا، روش کد گذاری Soundex

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/214639/