CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

طبقه بندی حروف صدادار زبان فارسی با استفاده از ماشین بردار پشتیبان

عنوان مقاله: طبقه بندی حروف صدادار زبان فارسی با استفاده از ماشین بردار پشتیبان
شناسه ملی مقاله: CEITCONF01_133
منتشر شده در کنفرانس ملی کامیپوتر،فناوری اطلاعات و کاربردهای هوش مصنوعی در سال 1396
مشخصات نویسندگان مقاله:

زهرا فتح الهی - دانشجوی کارشناسی ارشد مهندسی نرمافزار، دانشگاه آزاد اسلامی واحد خرم آباد
صبا جودکی - استادیار گروه مهندسی کامپیوتر، دانشگاه آزاد اسلامی واحد خرم آباد

خلاصه مقاله:
بازشناسی تصویری گفتار برای کمک به افرادی که دچار آسیب در سیستم صوتی شده اند، در سالهای اخیر مورد توجه محققین قرار گرفته است. در این مقاله روشی برای تشخیص واج های مصوت(() و /آ ،/ /ای ،/ / او/) زبان فارسی توسط پردازش تصویر ارایه می شود. روش پیشنهادی بدین صورت است که پس از استخراج ناحیه لب از تصاویر چهره توسط یک روش ابتکاری (استفاده از شدت روشنایی و تقارن های طبیعی موجود در آن)، برای استخراج ویژگیهای لب از تابع موجک دو بعدی گسسته(DWT) و سپس محاسبه هیستوگرام ضرایب موجک بدست آمده، استفاده شده است و در نهایت توسط طبقه بند SVM به تشخیص واج های مصوت پرداخته می شود. نتایج بدست آمده نشان میدهد که روش استخراج ویژگی و طبقهبند پیشنهادی می تواند تاثیر چشمگیری در بهبود عملکرد سیستم تشخیص داشته باشد، به طوری که با انتخاب کرنل گوسین برای طبقه بند SVM و انتخاب تعداد ستون های هیستوگرام 60 تایی و انتخاب تابع موجک از نوع بای ارتگنال با جزییات قطری در مرحله استخراج ویژگی، دقت تشخیص آن به 10/84 رسید این در حالی است که نتیجه آزمایش سایر طبقهبندها بر روی دیتاست انتخابی، برای طبقه بند نزدیکترین همسایه(KNN) برابر 18/72، برای شبکه عصبی (ANN) برابر 24/62 و برای طبقهبند درخت تصمیم (DT) برابر 12/60 میباشد.

کلمات کلیدی:
لب خوانی، واج های مصوت، تبدیل موجک، طبقه بند SVM، دقت تشخیص

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/762596/