بررسی مدل گفتاری افراد ناشنوا و ناگویا و طبقه بندی آن با استفاده از شبکه عصبی

Publish Year: 1394
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 785

This Paper With 7 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CSCG01_082

تاریخ نمایه سازی: 29 مهر 1396

Abstract:

افراد ناشنوا به علت نقص در شنوایی در گفتار نیز دچار ناتوانی و یا اختلال می باشند و با استفاده از زبان اشاره و لب خوانی به عنوان زبان گفتاری با جامعه ارتباط برقرار می کنند، همچنین عدم شنوایی این افراد باعث دشواری در یادگیری آنان می شود. تا کنون روش های متعددی برای شناسنده های گفتار پیشنهاد شده اند. آنچه اهمیت دارد استفاده از روش هایی است که ضمن دارا بودن دقت و سرعت، قابلیت بازشناسی گفتار بسیار متفاوت افراد ناشنوا و نا گویا را داشته باشد. در این مقاله با یررسی سیستم متداول بازشناسی گفتار با استفاده از ویژگی های MFCC و LPC ضمن ایجاد مدل گفتاری برای افراد ناشنوا و ناگویا، از شبکه های عصبی مصنوعی جهت هوشمند سازی سیستم مورد نظر بهره گرفته شده است. در این مقاله برای اولین بار جمع آوری پایگاه داده ای متشکل از 810 نمونه صدا از افراد ناشنوا و ناگویا صورت گرفته است. دقت کارکرد این سیستم با بهره گیری از تحلیل منحنی ROC برابر 99.7% می باشد و قابلیت طبقه بندی صدای افراد ناشنوا و ناگویا را دارد.

Authors

مینا اسدی سنجانی

دانشکده فنی و مهندسی ، دانشگاه خوارزمی

سعید ستایشی

دانشکده مهندسی انرژی و فیزیک ، دانشگاه صنعتی امیرکبیر