استفاده از شبکه های عصبی محاسبه گرم خزنی به منظور بازشناسی گفتار فارسی

Publish Year: 1394
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 384

This Paper With 6 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ICBME22_022

تاریخ نمایه سازی: 7 اسفند 1396

Abstract:

شبکه های عصبی بازگشتی مدل های دینامیکی قدرتمندی به منظور نگاشت دنباله ای از ورودی ها به دنباله ای از خروجی ها مانند آنچه در بازشناسی گفتار انجام می گیرد هستند. اتصالات بازگشتی موجود در این ساختار از شبکه ها آنها را برای مدل کردن توالی های زمانی گفتاری مثل توالی بردارهای ویژگی گفتاری مناسب ساخته است. اما مشکلی که در تعلیم این ساختار از شبکه ها وجود دارد، ناپدید شدن گرادیان است. به بیانی دیگر، با تعلیم آنها به کمک روش- های متداول تعلیم شبکه های عصبی بازگشتی، نمی توان از اطلاعات فریم های با فاصله بیشتر از ده گام زمانی برای تصمیم گیری در مورد فریم فعلی کمک گرفت. در واقع، شبکه با گذشت زمان ورودی اولیه را فراموش کرده است. برای حل این مشکل، شبکه های عصبی محاسبه گر مخزنی معرفی شده اند. نتایج آزمایش های بازشناسی گفتار انجام شده با استفاده از این ساختار از شبکه ها کارایی این ساختارها را بخوبی آشکار کرده است. در این مقاله تاثیر استفاده از شبکه های عصبی محاسبه گر مخزنی بر روی دادگان گفتاری فارسی فارس دات به منظور بازشناسی گفتار مورد بررسی قرار گرفته است. نتایج آزمایشات انجام گرفته نشان می دهند که با بهینه سازی پارامترهای مربوط به این شبکه ها بر روی دادگان فارسی، میتوان به دقت بازشناسی واج برابر با 67/7% با زمان تعلیم و هزینه محاسباتی بسیار کمتری نسبت به شبکه های عصبی بازگشتی متداول دست یافت

Keywords:

شبکه های عصبی بازگشتی , شبکه های محاسبه گر مخزنی , بازشناسی گفتار

Authors

زهره انصاری

دانشگاه صنعتی امیرکبیر، دانشکده مهندسی پزشکی، آزمایشگاه پردازش گفتار

آزاده شیرودی

دانشگاه صنعتی امیرکبیر، دانشکده مهندسی پزشکی، آزمایشگاه پردازش گفتار

سیدعلی صالحی

دانشگاه صنعتی امیرکبیر، دانشکده مهندسی پزشکی، آزمایشگاه پردازش گفتار