استفاده از شبکه های عصبی محاسبه گرم خزنی به منظور بازشناسی گفتار فارسی
Publish place: 22th Iranian Conference on Biomedical Engineering(ICBME2015)
Publish Year: 1394
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 384
This Paper With 6 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICBME22_022
تاریخ نمایه سازی: 7 اسفند 1396
Abstract:
شبکه های عصبی بازگشتی مدل های دینامیکی قدرتمندی به منظور نگاشت دنباله ای از ورودی ها به دنباله ای از خروجی ها مانند آنچه در بازشناسی گفتار انجام می گیرد هستند. اتصالات بازگشتی موجود در این ساختار از شبکه ها آنها را برای مدل کردن توالی های زمانی گفتاری مثل توالی بردارهای ویژگی گفتاری مناسب ساخته است. اما مشکلی که در تعلیم این ساختار از شبکه ها وجود دارد، ناپدید شدن گرادیان است. به بیانی دیگر، با تعلیم آنها به کمک روش- های متداول تعلیم شبکه های عصبی بازگشتی، نمی توان از اطلاعات فریم های با فاصله بیشتر از ده گام زمانی برای تصمیم گیری در مورد فریم فعلی کمک گرفت. در واقع، شبکه با گذشت زمان ورودی اولیه را فراموش کرده است. برای حل این مشکل، شبکه های عصبی محاسبه گر مخزنی معرفی شده اند. نتایج آزمایش های بازشناسی گفتار انجام شده با استفاده از این ساختار از شبکه ها کارایی این ساختارها را بخوبی آشکار کرده است. در این مقاله تاثیر استفاده از شبکه های عصبی محاسبه گر مخزنی بر روی دادگان گفتاری فارسی فارس دات به منظور بازشناسی گفتار مورد بررسی قرار گرفته است. نتایج آزمایشات انجام گرفته نشان می دهند که با بهینه سازی پارامترهای مربوط به این شبکه ها بر روی دادگان فارسی، میتوان به دقت بازشناسی واج برابر با 67/7% با زمان تعلیم و هزینه محاسباتی بسیار کمتری نسبت به شبکه های عصبی بازگشتی متداول دست یافت
Keywords:
Authors
زهره انصاری
دانشگاه صنعتی امیرکبیر، دانشکده مهندسی پزشکی، آزمایشگاه پردازش گفتار
آزاده شیرودی
دانشگاه صنعتی امیرکبیر، دانشکده مهندسی پزشکی، آزمایشگاه پردازش گفتار
سیدعلی صالحی
دانشگاه صنعتی امیرکبیر، دانشکده مهندسی پزشکی، آزمایشگاه پردازش گفتار