CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

جبران تنوعات گوینده در شبکه های عصبی بازشناخت گفتار به روش تنظیم ورودی

عنوان مقاله: جبران تنوعات گوینده در شبکه های عصبی بازشناخت گفتار به روش تنظیم ورودی
شناسه ملی مقاله: ICBME11_021
منتشر شده در یازدهمین کنفرانس مهندسی پزشکی ایران در سال 1382
مشخصات نویسندگان مقاله:

ایثار نژادقلی - دانشجوی کارشناسی ارشد بیوالکتریک
سیدعلی سید صالحی - استادیار دانشکده مهندسی پزشکی دانشگاه صنعتی امیرکبیر

خلاصه مقاله:
مسئله تنوعات گوینده، یکی از مهمترین عواملی است که بر کارآیی سیستم های بازشناخت گفتار اثر می گذارد. در این مقاله روشی پیشنهاد می شود که در آن با کمک تنظیم ورودی قسمتی از این تأثیر در شبکه های عصبی بازشناخت گفتار جبران می وشد. ابتدا در میان 71 گوینده آموزش، گوینده با بالاترین درصد صحت تشخیص آوا را به عنوان گوینده مرجع انتخاب می کنیم. سپس با استافده از الگوریتم پس انتشار خطا همه سیگنال گفتار مربوط به گویندگان آموزش و آزمون را طوری تنظیم می کنیم که بر گوینده مرجع منطبق شوند. مدل بازشناخت گفتار با دادگان آموزش تنظیم شده، تعلیم و با دادگان آزمون تنظیم شده، آزموده می شود. با اعمال این روش و تلفیق نتایج این شبکه با شبکه بدون تنظیم ورودی بر اساس بیشترین سطح اطمینان، 2/6% افزایش در صحت تشخیص آوا به دست می آید.

کلمات کلیدی:
بازشناخت گفتار - شبکه های عصبی - تنظیم ورودی - تنوعات گوینده

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/55110/