CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بکارگیری روشهای تطبیق به گوینده سریع بر مبنای فارسیMLLRدر سیستم بازشناسی گفتارفارسی

عنوان مقاله: بکارگیری روشهای تطبیق به گوینده سریع بر مبنای فارسیMLLRدر سیستم بازشناسی گفتارفارسی
شناسه ملی مقاله: ICEE21_003
منتشر شده در بیست و یکمین کنفرانس مهندسی برق ایران در سال 1392
مشخصات نویسندگان مقاله:

زهره انصاری - دانشگاه صنعتی امیرکبیر (پلیتکنیک تهران)، دانشکده مهندسی پزشکی، آزمایشگاه پردازش گفتار
سعید شیری قیداری - دانشگاه صنعتی امیرکبیر )پلیتکنیک تهران(، دانشکده مهندسی کامپیوتر
فرشاد الماس گنج - دانشگاه صنعتی امیرکبیر )پلیتکنیک تهران(، دانشکده مهندسیپزشکی، آزمایشگاه پردازش گفتار

خلاصه مقاله:
روش رگرسیون خطی بیشینه درستنمایی ) MLLR ( یکی از متداولترین روشهای تطبیق به گوینده است که در داده تطبیقی کافی میتواند عملکرد خوبی را از خود به نمایش بگذارد. اما وقتی میزان داده تطبیقی کاهش مییابد، این روش نمیتواند به خوبی عمل کند. در این مقاله، دو روش تطبیق به گوینده MLLR بر مبنای آنالیز مؤلفههای اساسی ) PCA ( یا EMLLR و PCA احتمالاتی به منظور برطرف کردن اینمشکل بکار گرفته شدهاند. در روش دوم، مزایای سه روش تطبیق به گوینده متداول بیشینه پسینه ) MAP (، رگرسیون خطی بیشنیه درست نمایی ) MLLR ( و صدای ویژه ) EV ( با یگدیگر ترکیب شده است. در این روش، اطلاعات مربوط به تغییرات آوای یک گوینده که توسط ماتریس تبدیل MLLR مربوط به آن گوینده مشخص میشوند یک ابربردار را میسازند. با اعمال PCA احتمالاتی به فضای ابربردارهای تشکیل شده ازتغییرات آوای مربوط به تمامی گویندگان تعلیمی، یک مدل احتمالاتی برای تولید ماتریس تبدیل گوینده جدید بوجود میآید که با استفاده از تخمین MAP میتوان این ماتریس را محاسبه کرد. نتایج آزمایشات نشان میدهند که روش دوم در مقادیر مختلف از داده تطبیقی سرپرستیشده و بدون سرپرستی بخصوص در داده تطبیقی کوتاه عملکرد خوبی را نسبت به روش EMLLR و MLLR از خود نشان میدهد

کلمات کلیدی:
آنالیز مؤلفه های اساسی احتمالاتی، تطبیق به گوینده، رگرسیون خطی بیشینه درست نمایی، فضای ویژه

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/208062/