بکارگیری روشهای تطبیق به گوینده سریع بر مبنای فارسیMLLRدر سیستم بازشناسی گفتارفارسی

Publish Year: 1392
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,236

This Paper With 6 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ICEE21_003

تاریخ نمایه سازی: 27 مرداد 1392

Abstract:

روش رگرسیون خطی بیشینه درستنمایی ) MLLR ( یکی از متداولترین روشهای تطبیق به گوینده است که در داده تطبیقی کافی میتواند عملکرد خوبی را از خود به نمایش بگذارد. اما وقتی میزان داده تطبیقی کاهش مییابد، این روش نمیتواند به خوبی عمل کند. در این مقاله، دو روش تطبیق به گوینده MLLR بر مبنای آنالیز مؤلفههای اساسی ) PCA ( یا EMLLR و PCA احتمالاتی به منظور برطرف کردن اینمشکل بکار گرفته شدهاند. در روش دوم، مزایای سه روش تطبیق به گوینده متداول بیشینه پسینه ) MAP (، رگرسیون خطی بیشنیه درست نمایی ) MLLR ( و صدای ویژه ) EV ( با یگدیگر ترکیب شده است. در این روش، اطلاعات مربوط به تغییرات آوای یک گوینده که توسط ماتریس تبدیل MLLR مربوط به آن گوینده مشخص میشوند یک ابربردار را میسازند. با اعمال PCA احتمالاتی به فضای ابربردارهای تشکیل شده ازتغییرات آوای مربوط به تمامی گویندگان تعلیمی، یک مدل احتمالاتی برای تولید ماتریس تبدیل گوینده جدید بوجود میآید که با استفاده از تخمین MAP میتوان این ماتریس را محاسبه کرد. نتایج آزمایشات نشان میدهند که روش دوم در مقادیر مختلف از داده تطبیقی سرپرستیشده و بدون سرپرستی بخصوص در داده تطبیقی کوتاه عملکرد خوبی را نسبت به روش EMLLR و MLLR از خود نشان میدهد

Keywords:

آنالیز مؤلفه های اساسی احتمالاتی , تطبیق به گوینده , رگرسیون خطی بیشینه درست نمایی , فضای ویژه

Authors

زهره انصاری

دانشگاه صنعتی امیرکبیر (پلیتکنیک تهران)، دانشکده مهندسی پزشکی، آزمایشگاه پردازش گفتار

سعید شیری قیداری

دانشگاه صنعتی امیرکبیر )پلیتکنیک تهران(، دانشکده مهندسی کامپیوتر

فرشاد الماس گنج

دانشگاه صنعتی امیرکبیر )پلیتکنیک تهران(، دانشکده مهندسیپزشکی، آزمایشگاه پردازش گفتار