بهبود روش MLLR با استفاده از MCE و دانش آوائی برای تطبیق گوینده
Publish place: 16th annual CSI Computer Conference
Publish Year: 1389
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,342
This Paper With 6 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CSICC16_039
تاریخ نمایه سازی: 28 بهمن 1390
Abstract:
روش رگرسیون خطی با بیشینه درست نمایی MLLR) یکی از روشهای تطبیق گویندهاست که با خوشه بندی پارامترهای مدل و تخمین ماتریس تبدیل برای هر خوشه و اعمال تبدیل برپارامترهای مدل باعث بهبود عملکرد تطبیق و درنتیجه افزایش نرخ بازشناسی برای گوینده جدید می شود خوشه بندی پارامترهای مدل معمولا بدوصوت انجام می شود براساس دانش آوایی و نزدیکی ویژگیها در فضای آکوستیکی، دراین مقاله با استفاده از روش متمایز سازی خطای کمینه کلاس بندی با متمایز کردن ویژگیهای سیگنال گفتار با بهبود کلاس بندی کارایی روش MLLR) بهبود یافته است این بهبود در حالت اول با متمایز کردن کلاسهای رگرسیون و درحالت دوم با یکنواخت کردن توزیع مخلوط های گوسی در کلاسهای رگرسیون ایجاد می شود روش پیشنهادی یعنی بکارگیری خطای کمینه کلاسبندی نسبت به روشهای معادل بدون خطای کمینه کلاسبندی به ترتیب باعث افزایش نسبی 0.42% تا 0.58% و 0.12% تا 0.72% درنرخ بازشناسی واج به ترتیب برای دادگان WSJ TIMIT می گردد درحالتی که درخت کلاس رگرسیون براساس نزدیکی ویژگیها در فضای آکوستیکی ساخته شده است نرخ بازشناسی واج برروی دادگان TIMIT 0.25% افزایش نسبی یافته است.
Keywords:
Authors
رضا صحرائیان
دانشکده مهندسی برق،دانشگاه علم و صنعت،ایران
بهزاد زمانی
دانشکده مهندسی کامپیوتر،دانشگاه علم و صنعت ایران،تهران