تطبیق گوینده در بازشناسی گفتار پیوسته به کمک روشی جدید مبتنی بر تخمین MAP و تبدیل MLLR

Publish Year: 1381
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,439

This Paper With 6 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ACCSI08_044

تاریخ نمایه سازی: 18 بهمن 1386

Abstract:

یک روش موثر برای کاهش عدم تطابق میان داده آموزشی و تست که عموما در سیستم های بازشناسی گفتار پیوسته اتفاق می افتد تطبیق مدل می باشد. عموما روشهای تطبیق به دوگروه تقسیم میشوند: یک گروه تطبیق مستقیم مدل می باشدکه در آن پارامترهای مدل مستقیما باز تخمین زده میشوند معروفترین این روشها تخمین MAP می باشد . از آنجاییکه در این روش تنها مدل هایی که داده های آموزشی متناظر شان موجود باشد تازه سایز می شوند برای بهبود قابل توجه دقت بازشناسی مدل، داده های آموزشی نسبتا زیادی مورد نیاز است ولذا کارایی مدل با افزایش داده های آموزشی افزایش می یابد. گروه دوم تطبیق غیر مستقیم مدل می باشد که مشهورترین این روشها تبدیل MLLR می باشد. در این روش تعدادی تبدیلات عمومی بر روی خوشه های مدل اعمال میگردد. در این حالت چون پارامترهای تمام مدلها تبدیل میشوند، برای دادگان کم آموزشی نتایج مطلوبی حاصل می گردد، اما با افزایش دادگان، کارایی به حد اشباع می رسد. در این مقاله روش جدیدی مطرح میگردد که مزایای هر دو روش فوق را داراست، ضمن اینکه معایب انهارا می پوشاند. در اینر وش ها مدل هایی که داده اموزشی انها موجود است به کمک تخمین MAP آموزش می بینند و مدل هایی که داده آموزشی ندارند با استفاده از روش MLLR و روشی مشابه تخمین MAP آموزش می بینند. اینروش در عمل بر روی یک سیستم آموزش دیده بر اساس دادگان فارس دات به نتایج بهتری نسبت به هر یک از دو روش MAP و MLLR منتهی شده است.

Authors

سعید شریفیان

دانشجوی کارشناسی ارشد دانشکده مهندسی برق دانشگاه صنعتی امیرکبیر

سیدمحمد احدی

استادیار دانشکده مهندسی برق دانشگاه صنعتی امیرکبیر

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • سید حسین شمس، سید محمد احدی، روش آموزش وزنی وابسته ...
  • J. L. Gauvain and C.-H.Lee, ،#Maximum a Posteriori Estimation for ...
  • C.-H. Lee On-Line Adaptive Learning of the Corelated C ontinuou ...
  • C.-H. Lee, C.-H. Lin, and B.-H. Juang, *A Study on ...
  • Hidden Markov Models, IEEE Trans. Acoustic, Speech, Signal Processing, vol. ...
  • C.-H. Lee, _ On Stochastic feature and model compensation approaches ...
  • C. _ Leggetter and P. C. Woodland, ،#Maximum likehood linear ...
  • K. Ohkura, M. Sugiyama, and S. Sagayama, a Speaker adaptation ...
  • O. Siohan.T.-A Myrvoll, and C.-H Lee, ، Structural Maximum a ...
  • A. Sankar and C.-H. Lee, ،A maximum likelihood approach to ...
  • K. Shinoda, K. Iso, and T. Watanabe, : Speaker adaptation ...
  • O. Siohan, C. Chesta, and C.-H. Lee, ،Hidden Markov model ...
  • Dynamic speaker ن [12] R. M. Stern and M.J.lasry, adaptation ...
  • A. C. Surendran, C.-H. Lee, and M. Rahim, ، Non- ...
  • G. Zavaliagkos, R. schwartz, ،#Maximum a posteriori adaptation for large-scale ...
  • S.M.Ahadi.، #Reduced Context Sensitivity in Persian Speech Recognition via Syllable ...
  • Q.Huo and C. Chan, Bayesian Adaptive Lear ning of Parameters ...
  • HTK Hidden Markov Model Toolkit ver 3.1, Reference Manual , ...
  • Koichi Shinoda and Chin-Hui Lee, A Structural Bayes Approach to ...
  • Oliver Siohan, Cristina Chesta Chin-Hui Lee . Joint Maximum A ...
  • نمایش کامل مراجع