مروری بر روشهای تطبیق به گوینده مبتنی بر آنالیز مولفه های ا ساسی در سیستم های بازشناسی گفتار

Publish Year: 1389
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,247

This Paper With 9 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ISCEE13_259

تاریخ نمایه سازی: 14 مرداد 1389

Abstract:

به منظور بهینه کردن عملکرد سیستم های بازشناسی گفتار اتوماتیک برای رنج وسیعی از گویندگان لازم است این سیستم ها به سرعت با گفتار گوینده جدید تطبیق داده شوند از آنجایی که در سیستم های واقعی معمولا گفتار مربوط به گوینده کاربر کوتاه ودر حد چندین ثانیه است لازم است از روشهای تطبیق به گوینده ای استفاده شود که با وجود داده کم بتوانند درصد بازشناسی را بهبود دهند تحقیقات نشان میدهند الگوریتم های تطبیقی که بر مبنای کاهش بعد فضای گوینده عمل می کنند می توانند با داده تطبیقی کوتاه با درصد بازشناسی بالا و به سرعت عمل تطبیق را انجام دهند دراین روشها انالیز مولفه های اساسی PCA و مشتقات آن به طور گسترده تر نسبت به بقیه الگوریتم های کاهش بعد مورد استفاده قرارگرفته است. دراین مقاله انواع روشهای تطبیق به گوینده ای که در انها الگوریتم PCA یا یکی از مشتقات آن از جمله PPCA,kernel PCA یا 2DPCA به منظور کاهش بعد فضای گوینده به کارگرفته شده معرفی شده و عملکرد آنها با روشهای تطبیق به گوینده متداول از جمله MLLR و MAP مقایسه می شود.

Keywords:

انالیز مولفه های اساسی , تطبیق به گوینده , کاهش بعد , فضای ویژه

Authors

زهره انصاری

دانشجوی کارشناسی ارشددانشگاه صنعتی امیرکبیر

فرشاد الماس گنج

دانشیار دانشگاه صنعتی امیرکبیر

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • Adaptation by Parameter Space Clustering, " Proc. Int. Conf. INTER ...
  • A. Brian Mak and B. J.T. James, "A Study of ...
  • A. Brian Mak and B. R. Hsiao, "Embedded Kernel Eigenvoice ...
  • A. Brian Mak and B. R. Hsiao, "Kernel Eigen space-based ...
  • H. Botterweck, "Anisotropic MAP Defined by Speech ...
  • Recognition, " Proc. Int. Conf. ICASSP, 2001 ...
  • _ Dong Kook Kim and B. Nam So Kim, "Maximum ...
  • A. Yongwon Jeong and B. Hyung Soon King, "New Speaker ...
  • Roger Hsiao Wend Huu, "Kernel Eigenspace based MLLR Adaptation" thesis ...
  • A. Brian Mak and B. Roger, "Application of Kernel Methods ...
  • _ Xuedog Hung and B. Hon Acero, Spoken Language Processing, ...
  • A. Osar Saz and B. Carlos Vaquero, "Study of Maximum ...
  • _ Chin-Hui Lee and B. Chin-Heng Lin, "A Study on ...
  • A. Lei HE and B Jian WU, "Speaker Adaptation based ...
  • A. A.P. Dempste and B. N.M. Laird, "Maximum Likelihood from ...
  • _ C.J. Leggetter and B. P.C. Woodland, "Maximum Likelihood Linear ...
  • I. T. Jolliffe, Principal Component Analysis. S pringer-Verlag, 1986 ...
  • Christopher M. Bishop, Pattern Recognition and Machine Learning, Springer, pp.561, ...
  • A. R. Kuhn and B. J.C. Junqua, "Rapid Speaker Adaptation ...
  • A. L.J.P. van der Matten and B. E.O. Postma, _ ...
  • A. Y. Tsao and B S.M. Lee, "Segmental Eigen voice ...
  • A. Rajkiran Gottumukkal and B. Vijayan K. Asari, "An Improved ...
  • نمایش کامل مراجع