بازشناسی مقاوم گفتار تلفنی فارسی به روش سری های تیلور برداری (VTS)

Publish Year: 1390
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 568

This Paper With 6 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ICBME18_092

تاریخ نمایه سازی: 27 فروردین 1393

Abstract:

تکنیک سری های تیلور برداری (VTS) از جمله کاراترین روش های بازشناسی مقاوم گفتار به شمار می رود که در هردو حوزه اصلاح بردارهای بازنمایی و اصلاح مدل صوتی بازشناسی کاربرد دارد. مقاله حاضر به شرح این تکنیک برای جبران سازی اثر عوامل مزاحم محیطی از روی بردارهای بازنمایی سیگنال گفتار فارسی میکروفنی و تلفنی، و در نتیجه افزایش نرخ بازشناسی آن ها پرداخته است. به این ترتیب که پس از استخراج بردارهای بازنمایی از گفتار تخریب شده توسط نویز جمعی یا کانال تلفن به روش متداول LFBE، این بردارها به کمک تکنیک VTS اصلاح شده اند. برای بازشناسی، یک مدل مبتنی بر شبکه عصبی MLP با دینامیک زمانی توسط دادگان تمیز موجود تعلیم داده شده است. نتایج حاصل از تست این شبکه بر روی بردارهای بازنمایی میکروفنی و تلفنی نشان داده است که استفاده از الگوریتم VTS در جبران سازی بردارهای بازنمایی، نه تنها منجر به بهبود چشمگیری در بازشناسی گفتار میکروفنی برای SNR های پائین خواه شد (15% بهبود برای SNR=0)، بلکه نرخ بازشناسی گفتار تلفنی در حالت انطباق بین دادگان تعلیم و آزمون نیز بیانگر پیشرفت مناسبی نسبت به گفتار تلفنی اصلاح نشده خواهد بود.

Authors

محسن قدیانی

دانشجوی کارشناسی ارشد دانشگاه شاهد

منصور ولی

استادیار دانشگاه شاهد

سارا پورمحمدی

دانشجوی کارشناسی ارشد دانشگاه شاهد

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • منصور ولی، "بازشناسی مقاوم گفتار به منظور جبران سازی تنوعات ...
  • Jasha Droppo, "Noise Robust Automatic Speech Recognition", Microsoft Research Center, ...
  • Yong Zhao and Bing-Hwang Juang, "On Noise Stimation for Robust ...
  • Michael L. Seltzer and Alex Acero, :HMM adaptation using Linear ...
  • Pedro J.Moreno, "Speech Recognition in Noisy Environments". Thesis, pp, 79-104, ...
  • Pedro J. Moreno, Bhiksha Raj and Richard . Stern, :A ...
  • R. C. _ Dalen and M J. F. Gales, "Extended ...
  • _ _ _ Trainig ...
  • Nam Soo Kim, Do Yeong Kim, Byung Goo Kong and ...
  • R. C. Van Dalen and M. J. F. Gales, "Covariance ...
  • _ _ _ "Model Composition by Lagrange Polynomial Approximation for ...
  • _ _ _ non-stationary Noisy Environments? High Technology Letters, pp, ...
  • Do Yeong Kim, Chang Kwan Un and Nam Soo Kim, ...
  • Do Yeong Kim, Chang Kwan Un and Nam So Kim, ...
  • نمایش کامل مراجع