کاربرد شبکه عصبی دوسویه در اصلاح بردارهای بازنمایی گفتار تلفنی و میکروفونی

Publish Year: 1388
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,292

This Paper With 6 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CSICC15_172

تاریخ نمایه سازی: 26 مهر 1388

Abstract:

شبکه عصبی دوسویه در بررسیهای گذشته نشان داده است که توانایی اصلاح بردارهای تخریب شده توسط نویز محیط و کانال انتقال در گفتارهای تلفنی و میکروفونی را دارد. در این مقاله ما تلاشیدوباره برای افزایش صحت بازشناسی گفتار میکروفونی و تلفنی با دو باراصلاح بردارهای بازنمایی توسط شبکه عصبی دوسویه انجام داده ایم.برای این منظور شبکه عصبی دو سویه یک بار توسط بردارهای بازنمایی لگاریتم انرژی بانک های فیلتر (LFBE) تعلیم داده شده و پس از تعلیم، کلیه بردارهای بازنمایی توسط آن اصلاح می شوند . سپس این بردارهای اصلاح شده به یک شبکه دوسویه دیگر تعلیم داده شده و مثل قبل اصلاح می شوند. برای ارزیابی کیفیت بردارهای بازنمایی از مدلهای مخفی مارکوف استفاده شده است. برای این منظور مدلهای مخفی مارکوف توسط بردارهای بازنمایی LFBE,MFCC تلفنی و میکروفونهی حاصل از دو مرحله اصلاح تعلیم داده شده اند. بردارهای بازنمایی LFBE بدست آمده اند. بااعمال این تکنیکهای جدید دررصد بازناشی آوا برای گفتار میکروفونی و تلفنی به ترتیب 4/7 درصد و 9/3 درصد افزایش یافته است علاوه بر این با تعلیم یک سیستم بازشناسی گفتار توسط دادگان میکروفونی اصلاح شده و آزمون آن بر روی دادگان تلفنی اصلاح شده ، 25/6 درصد افزایش صحت بازشناسی درمقایسه با سیستم بازشناسی مشابه مبتنی بر دادگان اصلاح نشده،بدست آمده است که این خود توانایی سیستم پیشنهادی را در اصلاح بردارهای بازنمایی نشان می دهد.

Authors

منصور ولی

دانشگاه شاهد

ایمان اسمعیلی

دانشگاه شاهد

سیدعلی سیدصالحی

دانشگاه صنعتی امیرکبیر

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • B. Kotnik, D. Vlaj B. Horvat, "Efficient Noise Robust Feature ...
  • N. Morales, D.T. Toledano, J.H.L. Hansen, J. Colas, J. Garrido, ...
  • H.G. Hirsch, "HMM Adaptation for Applications in Telec ommunicatiot _ ...
  • M.L. Seltzer, A. Acero, "Training Wideband Acoustic Models Using Mixed-B ...
  • Missing Features for Robust Speech Recognition", Speech Comm unication. , ...
  • W. Kim, R.M. Stern, "B and -Independent Mask Estimation for ...
  • M. Vali. , S.A. Seyyed Salehi. _ Karimi, "Robust Speech ...
  • L.R. Rabiner, B.-H Juang, Fundamentas of Speech Recognition, Prentice-Hall, Englewood ...
  • N. Morales, D.T. Toledano, J.H.L. Hansen, J. Garrido, "Feature Compensation ...
  • M. Bijankhan, J. Sheikhzadegan, M.R. Roohani, Y. Samareh, C. Lucas, ...
  • M. Bijankhan, J. S heykhzadegan, M.R. Roohani, R. Zarrintare, S.Z. ...
  • نمایش کامل مراجع