معرفی دو روش جدید برای بهبود بازشناسی گفتار با استفاده از الگوهای زمانی

Publish Year: 1387
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,228

This Paper With 6 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ICEE16_177

تاریخ نمایه سازی: 6 اسفند 1386

Abstract:

در سیستم های بازشناس گفتار، ویژگی های استخراج شده از هر قاب گفتاری، بیانگر اطلاعات زبانی موجود در آن محدوده زمانی قاب گفتاری است. با در نظر گرفتن توالی بردارهای ویژگی استخراج شده از چند قاب متوالی، ویژگی الگوی زمانی تعریف می گردد که بیانگر دینامیک تغییرات هر یک از ویژگی های گفتاری (باندهای ویژگی) می باشد. در این مقاله دو روش جدید برای بیان چنین الگوهای زمانی معرفی شده است. هر کدام از این روش ها ، به گونه ای سعی در استخراج اطلاعات زمان بلند باندهای مختلف بردار ویژگی دارند. نتایج بازشناسی به دست آمده از ترکیب اطلاعات الگوهای زمانی موجود در باندهای متمایز بردار ویژگی با بردارهای ویژگی معمولی، نشاندهنده بهبود بازشناسی گفتار به میزان 1/2% ، در شرایط آزمون تمیز می باشد. این در حالی است که الگوهای زمانی، قابلیت بیشتری در بهبود میزان بازشناسی در شرایط آزمون نویزی دارند. از طرفی دیگر، از آنجا که الگوهای زمانی حاصل شده، بیانگر دینامیک بلند مدت باندهای ویژگی می باشند؛ نتایج بازشناسی آنها با ویژگی های مشتقات زمانی (پارامترهای دلتا بازنمایی) که بیانگر دینامیک کوتاه مدت بردار ویژگی ها هستند و همچنین ترکیب آنها با یکدیگر، مورد ارزیابی و مقایسه قرار گرفته است.

Authors

یاسر شکفته

دانشگاه صنعتی امیرکبیر

فرشاد الماس گنج

دانشگاه صنعتی امیرکبیر

ایوب دلیری

دانشگاه صنعتی امیرکبیر

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • یاسر شکفته و فرشاد الماس‌گنج، بهبود بازشناسی گفتار با استفاده ...
  • یاسر شکفته، فرشاد الماس‌گنج و ایوب دلیری، "پردازش غیرخطی و ...
  • ، (ICBME2008) دانشگاه شاهد تهران، بهمن 1386. ...
  • J. B. Allen, ،How do humans process and recognize speech, ...
  • H. Hermansky, and S. Sharma, *Temporal patterns (TRAPS) in ASR ...
  • Multi-Layerd Perceptron: Tonotopic؛ [3] B. Y. Chen, A Neural Network ...
  • M. Athineos, and D. Ellis, _ "Autoregre ssive Modeling of ...
  • B. Milner, ،Inclusion of Temporal Information into features for speech ...
  • FARSDAT, FARSDA T Persian speech database. ...
  • SPIB, SPIB noise data. Available from: <http : //spib .rice ...
  • HTK, HMM Tool Kit. Availabel from: <http : //htk. eng.cam.ac.uk ...
  • نمایش کامل مراجع