آشکارساز گفتار جدید با استفاده از بازنمایی تنک و لغت نامه بهنگام

Publish Year: 1400
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 336

This Paper With 16 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

EESCONF05_052

تاریخ نمایه سازی: 27 مرداد 1400

Abstract:

در این مقاله یک آشکارسازگفتار VAD بر مبنای بازنمایی تنک و بهنگامسازی اتم های لغت نامه در فضای اسپکتروگرام شنیداری (فضای دوبعدی STRF ) ارائه شده است. در این فضای طیفی زمانی در مرحله اول، طیف نگاره گفتار حاصل شده و در مرحله بعد، طیف نگاره گفتار شنیداری، به دوبعد مقیاس و نرخ تجزیه می شود در سال های اخیر روش تنک جایگاه ویژه ای در روش های پردازش گفتار یافته است، ایده اصلی در این روش، بازسازی هر سیگنال گفتار با استفاده از تعداد محدودی اتم های پایه است. استفاده از بازنمایی تنک در یادگیری لغت نامه های گفتار و نویز و بهنگام سازی آنها، باعث جداساز بهتر قسمت های گفتار ونویز می شود. در این الگوریتم با استفاده از فضای دو بعدی STRF و با کمک بازنمایی تنک، لغت نامه های بهنگام Dictionary updating با اندازه اتم های متفاوت حاصل شده که ازروش های یادگیری K-SVD و NMF برای آموزش آنها بهره می بریم. نتایج، حاکی از جواب دهی خوب این روش است، بطورمثال در ۵ SNR= عملکرد آشکارسار گفتار پیشنهادی برای نویز سفید برابر با۹۲.۷۱ % و در نویز ماشین برابر با ۹۱.۲۱ % می باشد. مقایسه نتایج پارامترهای ارزیابی NDS و MSC با روش های دیگر، عملکرد بهتر روش پیشنهادی را نشان می دهد.

Authors

محدثه اسحاقی

گروه مهندسی برق، واحد نوشهر، دانشگاه آزاد اسلامی ، نوشهر، ایران