الگوریتم جدید بهینه سازی گفتار در فضای طیفی –زمانی با استفاده از بازنمایی تنک

Publish Year: 1401
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 229

This Paper With 13 Page And PDF and WORD Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

IEAMCONF02_054

تاریخ نمایه سازی: 15 تیر 1401

Abstract:

در این مقاله یک روش جدید برای بهبود کیفیت گفتار بر مبنای بازنمایی تنک در فضای طیفی- زمانی(STRF) ارائه شده است. مولفه های فضای طیفی-زمانی علاوه بر ابعاد فرکانس و زمان، دارای دو بعد دیگر مقیاس و نرخ هستند. مقیاس به معنای مدولاسیون طیفی و نرخ به معنای مدولاسیون زمانی است. با بهره گیری از بازنمایی تنک در یادگیری لغت نامه های گفتار و نویز، نتایج بهتری از قسمت های گفتار و نویز حاصل می شود. در این الگوریتم ابتدا گفتار ورودی با استفاده از فضای STRF به مولفه های جهاربعدی فرکانس، زمان، مقیاس و نرخ تبدیل می شود و از آنجایی که تشکیل یک لغت نامه مطلوب با این تعداد مولفه تقریبا غیر ممکن است. برای رفع این مشکل افراز مکعبی هرقاب زمانی مد نظر قرار گرفت و سه ایده با توجه به این افراز پیشنهاد می گردد. به کمک روش تنک و لغت نامه های گفتار و نویز در هر مکعب، تخمین بهتری برای قسمت های گفتار و نویز دست می دهد. در اینجا از الگوریتم NMF برای آموزش لغت نامه بهره می بریم. بطورمثال در SNR=-۱۰dB در نویز سفید PESQ=۲.۷۱۰ و در نویز همهمه PESQ=۲.۶۷۷ حاصل شد که عملکرد مطلوب روش پیشنهادی نسبت به سایر روش ها را نشان می دهد.

Authors

محدثه اسحاقی

گروه مهندسی برق، واحد نوشهر، دانشگاه آزاد اسلامی، نوشهر، ایران