الگوریتم جدید بهینه سازی گفتار در فضای طیفی –زمانی با استفاده از بازنمایی تنک
Publish place: 2nd International Conference on Mechanics, Electrical, Aerospace Engineering and Engineering Sciences
Publish Year: 1401
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 229
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
IEAMCONF02_054
تاریخ نمایه سازی: 15 تیر 1401
Abstract:
در این مقاله یک روش جدید برای بهبود کیفیت گفتار بر مبنای بازنمایی تنک در فضای طیفی- زمانی(STRF) ارائه شده است. مولفه های فضای طیفی-زمانی علاوه بر ابعاد فرکانس و زمان، دارای دو بعد دیگر مقیاس و نرخ هستند. مقیاس به معنای مدولاسیون طیفی و نرخ به معنای مدولاسیون زمانی است. با بهره گیری از بازنمایی تنک در یادگیری لغت نامه های گفتار و نویز، نتایج بهتری از قسمت های گفتار و نویز حاصل می شود. در این الگوریتم ابتدا گفتار ورودی با استفاده از فضای STRF به مولفه های جهاربعدی فرکانس، زمان، مقیاس و نرخ تبدیل می شود و از آنجایی که تشکیل یک لغت نامه مطلوب با این تعداد مولفه تقریبا غیر ممکن است. برای رفع این مشکل افراز مکعبی هرقاب زمانی مد نظر قرار گرفت و سه ایده با توجه به این افراز پیشنهاد می گردد. به کمک روش تنک و لغت نامه های گفتار و نویز در هر مکعب، تخمین بهتری برای قسمت های گفتار و نویز دست می دهد. در اینجا از الگوریتم NMF برای آموزش لغت نامه بهره می بریم. بطورمثال در SNR=-۱۰dB در نویز سفید PESQ=۲.۷۱۰ و در نویز همهمه PESQ=۲.۶۷۷ حاصل شد که عملکرد مطلوب روش پیشنهادی نسبت به سایر روش ها را نشان می دهد.
Keywords:
Authors
محدثه اسحاقی
گروه مهندسی برق، واحد نوشهر، دانشگاه آزاد اسلامی، نوشهر، ایران