CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

الگوریتم جدید بهینه سازی گفتار در فضای طیفی –زمانی با استفاده از بازنمایی تنک

عنوان مقاله: الگوریتم جدید بهینه سازی گفتار در فضای طیفی –زمانی با استفاده از بازنمایی تنک
شناسه ملی مقاله: IEAMCONF02_054
منتشر شده در دومین کنفرانس بین المللی مکانیک، برق، مهندسی هوافضا و علوم مهندسی در سال 1401
مشخصات نویسندگان مقاله:

محدثه اسحاقی - گروه مهندسی برق، واحد نوشهر، دانشگاه آزاد اسلامی، نوشهر، ایران

خلاصه مقاله:
در این مقاله یک روش جدید برای بهبود کیفیت گفتار بر مبنای بازنمایی تنک در فضای طیفی- زمانی(STRF) ارائه شده است. مولفه های فضای طیفی-زمانی علاوه بر ابعاد فرکانس و زمان، دارای دو بعد دیگر مقیاس و نرخ هستند. مقیاس به معنای مدولاسیون طیفی و نرخ به معنای مدولاسیون زمانی است. با بهره گیری از بازنمایی تنک در یادگیری لغت نامه های گفتار و نویز، نتایج بهتری از قسمت های گفتار و نویز حاصل می شود. در این الگوریتم ابتدا گفتار ورودی با استفاده از فضای STRF به مولفه های جهاربعدی فرکانس، زمان، مقیاس و نرخ تبدیل می شود و از آنجایی که تشکیل یک لغت نامه مطلوب با این تعداد مولفه تقریبا غیر ممکن است. برای رفع این مشکل افراز مکعبی هرقاب زمانی مد نظر قرار گرفت و سه ایده با توجه به این افراز پیشنهاد می گردد. به کمک روش تنک و لغت نامه های گفتار و نویز در هر مکعب، تخمین بهتری برای قسمت های گفتار و نویز دست می دهد. در اینجا از الگوریتم NMF برای آموزش لغت نامه بهره می بریم. بطورمثال در SNR=-۱۰dB در نویز سفید PESQ=۲.۷۱۰ و در نویز همهمه PESQ=۲.۶۷۷ حاصل شد که عملکرد مطلوب روش پیشنهادی نسبت به سایر روش ها را نشان می دهد.

کلمات کلیدی:
بهینه سازی گفتار، فضای طیفی- زمانی، بازنمایی تنک، افراز مکعبی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1478712/