بهبود گفتار با استفاده از گفتار بازسازی شده

سعید کریمی; مهدی صادق زاده; جواد میرعابدینی

بهبود گفتار با استفاده از گفتار بازسازی شده

Publish place: National Conference on Applied Research in Science and Engineering

Publish Year: 1392

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 11 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/290726

شناسه ملی سند علمی:

TIAU01_157

تاریخ نمایه سازی: 14 شهریور 1393

Abstract:

در سالهای اخیر، بازشناسی گفتار به یکی از حوزه های مهم در تحقیقات تبدیل شده است، در سیستم های رایج برای استخراج ویژگی ها ازMFCCاستفاده شده است که اگر سیگنال توسط نویز تخریب شده باشد، نمی تواندسیستمی را با قابلیت بالای بازشناسی ایجاد کند. در این مقاله می خواهیم روشی را ارائه کنیم تا سیستم های بازشناسی گفتار بتوانند با قابلیت بالاتری عملیات بازشناسی را انجام دهند. برای رسیدن به این هدف سیگنال گفتاری را با استفاده از ترکیب روشMFCCو روشAMSایجاد کرده و آنرا در سیگنال نویزی ورودی، ضرب می کنیم. سه آزمایش مورد بررسی قرار گرفت، در آزمایش اول، زیرباندهای وزن شده و وزن نشده را مورد بررسی قراردادیم، در آزمایش دوم، سیگنال نویزی ورودی را با حاصلجمع زیرباندهای وزن شده مقایسه کردیم و در آزمایش سوم، کل سیگنال نویزی ورودی را با کل سیگنال نویزی ورودی که در سیگنال وزن بازسازی شده ضرب شده بود مورد مقایسه قرار دادیم.نتایج آزمایشات نشان داد که با ضرب کردن سیگنال وزن بازسازی شده در سیگنال ورودی می توان آنرا بهبود داد و همچنین حاصلجمع زیرباندهای وزن شده نسبت به زمانی که کل باند سیگنال ورودی درسیگنال وزن بازسازی شده ضرب می شد، دارایMSEکمتری بود.

Keywords:

طیف فاز-طیف اندازه- زیرباند فرکانسی- بازسازی گفتار- بازشناسی گفتار

Authors

سعید کریمی

معماری کامپیوتر، دانشجوی کارشناسی ارشد ، مدرس

مهدی صادق زاده

نرم افزار کامپیوتر، دکتری، عضو هیئت علمی

جواد میرعابدینی

نرم افزار کامپیوتر، دکتری، عضو هیئت علمی

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

Zhu, D., Nakamura, S., Paliwal, K., Wang, R. (2005): Maximum ...
Liu, L., He, J., Palm, G., (1997): Effects of phase ...
Picone, J.W., (1993): Signal modeling techniques in speech recognit ion.pro ...
Alsteris, Leigh D., Paliwal, Kuldip K., (2007): Iterative reconstructioh of ...
Paliwal, Kuldip. _ S chwerin, Belinda. _ Wojcicki, Kamil. , ...
Paliwal, K., Wo jcicki, K., Schwerin, B., (2010b): Single-channel speech ...
Loizou, P., (2007): _ Enhancemen: Theory and Practice. Taylor and ...
Huang, X., Acero, A., Hon, H., (2001): Spoken Language Processing: ...
Quatieri, T., (2002): Discrete-Time Speech Signal Processing: Principles and Practice. ...
Shien, W., Benedict, N., Schroeder, T, Kayser, C. (2012): A ...
Kerlin, Jess R., Shahin , Antoine J., Miller, Lee. (2010): ...
Jesen, ole. .gelfand, jack. , kounios, john. , lisman, john. ...

نمایش کامل مراجع