یک روش سه مرحله ای جدید برای بهسازی گفتار مبتنی بر بهسازی ادراکی،تبدیل موجک و آشکارسازی نویز ناایستان و بهینه سازی ابرپارامترهای آن با الگوریتم فراابتکاری QPSO

Publish Year: 1396
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 417

This Paper With 10 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CSCG02_133

تاریخ نمایه سازی: 7 اسفند 1396

Abstract:

موضوع بهبود کیفیت صدا امروزه به یکی از موضوعات مهم و اساسی روز تبدیلشده است. ازاینرو بهبود گفتارهای آغشته به نویز یکی از موضوعات مهم در حوزه پردازش سیگنال است . بهسازی گفتار در موارد بسیاری مثل تشخیص صدا، تشخیص گوینده در محیطهای نویزی و بازیابی صداهای تخریب شده با نویز کاربرد دارد. تضعیف نویز بهنحویکه اختلالی در سیگنال اصلی به وجود نیاورد، یک چالش مهم برای بهبود صدا محسوب میشود. در این مقاله، یک روش ترکیبی سه مرحله ای برای بهسازی گفتار پیشنهاد میگردد. در مرحله اول، کیفیت گفتار توسط روش Perceptual Bayesian Estimator بهبود داده میشود. گفتار بهبود داده شده، در مرحله بعد، توسط بسته موجک (Wavelet Packet) به زیرباندهای مختلف (Sub-Bands) تجزیه میگردد. سپس در مرحله سوم، هر یک از زیرباندهای ویولت با روش بهسازی تازه-ارایهشدهی NNESE بهبود داده میشود. در نهایت، زیرباندهای بهبود داده شده با هم ترکیب شده و سیگنال بهسازی شده نهایی را میسازند. از آنجا که مشخصات طیفی گفتار در هر زیرباند ویولت متفاوت است، لذا در این روش تلفیقی، از الگوریتم بهینهسازی QPSO برای بهینه سازی ابرپارامترهای سیستم تلفیقی فوق در تمامی زیرباندها استفاده میگردد. در آزمایشهای انجام شده، روش پیشنهادی نسبت به روشهای موردتحقیق در این مقاله بهتر عمل میکند و منجر به بهبود معیارهای Segmental SNR و PESQ میگردد.

Keywords:

بهسازی گفتار , تبدیل موجک , بهینه سازی سراسری , الگوریتم های فراابتکاری , الگوریتم بهینه سازی دسته ذرات کوانتومی (QPSO)

Authors

الهه صاحبی همراه

دانشجوی کارشناسی ارشد فناوری اطلاعات گرایش سیستمهای چندرسانه ای، دانشگاه رازی، کرمانشاه

سیدجهانشاه کبودیان

استادیار گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه رازی، کرمانشاه