بهبود سیستم جداسازی منبع مبتنی بر آنالیز ترکیب شنیداری در زبان فارسی

Publish Year: 1395
نوع سند: مقاله ژورنالی
زبان: Persian
View: 399

This Paper With 11 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

JR_TJEE-46-4_024

تاریخ نمایه سازی: 10 تیر 1396

Abstract:

در این مقاله، سیستم های جدیدی به منظور بهبود عملکرد سیستم جداکننده گفتار دوگوشی با نام MESSL ارایه می شود. در سیستم جداساز سیگنال، ابتدا، با استفاده از الگوریتم EM، مدلهای گوسی پارامترهای اختلاف فاز درون گوشی (IPD) و اختلاف شدت درون گوشی (ILD) به دست می آیند. سپس، با استفاده از مدل به دست آمده برای هر منبع، ماسک نرمی استخراج شده که با ضرب آن در تبدیل فوریه زمان کوتاه (STFT) سیگنال مخلوط، سیگنال هدف جدا می شود. به علت عملکرد ناقص سیستم در امر جداسازی، دو سیستم پس پردازش به منظور حذف سیگنال های ناخواسته از سیگنال هدف، پیشنهاد میشود. روش پیشنهادی اول حذف وفقی نویز با استفاده از بهینه سازی ازدحام ذرات بر مبنای یادگیری (LPSO) است. سیستم پس پردازش پیشنهادی دوم شامل دو مرحله است. در مرحله اول این سیستم، از روش حذف نویز تبدیل موجک به منظور حذف بخش اعظم سیگنال تداخل استفاده می شود. در مرحله دوم، روش حداقل میانگین مربعات خطا (MMSE) جهت ارتقاء هرچه بیشتر کیفیت سیگنال هدف جداشده به کار می رود. ارزیابی و مقایسه سیستم های پیشنهادی برای دادگان فارسی نشان می دهد که سیستم پیشنهادی دوم در بهبود کیفیت سیگنال هدف جداشده خوب عمل می کند و از نظر محاسباتی نیز کارآمد است.

Keywords:

بهبود کیفیت گفتار , جداسازی منبع دوگوشی , تبدیل موجک , حداقل میانگین مربعات خطا (MMSE) , بهینه سازی ازدحام ذرات بر مبنای یادگیری (LPSO)

Authors

مسعود گراونچی زاده

دانشیار، دانشکده مهندسی برق و کامپیوتر - دانشگاه تبریز - تبریز - ایران

پریا دادور

دانشجوی دکتری، دانشکده مهندسی برق و کامپیوتر - دانشگاه تبریز - تبریز - ایران

بابک بهادرنیا

کارشناسی ارشد، دانشکده مهندسی برق و کامپیوتر - دانشگاه تبریز - تبریز - ایران