بهبود سیستم جداسازی منبع مبتنی بر آنالیز ترکیب شنیداری در زبان فارسی
Publish place: Tabriz Journal of Electrical Engineering، Vol: 46، Issue: 4
Publish Year: 1395
نوع سند: مقاله ژورنالی
زبان: Persian
View: 450
This Paper With 11 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_TJEE-46-4_024
تاریخ نمایه سازی: 10 تیر 1396
Abstract:
در این مقاله، سیستم های جدیدی به منظور بهبود عملکرد سیستم جداکننده گفتار دوگوشی با نام MESSL ارایه می شود. در سیستم جداساز سیگنال، ابتدا، با استفاده از الگوریتم EM، مدلهای گوسی پارامترهای اختلاف فاز درون گوشی (IPD) و اختلاف شدت درون گوشی (ILD) به دست می آیند. سپس، با استفاده از مدل به دست آمده برای هر منبع، ماسک نرمی استخراج شده که با ضرب آن در تبدیل فوریه زمان کوتاه (STFT) سیگنال مخلوط، سیگنال هدف جدا می شود. به علت عملکرد ناقص سیستم در امر جداسازی، دو سیستم پس پردازش به منظور حذف سیگنال های ناخواسته از سیگنال هدف، پیشنهاد میشود. روش پیشنهادی اول حذف وفقی نویز با استفاده از بهینه سازی ازدحام ذرات بر مبنای یادگیری (LPSO) است. سیستم پس پردازش پیشنهادی دوم شامل دو مرحله است. در مرحله اول این سیستم، از روش حذف نویز تبدیل موجک به منظور حذف بخش اعظم سیگنال تداخل استفاده می شود. در مرحله دوم، روش حداقل میانگین مربعات خطا (MMSE) جهت ارتقاء هرچه بیشتر کیفیت سیگنال هدف جداشده به کار می رود. ارزیابی و مقایسه سیستم های پیشنهادی برای دادگان فارسی نشان می دهد که سیستم پیشنهادی دوم در بهبود کیفیت سیگنال هدف جداشده خوب عمل می کند و از نظر محاسباتی نیز کارآمد است.
Keywords:
بهبود کیفیت گفتار , جداسازی منبع دوگوشی , تبدیل موجک , حداقل میانگین مربعات خطا (MMSE) , بهینه سازی ازدحام ذرات بر مبنای یادگیری (LPSO)
Authors
مسعود گراونچی زاده
دانشیار، دانشکده مهندسی برق و کامپیوتر - دانشگاه تبریز - تبریز - ایران
پریا دادور
دانشجوی دکتری، دانشکده مهندسی برق و کامپیوتر - دانشگاه تبریز - تبریز - ایران
بابک بهادرنیا
کارشناسی ارشد، دانشکده مهندسی برق و کامپیوتر - دانشگاه تبریز - تبریز - ایران