یک کدینگ صحبت در حوزه شنوایی با استفاده از بانک فیلتر گاماتن مختلط و ویژگی های ادراکی انسان
Publish place: 2nd National Electrical Engineering
Publish Year: 1388
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,662
This Paper With 6 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
NEEC02_221
تاریخ نمایه سازی: 7 بهمن 1388
Abstract:
اخیرا گروهی از کد کننده های صوتی با نرخ بیتی پایین و براساس زیرباندهای شنوایی ارائه شده اند که از مدلهای ادراکی جهت تشخیص و حذف اطلاعات اضافه استفاده می کنند دراین سیستم ها اغلب بمنظور استخراج ویژگی های زمان - فرکانس سیگنال، از یک مدل فیلترینگ شنوایی مانند حلزونی گوش استفاده میشود. یکی از مدلهای رایج دراین زمینه فیلترهای گاماتن حقیقی است نقطه ضعف این فیلترها شیب همواره پاسخ فرکانسی و عدم انطباق کامل با دامنه تند فیلترهای شنوایی است که منجر به کاهش دقت فرکانسی و ایجاد اعوجاج در سیگنال خروجی می شود دراین مقاله جهت بهبود کیفیت با تعمیم پاسخ ضربه فیلترهای گاماتن حقیقی، یک بانک فیلتری آنالیز مختلط بهمراه بانک فیلتری بهینه شده معکوس آن طراحی شده است. دراین سیستم حذف مولفه های اضافه و نارسا از طریق ماسکینگ کوتاه مدت و استانه گذاری وفقی، و کد کردن دامنه و محل پالسها نیز از طریق یک روش کوانتیزاسیون غیریکنواخت جدید و الگوریتم های کدینگ بدون تلفات صورت می پذیرد بررسی عملکرد سیستم از نظر میزان فشرده سازی و ارزیابی کیفیت توسط آزمون استاندارد MOS نشان میدهد که علیرغم کاهش قابل توجه نرخ بیتی تا حدود 14.6Kbps کیفیت صحبت سنتز شده حفظ شده و کاهش محسوسی نیافته است.
Keywords:
Authors
سیدایمان ابطحی
دانشکده مهندسی برق دانشگاه آزاد اسلامی واحد نجف آباد
محمدرضا آشوری
آزمایشگاه تحقیقاتی پردازش سیگنالهای دیجیتال، دانشکده مهندسی برق و ک
رسول امیرفتاحی
آزمایشگاه تحقیقاتی پردازش سیگنالهای دیجیتال، دانشکده مهندسی برق و ک