یک کدینگ صحبت در حوزه شنوایی با استفاده از بانک فیلتر گاماتن مختلط و ویژگی های ادراکی انسان

Publish Year: 1388
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,529

This Paper With 6 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

NEEC02_221

تاریخ نمایه سازی: 7 بهمن 1388

Abstract:

اخیرا گروهی از کد کننده های صوتی با نرخ بیتی پایین و براساس زیرباندهای شنوایی ارائه شده اند که از مدلهای ادراکی جهت تشخیص و حذف اطلاعات اضافه استفاده می کنند دراین سیستم ها اغلب بمنظور استخراج ویژگی های زمان - فرکانس سیگنال، از یک مدل فیلترینگ شنوایی مانند حلزونی گوش استفاده میشود. یکی از مدلهای رایج دراین زمینه فیلترهای گاماتن حقیقی است نقطه ضعف این فیلترها شیب همواره پاسخ فرکانسی و عدم انطباق کامل با دامنه تند فیلترهای شنوایی است که منجر به کاهش دقت فرکانسی و ایجاد اعوجاج در سیگنال خروجی می شود دراین مقاله جهت بهبود کیفیت با تعمیم پاسخ ضربه فیلترهای گاماتن حقیقی، یک بانک فیلتری آنالیز مختلط بهمراه بانک فیلتری بهینه شده معکوس آن طراحی شده است. دراین سیستم حذف مولفه های اضافه و نارسا از طریق ماسکینگ کوتاه مدت و استانه گذاری وفقی، و کد کردن دامنه و محل پالسها نیز از طریق یک روش کوانتیزاسیون غیریکنواخت جدید و الگوریتم های کدینگ بدون تلفات صورت می پذیرد بررسی عملکرد سیستم از نظر میزان فشرده سازی و ارزیابی کیفیت توسط آزمون استاندارد MOS نشان میدهد که علیرغم کاهش قابل توجه نرخ بیتی تا حدود 14.6Kbps کیفیت صحبت سنتز شده حفظ شده و کاهش محسوسی نیافته است.

Authors

سیدایمان ابطحی

دانشکده مهندسی برق دانشگاه آزاد اسلامی واحد نجف آباد

محمدرضا آشوری

آزمایشگاه تحقیقاتی پردازش سیگنالهای دیجیتال، دانشکده مهندسی برق و ک

رسول امیرفتاحی

آزمایشگاه تحقیقاتی پردازش سیگنالهای دیجیتال، دانشکده مهندسی برق و ک