آشکارسازی فعالیت گفتاری به کمکبهسازی گفتار و استفاده از دیورژانسطیفی بلند مدت سیگنال

Publish Year: 1384
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,314

This Paper With 6 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ACCSI11_046

تاریخ نمایه سازی: 5 آذر 1390

Abstract:

در این مقاله طرح یک آشکارساز فعالیت گفتاری جدید که می تواند در شرایط محیط ِ ی نامناسب با نویز غیر ایستا و نسبت سیگنال به نویز پایین کار کند مورد بررسی قرار می گیرد. امروزه در بسیاری از کاربردهای پردازش گفتار همانند وسایل کمک شنوایی، بازشناسی گفتار، کدینگ و ... برای کاهش تأثیر مخرب نویز بر عملکرد سیستم از سیستم های بهسازی گفتار استفاده می شود. در این سیستم ها معمو ً لا از آشکارساز فعالیت گفتاری(Voice Activity Detector برای تشخیص فریم های فاقد گفتار و سپس تخمین طیف نویز از روی آنها استفاده می شود. در این تحقیق از یک سیستم بهسازی گفتار پیش از بکارگیری VAD استفاده شده و خروجی VAD مجددًا در همین سیستم بکارگرفته می شود. در این راستا از سیستم بهسازی گفتار Malah و Ephraim برای تخمین MMSE طیف سیگنال و افزایش نسبت سیگنال به نویز در سیگنال ورودی استفاده شده است. سپس معیار تصمیم گیری VAD از محاسبه دیورژانس طیفی بلندمدت سیگنال ارتقا یافته Enhanced Long Term Spectral (Divergence- E-LTSD بدست می آید. نشان داده شده است که استفاده از اطلاعات بلند مدت طیف سیگنال در بهبود عملکرد VAD موثر است. سپس برای اینکه سیستم بهسازی گفتار بتواند در شرایط محیط ِ ی نامناسب با نویز غیر ایستا کار کند، طیف نویز را در فریم های فاقد گفتار به روز می کنیم

Authors

علیرضا اسماعیلی

دانشکده مهندسی برق، دانشگاه صنعتی امیرکبیر