پیشنهاد یک روش آشکارساز صوت دو مرحله ای مبتنی بر مدل مخفی مارکوف

محمد مهدی فارسی نژاد; بهزاد زمانی دهکردی; احمد اکبری; بابک ناصر شریف

پیشنهاد یک روش آشکارساز صوت دو مرحله ای مبتنی بر مدل مخفی مارکوف

Publish place: 14th Annual Conference of Computer Society of Iran

Publish Year: 1387

نوع سند: مقاله کنفرانسی

زبان: Persian

متن کامل این Paper منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل Paper (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/60961

شناسه ملی سند علمی:

ACCSI14_213

تاریخ نمایه سازی: 26 مهر 1387

Abstract:

آشکارساز صوت (Voice Activity Detection)ابزار مهمی برای افزایش کارائی روش های کد کردن گفتار، بهبود کیفیت گفتار و بازشناسی گفتار محسوب می شود. آشکارسازها به روش های آستانه گذاری و روشهای مبتنی بر مدل تقسیم می شوند. روش های آستانه گذاری کارائی ضعیفی در محیط نویزی دارند. از اینرو در مقاله حاضر یک الگوریتم VAD مبتنی بر مدل مخفی مارکوف پیشنهاد شده است که در دو مرحله عمل می کند. نخست با یک دسته بند (مدل مخفی مارکوف)، نوع نویز تشخیص داده می شود. در مرحله دوم، آشکارساز صوت مرتبط با آن نویز بکار می رود تا عملکرد بالاتری در محیط نویزی داشته باشد . ویژگی های مورد استفاده در این روش، بردار ۳۹ بعدی شامل لگاریتم انرژی، ۱۲ ضریب MFCC و مشتقات مرتبه اول و دوم آنها می باشد عملکرد الگوریتم پیشنهادی بر روی دادگان TIMIT مورد ارزیابی قرار گرفته است. بر اساس نتایج بدست آمده روش پیشنهادی نسبت به روش های دیگر عملکرد قابل قبولی از خود نشان داده است.

Keywords:

آشکارساز صوت , مدل مخفی مارکوف , تشخیص دهنده نوع نویز , استخراج ویژگی , آستانه گذاری

Authors

محمد مهدی فارسی نژاد

آزمایشگاه پردازش صدا و گفتار، دانشکده مهندسی کامپیوتر، دانشگاه علم و صنعت ایران

بهزاد زمانی دهکردی

آزمایشگاه پردازش صدا و گفتار، دانشکده مهندسی کامپیوتر، دانشگاه علم و صنعت ایران

احمد اکبری

آزمایشگاه پردازش صدا و گفتار، دانشکده مهندسی کامپیوتر، دانشگاه علم و صنعت ایران

بابک ناصر شریف

گروه مهندسی کامپیوتر، دانشکده فنی، دانشگاه گیلان

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

سلیمانی سیده اکرم، احدی سیدمحمد، ، آشکارسازی فعالیت گفتاری با ...
Sohn J., Kim N. S. and Sung W., ،0A statistical ...
Mohammdi M., Nasersharif B., Rahmani M. and Akbari A., "The ...
Ishizuka K., Nakatani T., Fujimoto M., and Miyazaki N., "Noise ...
Fujimoto M., Ishizuka K., and Nakatani T., "A voice activity ...
Fujimoto M. and Ishizuka K., "Noise robust v oice activity ...
Kristjansson T., Deligne S., and Olsen P., *Voicing features for ...
Li K., Swamy M. N. S. and Ahmad M.O., ،0An ...
ETSI standard document, ETSI ES 202 050 V1.1.3, 2003. ...
Basu S., A linked-HMM model for robust voicing detection and ...

نمایش کامل مراجع