پیشنهاد یک روش آشکارساز صوت دو مرحله ای مبتنی بر مدل مخفی مارکوف

محمد مهدی, فارسی نژاد; بهزاد, زمانی دهکردی; احمد, اکبری; بابک, ناصر شریف

پیشنهاد یک روش آشکارساز صوت دو مرحله ای مبتنی بر مدل مخفی مارکوف

عنوان مقاله: پیشنهاد یک روش آشکارساز صوت دو مرحله ای مبتنی بر مدل مخفی مارکوف
شناسه ملی مقاله: ACCSI14_213
منتشر شده در چهاردهمین کنفرانس سالانه انجمن کامپیوتر ایران در سال 1387

مشخصات نویسندگان مقاله:

محمد مهدی فارسی نژاد - آزمایشگاه پردازش صدا و گفتار، دانشکده مهندسی کامپیوتر، دانشگاه علم و صنعت ایران
بهزاد زمانی دهکردی - آزمایشگاه پردازش صدا و گفتار، دانشکده مهندسی کامپیوتر، دانشگاه علم و صنعت ایران
احمد اکبری - آزمایشگاه پردازش صدا و گفتار، دانشکده مهندسی کامپیوتر، دانشگاه علم و صنعت ایران
بابک ناصر شریف - گروه مهندسی کامپیوتر، دانشکده فنی، دانشگاه گیلان

خلاصه مقاله:

آشکارساز صوت (Voice Activity Detection)ابزار مهمی برای افزایش کارائی روش های کد کردن گفتار، بهبود کیفیت گفتار و بازشناسی گفتار محسوب می شود. آشکارسازها به روش های آستانه گذاری و روشهای مبتنی بر مدل تقسیم می شوند. روش های آستانه گذاری کارائی ضعیفی در محیط نویزی دارند. از اینرو در مقاله حاضر یک الگوریتم VAD مبتنی بر مدل مخفی مارکوف پیشنهاد شده است که در دو مرحله عمل می کند. نخست با یک دسته بند (مدل مخفی مارکوف)، نوع نویز تشخیص داده می شود. در مرحله دوم، آشکارساز صوت مرتبط با آن نویز بکار می رود تا عملکرد بالاتری در محیط نویزی داشته باشد . ویژگی های مورد استفاده در این روش، بردار ۳۹ بعدی شامل لگاریتم انرژی، ۱۲ ضریب MFCC و مشتقات مرتبه اول و دوم آنها می باشد عملکرد الگوریتم پیشنهادی بر روی دادگان TIMIT مورد ارزیابی قرار گرفته است. بر اساس نتایج بدست آمده روش پیشنهادی نسبت به روش های دیگر عملکرد قابل قبولی از خود نشان داده است.

کلمات کلیدی:

آشکارساز صوت، مدل مخفی مارکوف، تشخیص دهنده نوع نویز، استخراج ویژگی، آستانه گذاری

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/60961/