ویژگی جدید، مقاوم و زمان بلند بی نظمی زمانی برای آشکارسازی گفتار

محمد رسول, کهریزی; سیدجهانشاه, کبودیان

ویژگی جدید، مقاوم و زمان بلند بی نظمی زمانی برای آشکارسازی گفتار

عنوان مقاله: ویژگی جدید، مقاوم و زمان بلند بی نظمی زمانی برای آشکارسازی گفتار
شناسه ملی مقاله: ELEMECHCONF04_548
منتشر شده در چهارمین کنفرانس ملی و دومین کنفرانس بین المللی پژوهش های کاربردی در مهندسی برق، مکانیک و مکاترونیک در سال 1395

مشخصات نویسندگان مقاله:

محمد رسول کهریزی - دانشکده فنی و مهندسی، گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه رازی کرمانشاه
سیدجهانشاه کبودیان - دانشکده فنی و مهندسی، گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه رازی کرمانشاه

خلاصه مقاله:

سیستم های شناسایی گفتار را میتوان نوعی از سیستم های دسته بندی کننده ی سیگنال های صوتی دانست که از آنها برای شناسایی، آشکارسازی و یا نشانه گذاری قسمت هایی از سیگنال صوتی که شامل گفتار انسان است، استفاده می شود. در اینجا میخواهیم روش جدید، مقاوم و زمان بلند بینظمی زمانی - (LTTE) Long-Term Time Entropy را برای آشکارسازی گفتار معرفی کنیم و هدف از ارایه این ویژگی این بوده که هم خود ویژگی به تنهایی عملکرد مناسبی داشته باشد و هم اینکه در ترکیب با سایر ویژگی ها سبب بهبود عملکرد و افزایش دقت شناسایی شود. برای این منظور روش پیشنهاد شده را با سایر روش های جدید و معروف این حوزه در شرایط گوناگون به سنجش گذاشتیم. نتایج آزمایش ها بر روی مجموعه ی داده MUSAN ، نشاندهنده ی بهبود عملکرد سیستم آشکارساز گفتار در صورت ترکیب ویژگی LTTE با سایر ویژگی ها می باشد و همچنین این ویژگی به تنهایی و در مقایسه با ویژگی های همرده اش، دقت عملکرد بالاتری را دارا می باشد.

کلمات کلیدی:

آشکارساازی گفتاار، Voice Activity Detection (VAD) ، robust feature extraction ،

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/692614/