مقدمه ای بر شناسایی گوینده مبتنی بر ضرایب MFCC و مدل سازی آماری

محمود حسینی; مرتضی زاهدی

مقدمه ای بر شناسایی گوینده مبتنی بر ضرایب MFCC و مدل سازی آماری

Publish place: The First National Conference on Computer Engineering and Information Technology of Payame Noor University

Publish Year: 1393

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 7 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/337443

شناسه ملی سند علمی:

FNCEITPNU01_091

تاریخ نمایه سازی: 17 اسفند 1393

Abstract:

به کارگیری گفتار گویندگان برای شناسایی و تصدیق هویت افراد به دلیل سادگی استفاده از آن کاربرد فراوان دارد. هر سیستم شناسایی گوینده از دو فاز یادگیری و آزمایش تشکیل شده است. در بخش یادگیری، ویژگی های گفتار که مهم ترین آن ها ضرایب کپسترال اند با استفاده از روش MFCC استخراج می شوند. سپس با کمک روش های آماری مانند مدل پنهان مارکوف، مدل مخلوط گوسی و یا ماشین بردار پشتیبان، مدلی منحصر به فرد از صدای هر گوینده ایجاد، سطح آستانه ای برای مدل تعیین و در پایگاه داده ذخیره می گردد. در فاز آزمایش، گفتار نمونه، امتیاز بندی شده و با سطح آستانه هر کدام از مدل های ذخیره شده در فاز یادگیری مقایسه می شود. در صورتی که امتیاز گفتار نمونه از سطح آستانه آن مدل تجاوز نکند، گفتار به مدل مذکور تعلق خواهد داشت. به منظور تمایز بیشتر مدل ها از یکدیگر و در نتیجه تشخیص بهتر، از روش های هنجار سازی استفاده می شود. در این مقاله تلاش شده است تا با ترکیب هم زمان دو و یا چند روش هنجار سازی به بازدهی بالا تر جهت تشخیص هویت گوینده رسید.

Keywords:

تشخیص هویت گوینده , ضرایب کپسترال , ضرایب MFCC , سطح آستانه , روش های هنجار سازی

Authors

محمود حسینی

دانشجوی کارشناسی ارشد، دانشگاه صنعتی شاهرود

مرتضی زاهدی

عضو هیات علمی، دانشگاه صنعتی شاهرود

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

Ayadi M. and Kamel S, Karray F.Speech emotion recognition using ...
Ayadi M. and Kamel M.S.، Karray, F. Survey on speech ...
Dunn, Robert B., Reynolds, Douglas A., and Quatieri, Thomas F., ...
Gharavian D and Sheikhan M, Pezhmanpour M. GMM-based emotion recognition ...
Hamidi M and Mansorizadeh M. Emotion recognition from Persian speech ...
He L. and Lech M., Maddage N.C., Allen N.B. Study ...
Petrushin V.A Emotion recognition in speech signal: experimental study, development, ...
Schuller B and Rigoll G, M. Lang. Speech emotion recognizing ...
Ververidis D and Kotropoulos C. Fast sequential floating forward selection ...
Yang M. L. Emotion recognition from speech single using new ...
Yu F and Chang E, Xu Y, Shum H. Emotion ...
Xuang, Lu, Jiawn, Dang, "An Investigation of Dependencies between Frequency ...

نمایش کامل مراجع