مقدمه ای بر شناسایی گوینده مبتنی بر ضرایب MFCC و مدل سازی آماری
Publish place: The First National Conference on Computer Engineering and Information Technology of Payame Noor University
Publish Year: 1393
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,111
This Paper With 7 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
FNCEITPNU01_091
تاریخ نمایه سازی: 17 اسفند 1393
Abstract:
به کارگیری گفتار گویندگان برای شناسایی و تصدیق هویت افراد به دلیل سادگی استفاده از آن کاربرد فراوان دارد. هر سیستم شناسایی گوینده از دو فاز یادگیری و آزمایش تشکیل شده است. در بخش یادگیری، ویژگی های گفتار که مهم ترین آن ها ضرایب کپسترال اند با استفاده از روش MFCC استخراج می شوند. سپس با کمک روش های آماری مانند مدل پنهان مارکوف، مدل مخلوط گوسی و یا ماشین بردار پشتیبان، مدلی منحصر به فرد از صدای هر گوینده ایجاد، سطح آستانه ای برای مدل تعیین و در پایگاه داده ذخیره می گردد. در فاز آزمایش، گفتار نمونه، امتیاز بندی شده و با سطح آستانه هر کدام از مدل های ذخیره شده در فاز یادگیری مقایسه می شود. در صورتی که امتیاز گفتار نمونه از سطح آستانه آن مدل تجاوز نکند، گفتار به مدل مذکور تعلق خواهد داشت. به منظور تمایز بیشتر مدل ها از یکدیگر و در نتیجه تشخیص بهتر، از روش های هنجار سازی استفاده می شود. در این مقاله تلاش شده است تا با ترکیب هم زمان دو و یا چند روش هنجار سازی به بازدهی بالا تر جهت تشخیص هویت گوینده رسید.
Keywords:
Authors
محمود حسینی
دانشجوی کارشناسی ارشد، دانشگاه صنعتی شاهرود
مرتضی زاهدی
عضو هیات علمی، دانشگاه صنعتی شاهرود
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :