تشخیص جنسیت صدا با استفاده از آموزش فراگیر

Publish Year: 1397
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 996

This Paper With 6 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ARGCONF03_014

تاریخ نمایه سازی: 26 مرداد 1397

Abstract:

در این مقاله، روشی برای استخراج ویژگی از سیگنال گفتار، ارایه شده است. ایده کلیی روش آن است کی ساختار و چینش فیلترها در بانک فیلتر استخراج کننده ویژگی، متغیر و انعطاف پذیر باشد؛ درحالی که الگوریتم های معمول استخراج ویژگی مانند ضرایب کپسترال مبتنی بر فرکانس مل (mfcc) ، ساختاری ثابت دارند. در روش پیشنهادی، ابتدا، پهنای باند فرکانسی به قسمتهای مساوی تقسیم میشود. سپس با تشکیل یک معادله دیوفانیتن و درنظر گرفتن شرایط محدودکننده مناسب و در نهایت با حل این معادله، چین بهینه بانک فیلتر برمبنای داده های آموزشی دردسترس، به دست می آید . این امر موجب میشود که با تغییر داده های آموزشی، ساختار بانک فیلتر نیز تغییر کند و متناسب با کاربرد موردنظر، تنظیم گردد. نتایج پیاده سازی روی پایگاه داده TIMIT ، بییانگر بهبود کارایی الگوریتم پیشنهادی نسبت به روش ضرایب کپسترال مبتنی بر فرکانس مل (mfcc) میباشد.در این جا جداسازی به صورت باناظر است به این صورت که شامل دو مرحله آموزش و تست است. ابتدا در مرحله آموزش ویژگی ضرایب کپسترال مبتنی بر فرکانس مل از گفتار استخراج میشود و لیبلش نیز (جنس گوینده ) در دسترس است و دسته بندی کننده پرسپترون با آن آموزش می بیند و در مرحله تست از گفتار جدید ویژگی ضرایب کپسترال مبتنی بر فرکانس مل را استخراج میکنیم و این ویژگی ها را به دسته بندی کننده آموزش داده شده می دهیم و دسته بندی کننده لیبل ها رو یعنی جنس گوینده را به ما میدهد.

Keywords:

تعیین زن یا مرد بودن , شبکه های عصبی , ضرایب کپسترال

Authors

محمد نعمتی

دانشجو، دانشکده مهندسی برق، دانشگاه پیام نور مرکز مشهد

حامد امین زاده

عضو هییت علمی، دانشکده مهندسی برق، دانشگاه پیام نور، تهران، ایران