CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

تشخیص جنسیت صدا با استفاده از آموزش فراگیر

عنوان مقاله: تشخیص جنسیت صدا با استفاده از آموزش فراگیر
شناسه ملی مقاله: ARGCONF03_014
منتشر شده در سومین کنفرانس سالانه ملی مهندسی برق، کامپیوتر و بیو الکتریک ایران در سال 1397
مشخصات نویسندگان مقاله:

محمد نعمتی - دانشجو، دانشکده مهندسی برق، دانشگاه پیام نور مرکز مشهد
حامد امین زاده - عضو هییت علمی، دانشکده مهندسی برق، دانشگاه پیام نور، تهران، ایران

خلاصه مقاله:
در این مقاله، روشی برای استخراج ویژگی از سیگنال گفتار، ارایه شده است. ایده کلیی روش آن است کی ساختار و چینش فیلترها در بانک فیلتر استخراج کننده ویژگی، متغیر و انعطاف پذیر باشد؛ درحالی که الگوریتم های معمول استخراج ویژگی مانند ضرایب کپسترال مبتنی بر فرکانس مل (mfcc) ، ساختاری ثابت دارند. در روش پیشنهادی، ابتدا، پهنای باند فرکانسی به قسمتهای مساوی تقسیم میشود. سپس با تشکیل یک معادله دیوفانیتن و درنظر گرفتن شرایط محدودکننده مناسب و در نهایت با حل این معادله، چین بهینه بانک فیلتر برمبنای داده های آموزشی دردسترس، به دست می آید . این امر موجب میشود که با تغییر داده های آموزشی، ساختار بانک فیلتر نیز تغییر کند و متناسب با کاربرد موردنظر، تنظیم گردد. نتایج پیاده سازی روی پایگاه داده TIMIT ، بییانگر بهبود کارایی الگوریتم پیشنهادی نسبت به روش ضرایب کپسترال مبتنی بر فرکانس مل (mfcc) میباشد.در این جا جداسازی به صورت باناظر است به این صورت که شامل دو مرحله آموزش و تست است. ابتدا در مرحله آموزش ویژگی ضرایب کپسترال مبتنی بر فرکانس مل از گفتار استخراج میشود و لیبلش نیز (جنس گوینده ) در دسترس است و دسته بندی کننده پرسپترون با آن آموزش می بیند و در مرحله تست از گفتار جدید ویژگی ضرایب کپسترال مبتنی بر فرکانس مل را استخراج میکنیم و این ویژگی ها را به دسته بندی کننده آموزش داده شده می دهیم و دسته بندی کننده لیبل ها رو یعنی جنس گوینده را به ما میدهد.

کلمات کلیدی:
تعیین زن یا مرد بودن، شبکه های عصبی ، ضرایب کپسترال

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/754149/