دسته بندی گویندگان بر مبنای قطعات یک ثانیه گفتارض
Publish Year: 1391
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 955
متن کامل این Paper منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل Paper (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICEEE04_037
تاریخ نمایه سازی: 6 مهر 1391
Abstract:
در این مقاله یک روش برای شناسایی گوینده ناوابسته به متن ارائه شده است. تعداد 22 گوینده ) 12 گوینده مرد و 12 گوینده زن( از بانک اطلاعاتی TIMIT انتخاب شده و برای هر گوینده 12 جمله استفاده شده است. گفتار گویندگان به قابهای 22 میلی ثانیه تقسیم شده و برای هر قاب 13 ضریب MFCC به عنوان بردار ویژگی آن قاب محاسبه شده واز ماشین بردار پشتیبان SVM SVM برای دسته بندی گویندگان استفاده شده است. دسته بندی کننده های SVM را با بردارهای ویژگی قابها آموزش داده و برای دسته بندی گویندگان قابهای گفتار گوینده مجهول به SVM هااعمال می شوند. دسته بندی را از روی 122 قاب متوالی، معادل یک ثانیه، انجام شده است و خطای 1.8 درصد بدست آمده است.
Keywords:
Authors
هادی سمائی رهنی
دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد گناباد، گروه برق
جلیل شیرازی
استادیار دانشگاه آزاد اسلامی واحد گناباد، گروه برق
هادی جوان
دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد گناباد- گروه برق
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :