CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

تشخیص و طبقه بندی گفتار افراد از طریق متدهای پردازش گفتار و شبکه های عصبی مصنوعی چند لایه پرسپترون پیشخور

عنوان مقاله: تشخیص و طبقه بندی گفتار افراد از طریق متدهای پردازش گفتار و شبکه های عصبی مصنوعی چند لایه پرسپترون پیشخور
شناسه ملی مقاله: SCECE05_052
منتشر شده در پنجمین کنفرانس ملی محاسبات نرم در مهندسی برق و کامپیوتر در سال 1399
مشخصات نویسندگان مقاله:

مسلم ساجد - گروه مهندسی کامپیوتر، واحد گرمی، دانشگاه آزاد اسلامی، گرمی، ایران
سجاد جهانبخش - گروه مهندسی کامپیوتر، واحد گرمی، دانشگاه آزاد اسلامی، گرمی، ایران
عباس میرزایی ثمرین - گروه مهندسی کامپیوتر، واحد گرمی، دانشگاه آزاد اسلامی، گرمی، ایران

خلاصه مقاله:
سیگنال گفتار یکی از طبیعی ترین و سریع ترین روش های ارتباط مابین افراد است. بسیاری از سیستم ها توسط محققین مختلف طراحی شده اند تا حالات های مختلف گفتاری را از سیگنال گفتار شناسایی کنند. در تشخیص و بازشناسی گفتار، ویژگی هایی مانند زیر و بمی، انرژی و غیره استفاده می شود. در این تحقیق، بازشناسی برای حالت های مختلف گفتار اعم از غم، خنثی بودن، شاد بودن، تعجب و عصبانیت و.... به کار گرفته شده است. ورودی سیستم مورد نظر، شامل نمونه گفتار از 5 مرد و 5 زن می باشد که 10 جمله مختلف از 7 نوع حالت گفتاری احساساتی شامل حالت های(عصبانیت، کسالت، انزجار، ترس، خوشبختی، غم و اندوه و بی طرف) است. ویژگی های مختلف گفتاری از طریق MFCC استخراج و وارد شبکه عصبی پرسپترون چند لایه پیشخور شد که دقت بالایی را در طبقه بندی و بازشناسی انواع حالت های گفتاری را نشان می دهد.

کلمات کلیدی:
پردازش گفتار، استخراج ویژگیها، ضرایب کپسترال فرکانس مل، شبکه عصبی پرسپترون چند لایه پیشخور

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1143206/