تشخیص و طبقه بندی گفتار افراد از طریق متدهای پردازش گفتار و شبکه های عصبی مصنوعی چند لایه پرسپترون پیشخور

Publish Year: 1399
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 624

This Paper With 9 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

SCECE05_052

تاریخ نمایه سازی: 25 دی 1399

Abstract:

سیگنال گفتار یکی از طبیعی ترین و سریع ترین روش های ارتباط مابین افراد است. بسیاری از سیستم ها توسط محققین مختلف طراحی شده اند تا حالات های مختلف گفتاری را از سیگنال گفتار شناسایی کنند. در تشخیص و بازشناسی گفتار، ویژگی هایی مانند زیر و بمی، انرژی و غیره استفاده می شود. در این تحقیق، بازشناسی برای حالت های مختلف گفتار اعم از غم، خنثی بودن، شاد بودن، تعجب و عصبانیت و.... به کار گرفته شده است. ورودی سیستم مورد نظر، شامل نمونه گفتار از 5 مرد و 5 زن می باشد که 10 جمله مختلف از 7 نوع حالت گفتاری احساساتی شامل حالت های(عصبانیت، کسالت، انزجار، ترس، خوشبختی، غم و اندوه و بی طرف) است. ویژگی های مختلف گفتاری از طریق MFCC استخراج و وارد شبکه عصبی پرسپترون چند لایه پیشخور شد که دقت بالایی را در طبقه بندی و بازشناسی انواع حالت های گفتاری را نشان می دهد.

Keywords:

پردازش گفتار , استخراج ویژگیها , ضرایب کپسترال فرکانس مل , شبکه عصبی پرسپترون چند لایه پیشخور

Authors

مسلم ساجد

گروه مهندسی کامپیوتر، واحد گرمی، دانشگاه آزاد اسلامی، گرمی، ایران

سجاد جهانبخش

گروه مهندسی کامپیوتر، واحد گرمی، دانشگاه آزاد اسلامی، گرمی، ایران

عباس میرزایی ثمرین

گروه مهندسی کامپیوتر، واحد گرمی، دانشگاه آزاد اسلامی، گرمی، ایران