تشخیص احساس از سیگنال گفتار به کمک روشهای افزایش داده متخاصمی

Publish Year: 1400
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 429

This Paper With 18 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ISCEE20_045

تاریخ نمایه سازی: 6 مهر 1400

Abstract:

امروزه با ماشینی شدن زندگی روزمره، پردازش گفتار برای تعامل بین انسان و ماشین از اهمیت بالایی برخوردار شده است.تشخیص احساسات از گفتار، برای درک دقیق معانی جملات و همچنین ایجاد واکنش مناسب به گوینده، از سوی ماشینضروری است. احساس به عوامل متعددی از جمله جنسیت، تن صدا، زبان و برخی ویژگی های فردی وابسته است که کارتشخیص آن را سخت می کند. هرچه ویژگی های استخراج شده از گفتار بیشتر باشد، نیاز به داده های بیشتری برای آموزششبکه عصبی می باشد و تنها در صورت وجود داده به تعداد کافی، منجر به دقت بهتر در طبقه بندی می شود. یکی از عمده ترینمشکلات موجود در تشخیص احساس از گفتار، کمبود داده در هر کلاس جهت آموزش شبکه عصبی است. در صورت عدموجود تعداد زیاد داده می توان از روش های افزایش داده استفاده کرد.این مقاله با هدف ایجاد یک شبکه مولد متخاصمی جهت افزایش داده ها در یک سیستم تشخیص احساس از گفتار متمرکزشده است . برای هر احساس به صورت جداگانه یک شبکه مولد متخاصمی پیشنهاد می شود که از یک سو شباهت بیننمونه های واقعی و تولید شده را تضمین کند و از طرف دیگر باعث ایجاد تمایز عاطفی در بین نمونه های تولید شده بینکلاس های مختلف شود. کیفیت داده های مصنوعی در هر دو آزمایش درون کلاسی و بین کلاسی مورد ارزیابی قرار می گیردو علاوه بر این، تلاش می شود با استخراج و تکثیر ویژگی های سطح بالا از ویژگی های صوتی گفتار، تشخیص احساس ازگفتار با پنج کلاس احساسی با دقت بالاتری صورت پذیرد.

Keywords:

تشخیص احساس از گفتار , افزایش داده , یادگیری عمیق , شبکه های مولد متخاصمی

Authors

آرش شیلاندری

دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی شاهرود، شاهرود، ایران

حسین مروی

دانشیار دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی شاهرود، شاهرود، ایران

حسین خسروی

دانشیار دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی شاهرود، شاهرود، ایران