افزایش داده مبتنی بر شبکه ی عصبی مولد رقابتی چرخشی با هدف بهبود کارایی بازشناسی احساس از گفتار

Publish Year: 1401
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 236

This Paper With 7 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CSICC28_011

تاریخ نمایه سازی: 27 اسفند 1401

Abstract:

بازشناسی احساس از گفتار، یک زمینه ی فعال تحقیقاتی در حوزه پردازش گفتار محسوب می شود. اما علیرغم پیشرفت های گسترده ای که در حوزه ی یادگیری ماشین حاصل شده است، کارایی سیستم های بازشناسی احساس از گفتار چندان مطلوب نمی باشد. یکی از اصلی ترین دلایل آن کمبود دادگان احساسی خصوصا از نوع برچسب دار است. در این مقاله، با الهام از پژوهش های انجام شده در این حوزه به یکی از راه حل های فراگیر چند سال اخیر در رابطه با افزایش دادگان یعنی شبکه های مولد رقابتی پرداخته می شود. معماری در نظر گرفته شده یک شبکه ی مولد رقابتی چرخشی است که با استفاده از یک مجموعه داده ی بدون برچسب سعی می کند به تولید بردارهای ویژگی جدید که بازنمایی از یک احساس مورد نظر در مجموعه داده ی برچسب دار هستند بپردازد و به این شکل منجر به افزایش داده برای مجموعه داده ی برچسب دار می شود. این مدل بر روی دو مجموعه ی دادگان IEMOCAP و ShEMO ارزیابی شده است. نتایج حاصل حاکی از آن است که استفاده از بردارهای ویژگی تولید شده توسط شبکه در کنار بردارهای ویژگی واقعی برای مجموعه ی دادگان IEMOCAP و ShEMO، به ترتیب باعث بهبود بازخوانی به میزان ۱۴ درصد و نه درصد با استفاده از دسته بند ANN و نه درصد و ده درصد با استفاده از دسته بند CNN می شود

Keywords:

بازشناسی احساس از گفتار , شبکه های مولد رقابتی چرخشی , افزایش داده , یادگیری عمیق

Authors

فرنوش کریمی

پژوهشکده فضای مجازی، دانشگاه شهید بهشتی، تهران، ایران

شیما طبیبیان

استادیار، پژوهشکده فضای مجازی، دانشگاه شهید بهشتی تهران، تهران، ایران