CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

افزایش داده مبتنی بر شبکه ی عصبی مولد رقابتی چرخشی با هدف بهبود کارایی بازشناسی احساس از گفتار

عنوان مقاله: افزایش داده مبتنی بر شبکه ی عصبی مولد رقابتی چرخشی با هدف بهبود کارایی بازشناسی احساس از گفتار
شناسه ملی مقاله: CSICC28_011
منتشر شده در بیست و هشتمین کنفرانس بین المللی کامپیوتر انجمن کامپیوتر ایران در سال 1401
مشخصات نویسندگان مقاله:

فرنوش کریمی - پژوهشکده فضای مجازی، دانشگاه شهید بهشتی، تهران، ایران
شیما طبیبیان - استادیار، پژوهشکده فضای مجازی، دانشگاه شهید بهشتی تهران، تهران، ایران

خلاصه مقاله:
بازشناسی احساس از گفتار، یک زمینه ی فعال تحقیقاتی در حوزه پردازش گفتار محسوب می شود. اما علیرغم پیشرفت های گسترده ای که در حوزه ی یادگیری ماشین حاصل شده است، کارایی سیستم های بازشناسی احساس از گفتار چندان مطلوب نمی باشد. یکی از اصلی ترین دلایل آن کمبود دادگان احساسی خصوصا از نوع برچسب دار است. در این مقاله، با الهام از پژوهش های انجام شده در این حوزه به یکی از راه حل های فراگیر چند سال اخیر در رابطه با افزایش دادگان یعنی شبکه های مولد رقابتی پرداخته می شود. معماری در نظر گرفته شده یک شبکه ی مولد رقابتی چرخشی است که با استفاده از یک مجموعه داده ی بدون برچسب سعی می کند به تولید بردارهای ویژگی جدید که بازنمایی از یک احساس مورد نظر در مجموعه داده ی برچسب دار هستند بپردازد و به این شکل منجر به افزایش داده برای مجموعه داده ی برچسب دار می شود. این مدل بر روی دو مجموعه ی دادگان IEMOCAP و ShEMO ارزیابی شده است. نتایج حاصل حاکی از آن است که استفاده از بردارهای ویژگی تولید شده توسط شبکه در کنار بردارهای ویژگی واقعی برای مجموعه ی دادگان IEMOCAP و ShEMO، به ترتیب باعث بهبود بازخوانی به میزان ۱۴ درصد و نه درصد با استفاده از دسته بند ANN و نه درصد و ده درصد با استفاده از دسته بند CNN می شود

کلمات کلیدی:
بازشناسی احساس از گفتار، شبکه های مولد رقابتی چرخشی، افزایش داده، یادگیری عمیق

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1623402/