CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

الگوریتم شناسایی احساسات چهره افراد مبتنی بر ترکیب شبکه های عصبی عمیق U-Net و VGG-16

عنوان مقاله: الگوریتم شناسایی احساسات چهره افراد مبتنی بر ترکیب شبکه های عصبی عمیق U-Net و VGG-16
شناسه ملی مقاله: ELEMECHCONF06_009
منتشر شده در ششمین کنفرانس ملی پژوهش های کاربردی در مهندسی برق، مکانیک و مکاترونیک در سال 1399
مشخصات نویسندگان مقاله:

سحر محمد حسینی - دانشکده مهندسی، دانشگاه خیام، مشهد، ایران
تکتم خالوزاده - دانشکده مهندسی، دانشگاه خیام، مشهد، ایران
رضا نصیری پور - دانشکده مهندسی برق و کامپیوتر، دانشگاه بیرجند، بیرجند، ایران

خلاصه مقاله:
حالت چهره افراد نقش مهمی در درک احساسات و تعامل اجتماعی آنها بازی میکند. در یک دهه اخیر پژوهش های زیادی در این حوزه انجام گرفته شده است. از جمله حالتهای چهرهای که در سیستم شناسایی به کار گرفته میشوند عبارتند از: شادی، غمگینی، ترس، نفرت، تعجب، خشم و غیره. روشهای گوناگونی برای تشخیص حالت چهره پیشنهاد شده است که مبتنی بر سه گروه روشهای مبتنی بر ویژگیهای هندسی، مبتنی بر ویژگیهای ظاهری و روشهای مبتنی بر ترکیب ویژگی های ظاهری و هندسی میباشند. هدف این مقاله توسعه یک روش تشخیص حالت چهره است که توانایی تشخیص حالت چهره با دقت بالا را داشته باشد. به همین منظور از شبکه های عصبی عمیق استفاده شده است که در برابر تغیرات روشنایی، دوران، انسداد، تصاویر نویزی و غیره مقاوم است. در این مقاله و با استفاده از مدل یادگیری عمیق، شبکه کانولوشنی ترکیبی برای شناسایی حالت چهره افراد پیشنهاد شده است. اولین مرحله روش پیشنهادی، روش پیشپردازش میباشد که باعث افزایش کیفیت تصویر و کاهش نویز موجود در تصویر میشود. در ادامه از ترکیب شبکه های عصبی U-Net و VGG-16 استفاده شده است که علاوه بر بازگشتی بودن در معماری شبکه، باعث افزایش دقت روش پیشنهادی در تشخیص حالت چهره افراد میشود. تعداد لایه های استفاده شده در روش پیشنهادی نسبت به مدل های شناخته شده کمتر است. در لایه ادغام به جای استفاده از تابع ماکزیمم، تابع میانگین گیری استفاده شده است. همچنین تعداد دسته ها 64 در نظر گرفته شده است که باعث بهبود عملکرد روش پیشنهادی گردیده است. در این مقاله از 70 درصد تصاویر پایگاه داده به عنوان داده های آموزشی و از 30 درصد به عنوان داده های آزمون استفاده شده است. پایگاه داده استفاده شده در این پژوهش پایگاه داده CK+ است. نتایج حاصل از روش پیشنهادی بر روی پایگاه داده CK+ بیانگر کارآمد بودن روش پیشنهادی است و دقت حاصل از روش پیشنهادی برابر با 99/12 درصد میباشد.

کلمات کلیدی:
حالت چهره، شبکه عصبی، آموزش دادن، ویژگیهای عمیق، یادگیری، دسته ها.

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1129707/