طراحی سیستم تشخیص جنسیت کاربران با استفاده از ویژگیهای سیگنالهای صوت و چهره انسان

فریده, دنیاگر; امیرحسین, قلعه خندابی

طراحی سیستم تشخیص جنسیت کاربران با استفاده از ویژگیهای سیگنالهای صوت و چهره انسان

عنوان مقاله: طراحی سیستم تشخیص جنسیت کاربران با استفاده از ویژگیهای سیگنالهای صوت و چهره انسان
شناسه ملی مقاله: STCONF06_179
منتشر شده در ششمین همایش ملی فناوریهای نوین در مهندسی برق، کامپیوتر و مکانیک ایران در سال 1402

مشخصات نویسندگان مقاله:

فریده دنیاگر - مهندسی نرم افزار دانشگاه غیاث الدین جمشید کاشانی
امیرحسین قلعه خندابی - مهندسی نرم افزار دانشگاه آزاد اسلامی واحد تهران شمال

خلاصه مقاله:

با توجه به تمام پیشرفت های صورت گرفته درزمینه سیستم های تشخیص جنسیت از روی چهره و صدای افراد هنوز استفاده از این سیستم ها در مکانهای عمومی مانند استخرها، مساجد، کلاسهای جنسیتی و ... که به تفکیک جنسیت نیاز دارد موردتوجه قرار نگرفته است . ازآنجایی که حساسیت در مورد عملکرد سیستم های هوش مصنوعی در این مکان های خاص بسیار بالاست بنابراین میزان خطا در این سیستم ها باید به حداقل برسد. ما در این پروژه روشهایی که تاکنون به منظور تشخیص جنسیت از روی صدا و چهره مورداستفاده قرارگرفته است را بررسی کردیم و درنهایت از روشی که دارای سرعت خوب و دقت قابل باشد استفاده کردیم . ما در این پژوهش به منظور پردازش صوت ویژگی های فرکانس صدا ، فرکانس اساسی صدا و فرکانس غالب صدا را استخراج کردیم ، سپس این ویژگی ها را با الگوریتم شبکه عصبی مصنوعی آموزش دادیم . نتایج این پژوهش نشان داد که دقت پیش بینی جنسیت از روی صدا در حدود ۹۹% است . همچنین به منظور پردازش تصویر از شبکه های عصبی کانولوشن عمیق با عمق کم و تعداد کمتر نورونها (افزایش سرعت و کاهش محاسبات) استفاده کردیم . در ادامه به منظور اطمینان بیش تر از شبکه مورداستفاده و اینکه آیا شبکه های با عمق بیش تر تا چه حد می توانند باعث بهبود دقت سیستم شوند تصاویر را با شبکه AlexNet آموزش دادیم . نتایج این بررسی نشان داد که هر دو شبکه دقتی در حدود ۸۶% داشتند و باید گفت با توجه به نزدیک بودن دقت پیش بینی این دو شبکه به یکدیگر استفاده از شبکه با عمق کمتر به دلیل کاهش محاسبات و افزایش سرعت منطقی تر به نظر می رسد.. درنهایت با استفاده از الگوریتم ترتیبی (استفاده از صوت و چهره به صورت مکمل ) میزان دقت در تشخیص این سیستم ها را بالاتر بردیم . نتایج این پژوهش نشان داد که می توان با استفاده از سیگنالهای صوت و چهره انسان به صورت الگوریتم ترتیبی میزان خطا در سیستم طراحی شده را کاهش داد.

کلمات کلیدی:

کلاس بندی جنسیت ، شبکه های عصبی کانولوشن عمیق ، اندازهگیری ویژگیهای آکوستیک ، پردازش صدا، پردازش تصویر

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1744241/