تشخیص جنسیت صدا با استفاده از شبکه های عصبی عمیق

Publish Year: 1401
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 227

This Paper With 9 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ICCSE02_009

تاریخ نمایه سازی: 14 اسفند 1401

Abstract:

تشخیص جنسیت صدا نقش مهمی در سیستم های پردازش گفتار و سیستم تشخیص هویت مبتنی بر صدا دارد. با توجه به رشد فوقالعاده فناوری های هوش مصنوعی و سیستم های کامپیوتری می توان با استفاده از شبکه های عصبی عمیق داده های صوت را برای تشخیص جنسیت گوینده طبقه بندی کرد. سیستم تشخیص جنسیت صدا با لهجه و زبان انگلیسی پیش ازاین ، موردبررسی و پیاده سازی قرارگرفته است اما باوجود تفاوت بسیار زیاد بین زبان، گویش و لهجه انگلیسی و فارسی این کار بر روی مجموعه داده فارسی برای اولین بار انجام گرفت . در این پژوهش از شبکه های عصبی عمیق ۱D-CNN, ۲D-CNN, LSTM, GRU, SimpleRNN برای دسته بندی مجموعه داده صوت به منظور تشخیص و بازشناسانی استفاده شده که درنهایت شبکه عصبی ۲D-CNN با درصد صحت ۹۹% بهترین شبکه عصبی برای تشخیص جنسیت صدا شناخته شد.

Authors

سیدامیررضا کبودیان

دانشجوی کارشناسی مهندسی کامپیوتر، دانشکده فنی مهندسی، واحد خوراسگان، دانشگاه آزاد اسلامی، اصفهان، ایران

نیما رجائیان

دانشکده مهندسی برق، واحد نجف آباد، دانشگاه آزاد اسلامی، نجف آباد، ایران،عضو مرکز تحقیقات پردازش دیجیتال و بینایی ماشین، واحد نجف آباد، دانشگاه آزاد اسلامی، نجف آباد، ایران