یک رویکرد ترکیبی مبتنی بر یادگیری عمیق جهت تشخیص فعالیت صدا در حضور نویز گذرا

سیدمهدی حسینی; علی ولی نژاد

یک رویکرد ترکیبی مبتنی بر یادگیری عمیق جهت تشخیص فعالیت صدا در حضور نویز گذرا

Publish place: Fourth International Conference on Electrical, Computer and Mechanical Engineering

Publish Year: 1400

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 15 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > یادگیری عمیق

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/1271655

شناسه ملی سند علمی:

ELCM04_108

تاریخ نمایه سازی: 30 شهریور 1400

Abstract:

تشخیص فعالیت صدا، شاخهای از علم پردازش سیگنال و یکی از بخشهای بسیار مهم در پردازش سیگنالهای صوتی بوده و در بسیاری از سیستم های مخابراتی و صوتی مانند بازشناسی گفتار، بهسازی گفتار و حذف نویز مورد استفاده قرار میگیرد. با توجه به دریافت نویز محیطی به هنگام ضبط گفتار انسان، نیاز به سیستمی برای تشخیص بخشهای گفتار در سیگنال های صوتی ضبط شده میباشد. هدف از این مقاله، بررسی یک سیستم تشخیص فعالیت صدایی است که با به کارگیری شبکه های عصبی بازگشتی و خودرمزنگار، و استخراج ویژگیهای ضرایب کپسترال فرکانس مل))MFCC و مشتقات اول و دوم آنها، به متمایز ساختن بخشهای گفتاری از بخشهای غیرگفتاری در یک محیط نویزی بپردازد. تا کنون روشهای متعددی در این زمینه مطرح شدهاند که کارایی آنها وابستگی زیادی به شرایط نویز زمینه ی موجود در محیط دارد، به گونه ای که اگر توان نویز بر توان گفتار غالب باشد و یا آمارگان نویز متغیر با زمان باشد، از کارایی اکثر روشهای موجود، کاسته خواهد شد. از اینرو، در این مقاله به بررسی روشی پرداخته شده است که از کارایی الزم در شرایطی با نسبت سیگنال به نویز پایین برخوردار بوده و ضمنا در مواجهه با نویزهای غیر ایستان نیز عملکرد قابل قبولی دارد. به این منظور، با ایجاد شرایط مورد نظر، به کمک نویزهای غیر ایستان، همچون نویز موسیقی و هم همه، دقت روشهای موجود و نیز روش ارائه شده، مورد مقایسه قرار گرفته شده است. بر اساس نتایج بدست آمده، روش پیشنهادی نسبت به روشهای دیگر عملکرد بهتری از خود نشان داده است.

Keywords:

روش چند مدلی , یادگیری عمیق , بازشناسی گفتار , انتخاب ویژگی , تشخیص فعالیت صدا.

Authors

سیدمهدی حسینی

کارشناسی ارشد، گروه علوم کامپیوتر، واحد بابلسر، دانشگاه مازندران، بابلسر، ایران

علی ولی نژاد

استادیار، گروه علوم کامپیوتر، واحد بابلسر، دانشگاه مازندران، بابلسر، ایران