CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

یک رویکرد ترکیبی مبتنی بر یادگیری عمیق جهت تشخیص فعالیت صدا در حضور نویز گذرا

عنوان مقاله: یک رویکرد ترکیبی مبتنی بر یادگیری عمیق جهت تشخیص فعالیت صدا در حضور نویز گذرا
شناسه ملی مقاله: ELCM04_108
منتشر شده در چهارمین کنفرانس بین المللی مهندسی برق، کامپیوتر و مکانیک در سال 1400
مشخصات نویسندگان مقاله:

سیدمهدی حسینی - کارشناسی ارشد، گروه علوم کامپیوتر، واحد بابلسر، دانشگاه مازندران، بابلسر، ایران
علی ولی نژاد - استادیار، گروه علوم کامپیوتر، واحد بابلسر، دانشگاه مازندران، بابلسر، ایران

خلاصه مقاله:
تشخیص فعالیت صدا، شاخهای از علم پردازش سیگنال و یکی از بخشهای بسیار مهم در پردازش سیگنالهای صوتی بوده و در بسیاری از سیستم های مخابراتی و صوتی مانند بازشناسی گفتار، بهسازی گفتار و حذف نویز مورد استفاده قرار میگیرد. با توجه به دریافت نویز محیطی به هنگام ضبط گفتار انسان، نیاز به سیستمی برای تشخیص بخشهای گفتار در سیگنال های صوتی ضبط شده میباشد. هدف از این مقاله، بررسی یک سیستم تشخیص فعالیت صدایی است که با به کارگیری شبکه های عصبی بازگشتی و خودرمزنگار، و استخراج ویژگیهای ضرایب کپسترال فرکانس مل))MFCC و مشتقات اول و دوم آنها، به متمایز ساختن بخشهای گفتاری از بخشهای غیرگفتاری در یک محیط نویزی بپردازد. تا کنون روشهای متعددی در این زمینه مطرح شدهاند که کارایی آنها وابستگی زیادی به شرایط نویز زمینه ی موجود در محیط دارد، به گونه ای که اگر توان نویز بر توان گفتار غالب باشد و یا آمارگان نویز متغیر با زمان باشد، از کارایی اکثر روشهای موجود، کاسته خواهد شد. از اینرو، در این مقاله به بررسی روشی پرداخته شده است که از کارایی الزم در شرایطی با نسبت سیگنال به نویز پایین برخوردار بوده و ضمنا در مواجهه با نویزهای غیر ایستان نیز عملکرد قابل قبولی دارد. به این منظور، با ایجاد شرایط مورد نظر، به کمک نویزهای غیر ایستان، همچون نویز موسیقی و هم همه، دقت روشهای موجود و نیز روش ارائه شده، مورد مقایسه قرار گرفته شده است. بر اساس نتایج بدست آمده، روش پیشنهادی نسبت به روشهای دیگر عملکرد بهتری از خود نشان داده است.

کلمات کلیدی:
روش چند مدلی، یادگیری عمیق، بازشناسی گفتار، انتخاب ویژگی، تشخیص فعالیت صدا.

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1271655/