یک رویکرد ترکیبی مبتنی بر یادگیری عمیق جهت تشخیص فعالیت صدا در حضور نویز گذرا

Publish Year: 1400
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 469

This Paper With 15 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ELCM04_108

تاریخ نمایه سازی: 30 شهریور 1400

Abstract:

تشخیص فعالیت صدا، شاخهای از علم پردازش سیگنال و یکی از بخشهای بسیار مهم در پردازش سیگنالهای صوتی بوده و در بسیاری از سیستم های مخابراتی و صوتی مانند بازشناسی گفتار، بهسازی گفتار و حذف نویز مورد استفاده قرار میگیرد. با توجه به دریافت نویز محیطی به هنگام ضبط گفتار انسان، نیاز به سیستمی برای تشخیص بخشهای گفتار در سیگنال های صوتی ضبط شده میباشد. هدف از این مقاله، بررسی یک سیستم تشخیص فعالیت صدایی است که با به کارگیری شبکه های عصبی بازگشتی و خودرمزنگار، و استخراج ویژگیهای ضرایب کپسترال فرکانس مل))MFCC و مشتقات اول و دوم آنها، به متمایز ساختن بخشهای گفتاری از بخشهای غیرگفتاری در یک محیط نویزی بپردازد. تا کنون روشهای متعددی در این زمینه مطرح شدهاند که کارایی آنها وابستگی زیادی به شرایط نویز زمینه ی موجود در محیط دارد، به گونه ای که اگر توان نویز بر توان گفتار غالب باشد و یا آمارگان نویز متغیر با زمان باشد، از کارایی اکثر روشهای موجود، کاسته خواهد شد. از اینرو، در این مقاله به بررسی روشی پرداخته شده است که از کارایی الزم در شرایطی با نسبت سیگنال به نویز پایین برخوردار بوده و ضمنا در مواجهه با نویزهای غیر ایستان نیز عملکرد قابل قبولی دارد. به این منظور، با ایجاد شرایط مورد نظر، به کمک نویزهای غیر ایستان، همچون نویز موسیقی و هم همه، دقت روشهای موجود و نیز روش ارائه شده، مورد مقایسه قرار گرفته شده است. بر اساس نتایج بدست آمده، روش پیشنهادی نسبت به روشهای دیگر عملکرد بهتری از خود نشان داده است.

Authors

سیدمهدی حسینی

کارشناسی ارشد، گروه علوم کامپیوتر، واحد بابلسر، دانشگاه مازندران، بابلسر، ایران

علی ولی نژاد

استادیار، گروه علوم کامپیوتر، واحد بابلسر، دانشگاه مازندران، بابلسر، ایران