دسته بندی محیط صوتی مبتنی بر ویژگی ترکیبی جدید و حافظه طولانی - کوتاه مدت دوطرفه

Publish Year: 1399
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 407

This Paper With 10 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ITCT11_047

تاریخ نمایه سازی: 18 اردیبهشت 1400

Abstract:

دسته بندی محیط صوتی، شناسایی نوع محیط آکوستیکی از روی صداهای موجود در آن است که در زمینه های متعددی، همچون مراقبت های امنیتی، بازیابی اطلاعات از محتوای چندرسانه ای و غیره، کاربرد دارد. در اغلب پژوهش های انجام شده در این زمینه، از ویژگی های مبتنی بر تبدیل فوریه زمان کوتاه، مانند ضرایب کپسترال فرکانسی مل (MFCC) و اسپکتوگرام مل به عنوان ورودی طبقه بندی کننده استفاده شده است. در این مقاله، ویژگی جدیدی از ترکیب ویژگی های صوتی ضرایب کپسترال فرکانسی گاماتون (GFCC) و ضرایب کپسترال نرمالیزه شده توان (PNCC) به همراه مشتقات مرتبه اول و دوم آن ها به منظور طبقه بندی محیط صوتی پیشنهاد می شود. به منظور دسته بندی، از شبکه های عصبی حافظه طولانی - کوتاه مدت دوطرفه (BiLSTM) و پرسپترون چندلایه (MLP) استفاده می شود. نتایج، حاکی از عملکرد بهتر ویژگی ترکیبی پیشنهادی، با ساختار BiLSTM، نسبت به سایر روش های استخراج ویژگی است. بالاترین خروجی طبقه بندی مربوط به استفاده از ویژگی ترکیبی حاصل از GFCC و مشتقات اول و دوم آن با PNCC با درصد صحت ۷۹/۹ است.

Keywords:

دسته بندی محیط صوتی , ضرایب کپسترال فرکانسی گاماتون , ضرایب کپسترال نرمالیزه شده توان , حافظه طولانی - کوتاه مدت دوطرفه , شبکه عصبی پرسپترون چندلایه

Authors

مسعود گراوانچی زاده

گروه مهندسی پزشکی، دانشکده مهندسی برق و کامپیوتر، دانشگاه تبریز، تبریز، ایران

سپیده اختری خسروشاهی

گروه مهندسی پزشکی، دانشکده مهندسی برق و کامپیوتر، دانشگاه تبریز، تبریز، ایران

سحر ذاکری

گروه مهندسی پزشکی، دانشکده مهندسی برق و کامپیوتر، دانشگاه تبریز، تبریز، ایران