دسته بندی محیط صوتی مبتنی بر ویژگی ترکیبی جدید و حافظه طولانی - کوتاه مدت دوطرفه

مسعود, گراوانچی زاده; سپیده, اختری خسروشاهی; سحر, ذاکری

دسته بندی محیط صوتی مبتنی بر ویژگی ترکیبی جدید و حافظه طولانی - کوتاه مدت دوطرفه

عنوان مقاله: دسته بندی محیط صوتی مبتنی بر ویژگی ترکیبی جدید و حافظه طولانی - کوتاه مدت دوطرفه
شناسه ملی مقاله: ITCT11_047
منتشر شده در یازدهمین کنفرانس بین المللی فناوری اطلاعات،کامپیوتر و مخابرات در سال 1399

مشخصات نویسندگان مقاله:

مسعود گراوانچی زاده - گروه مهندسی پزشکی، دانشکده مهندسی برق و کامپیوتر، دانشگاه تبریز، تبریز، ایران
سپیده اختری خسروشاهی - گروه مهندسی پزشکی، دانشکده مهندسی برق و کامپیوتر، دانشگاه تبریز، تبریز، ایران
سحر ذاکری - گروه مهندسی پزشکی، دانشکده مهندسی برق و کامپیوتر، دانشگاه تبریز، تبریز، ایران

خلاصه مقاله:

دسته بندی محیط صوتی، شناسایی نوع محیط آکوستیکی از روی صداهای موجود در آن است که در زمینه های متعددی، همچون مراقبت های امنیتی، بازیابی اطلاعات از محتوای چندرسانه ای و غیره، کاربرد دارد. در اغلب پژوهش های انجام شده در این زمینه، از ویژگی های مبتنی بر تبدیل فوریه زمان کوتاه، مانند ضرایب کپسترال فرکانسی مل (MFCC) و اسپکتوگرام مل به عنوان ورودی طبقه بندی کننده استفاده شده است. در این مقاله، ویژگی جدیدی از ترکیب ویژگی های صوتی ضرایب کپسترال فرکانسی گاماتون (GFCC) و ضرایب کپسترال نرمالیزه شده توان (PNCC) به همراه مشتقات مرتبه اول و دوم آن ها به منظور طبقه بندی محیط صوتی پیشنهاد می شود. به منظور دسته بندی، از شبکه های عصبی حافظه طولانی - کوتاه مدت دوطرفه (BiLSTM) و پرسپترون چندلایه (MLP) استفاده می شود. نتایج، حاکی از عملکرد بهتر ویژگی ترکیبی پیشنهادی، با ساختار BiLSTM، نسبت به سایر روش های استخراج ویژگی است. بالاترین خروجی طبقه بندی مربوط به استفاده از ویژگی ترکیبی حاصل از GFCC و مشتقات اول و دوم آن با PNCC با درصد صحت ۷۹/۹ است.

کلمات کلیدی:

دسته بندی محیط صوتی، ضرایب کپسترال فرکانسی گاماتون، ضرایب کپسترال نرمالیزه شده توان، حافظه طولانی - کوتاه مدت دوطرفه، شبکه عصبی پرسپترون چندلایه

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1197115/