جداسازی گفتار از موزیک و سکوت با ویژگی جدید و زمان- بلند نرخ گذر از میانگین چند بانده

محمد رسول کهریزی; سیدجهانشاه کبودیان

جداسازی گفتار از موزیک و سکوت با ویژگی جدید و زمان- بلند نرخ گذر از میانگین چند بانده

Publish place: چهارمین کنفرانس ملی و دومین کنفرانس بین المللی پژوهش های کاربردی در مهندسی برق، مکانیک و مکاترونیک

Publish Year: 1395

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 9 Page And PDF and WORD Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/626566

شناسه ملی سند علمی:

ELEMECHCONF04_257

تاریخ نمایه سازی: 11 مرداد 1396

Abstract:

برای شناسایی و نشانه گذاری قطعه هایی از سیگنال های صوتی که شامل گفتار عادی (نه موسیقایی) انسان است و جداسازی آن قسمت ها از قسمت هایی که شامل گفتار نمی باشد مانند سکوت، موزیک و نویز، از سیستم های جداساز گفتار استفاده می شود. با این تعریف، سیستم های جداساز گفتار از موزیک را می توان نوع خاص و شاید دقیق تری از سیستم های آشکارساز گفتار به حساب آورد زیرا که در سیستم های جداساز گفتار از موزیک، در برخی حالات باید گفتارهای عادی انسان از گفتار های موسیقایی تمایز داده شوند و این امر نیازمند دقت بالاتری برای تمایز این حالت از گفتار می باشد. در اینجا می خواهیم یک ویژگی جدید و موثر در سیستم های جداسازی گفتار را با عنوان ویژگی زمان بلند نرخ گذر از میانگین چندبانده Long-Term Multi-Band Average-Crossing Rate (LTMBACR) ، معرفی کنیم که از مشخصه های آن می توان به مقاوم بودن در برابر نویز به دلیل زمان بلند بودن این ویژگی و همچنین دقت بالا و خطای پایین این ویژگی اشاره کرد. آزمایش های انجام شده بر روی مجموعه داده ی GTZAN حاکی از آن است که ویژگی پیشنهاد شده در مقایسه با عملکرد سایر ویژگی ها و با استفاده از روش های گوناگون دسته بندی در فرآیند یادگیری ماشین، دقت بسیار مناسب تر و خطای EER کمتر از 0.4 درصد را با وجود استفاده ی غیر ترکیبی آن با سایر ویژگی ها، به خود اختصاص داده است.

Keywords:

جداسازی گفتار از موزیک , آشکارسازی گفتار , ویژگی زمان بلند , LTMBACR , speech/music discrimination (SMD) , voice activity detection (VAD

Authors

محمد رسول کهریزی

دانشکده فنی و مهندسی، گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه رازی کرمانشاه

سیدجهانشاه کبودیان

دانشکده فنی و مهندسی، گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه رازی کرمانشاه

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

J. Saunders, "Real-time discrimination of broadcast speech/music, " in ICASSP, ...
G. Tzanetakis and P. Cook, "Musical genre classification of audio ...
E. Scheirer and M. Slaney, "Construction and evaluation of a ...
J. Pinquier, J.-L. Rouas, and R. Andre- Obrecht, "A fusion ...
M. J. Carey, E. S. Parris, and H. Llo yd-Thomas ...
O. M. Mubarak, E. Ambikairajah, and J. Epps, "Novel features ...
J. E. Muioz-Expo sito, S. Garcia-Galan, N. Ruiz-Reyes, P. Vera- ...
K. El-Maleh, M. Klein, G. Petrucci, and P. Kabal, " ...
V. Malenovsky, T. Vaillancourt, W. Zhe, K. Choo, and V. ...
B. K. Khonglah, R. Sharma, and S. Mahadeva Prasanna, "Speech ...
G. Aneeja and B. Y egnanarayana, "Single frequency filtering approach ...
T. Drugman, Y. Stylianou, Y. Kida, and M. Akamine, "Voice ...
B. K. Khonglah and S. M. Prasanna, " Speech/music classification ...
G. Sell and P. Clark, "Music tonality features for speech/music ...
B. Thompson, ' ' D iscrimination between singing and speech ...
A. Chen and M. A. H as egawa- Johnson, "Mixed ...
M. Lu and W. Dou, "Butterfly-like D-tree fusion strategy for ...
M. Srinivas, D. Roy, and C. K. Mohan, "Learning sparse ...
E. Wieser, M. Husinsky, and M. Seidl, 2" Speech/music discrimination ...
M. Joshi and S. Nadgir, "Extraction of feature vectors for ...
G. Fuchs, "A robust speech/music discriminator for switched audio coding, ...
D. Siddhi and D. Bhavik "Survey on Separation Methods of ...
S. Duan, J. Zhang, P. Roe, and M. Towsey, "A ...
M. Anusuya and S. Katti, "Front end analysis of speech ...
G. Peeters, "{A large set of audio features for sound ...
A. Makur and S.K. Mitra, "Warped Di screte-Fourier Transform: Theory ...
G. Tzanetakis and P. Cook, "Musical genre classification of audio ...

نمایش کامل مراجع