دسته بندی صوت به صحبت و موزیک با تبدیل موجک

فواد رحیم زاده تبریزی; عماد عباسی صیدآباد; جلیل شیرازی

دسته بندی صوت به صحبت و موزیک با تبدیل موجک

Publish place: 4th Iranian Conference on Electrical and Electronics Engineering

Publish Year: 1391

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 6 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/164287

شناسه ملی سند علمی:

ICEEE04_210

تاریخ نمایه سازی: 6 مهر 1391

Abstract:

در این مقاله با هدف دسته بندی صوت به دو دسته صحبت و موزیک از مدل سازی تبدیل موجک برای صوت استفاده شده و با نتایج مدل سازی ضرایب بر کاربرد MFCC مقایسه گردیده است. این دسته بندی برمبنای قاب های با طول 23/2ms انجام شده است. برای آموزش روش دسته بندی در هر حالت، هر سیستم با 120 فایل متشکل از 155039 قاب آموزش یافته و با 61 فایل متشکل از 78811 قاب تست شده است. دسته بندی با استفاده از SVM انجام شده است و روشهای PCA و F-ratio به منظور کاهش بعد بررسی شده اند. همچنین نرمالیزاسیون بردارهای ویژگی مورد بررسی قرار گرفته اند که نتایج بدست آمده حاکی از توانایی ضرایب تبدیل موجک برای سیستم دسته بندی صوت می باشد.

Keywords:

تبدیل موجک , ضرایب MFCC , ماشین بردار پشتیبان

Authors

فواد رحیم زاده تبریزی

دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد گناباد، گروه برق

عماد عباسی صیدآباد

دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد گناباد، گروه برق

جلیل شیرازی

استادیار دانشگاه آزاد اسلامی واحد گناباد، گروه برق

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

G. Lu, "Indexing and retrieval of audio: A survey, " ...
Multimedia Tools an dApplications journal vol. 15, no. 3, pp. ...
S. Tsekeridou and I.Pitas, "Audio-visul content analysis for co nt ...
Multimedia Computing and Systems, pp.667-672, 1999. ...
S. K, S. Tsekeridou and I.Pitas, "Multimodal interactionfor Scene b ...
S. Lefevre, B. Maillard and N. Vincent, " 3 classes ...
segmentation for analysisfootball audio sequences, " IEEE International Conference on ...
B. J. Pathari V, "Multimedia content segmentation based _ speakerreco ...
L. Tancerel, S. Ragot , V.T. Ruoppilaand, R. Lefebyre, "Combined ...
R. Jarina, N. Murphy, N. Connor and S. Marlow, "Speech- ...
_ mmunications , WSES press, pp. 174-178, 200. ...
L. Lu, H-J. Zhang , "Content analysis for audio classification ...
G. Senthil raja and S. Dandapat, "Sinusoidal model based Speaker ...
S. Ramamohan and S. Dandapat, "Sinusoidal model-based analysis and classification ...
McAulay R. J. and Quatieri T. F., "Speech ...
Vol. ASSP-34, No.4, pp. 744-754, August 1986. ...
J. Jensen and J.H.L. Hansen, "Speech enhancement using a constrained ...
E. Scheirer and . Slaney, "Construction And Evaluation OfA Robust ...
A.L. Berenzweig and D.P.W. Ellis, "Locating singing voice segments within ...
G. Williams and D. Ellis, "Speech/music discrimination based on posterior ...
J. O. Smith and . Serra, " PARSHL: An ...
X. Serra and J. Smith III, "Spectral modeling synthesis: A ...
deterministic plus stochastic decompo sition, " Computer Music Journal, vol. ...
_ _ n, _ ICASSP, pp. 149-152, 1999. ...

نمایش کامل مراجع