مقاوم سازی ویژگی های گفتار بوسیله شبکه باور تطبیق پذیر با نویز

محمدرضا عبدالهی; بابک ناصر شریف

مقاوم سازی ویژگی های گفتار بوسیله شبکه باور تطبیق پذیر با نویز

Publish place: Conference on Signal Processing and Intelligent Systems

Publish Year: 1395

Type: Conference paper

Language: Persian

This Paper With 6 Page And PDF Format Ready To Download

DOWNLOAD Paper

Certificate
I'm the author of the paper

Export:

Link to this Paper:

https://civilica.com/doc/611710

Document National Code:

SPIS02_015

Index date: 1 July 2017

مقاوم سازی ویژگی های گفتار بوسیله شبکه باور تطبیق پذیر با نویز abstract

امروزه شبکه های عصبی عمیق کاربردهای زیادی در بازشناسی گفتار پیدا کرده اند. این شبکه ها در مدل سازی آکوستیک، استخراج ویژگی و حذف نویز مورد استفاده قرار می گیرند. از انجا که معمولا داده های زیادی برای آموزش یک شبکه عصبی عمیق با عمق زیاد لازم است، در بحث مدلسازی اکوستیک، روش - هایی برای تطبیق این شبکه ها با گوینده جدید مطرح گردیده اند. در مقاله حاضر، از ایده تطبیق شبکه های عصبی عمیق برای تطبیق با یک نویز جدید بهره گرفته شده است. به این منظور، در ابتدا، یک شبکه باور عمیق برای نگاشت ویژگی های نویزی لگاریتم انرژی زیر باندهای مل به نوع تمیز آن، با استفاده از دادگان نویزی آموزش داده شده است. سپس برای تطبیق با محیط های نویزی جدید، یک لایه با نقش تبدیل خطی به شبکه باور عمیق نگاشت گر افزوده شده است. نتایج ارزیابی بر روی دادگان Aurora2 نشان می دهد که با معماری های مختلف شبکه باور عمیق، افزودن لایه تطبیق در هر یک از حالات ورودی و خروجی باعث بهبود عملکرد شبکه باور عمیق نگاشت گر ویژگی شده است به نحوی که دقت بازشناسی گفتار ر1 تا 7 درصد در اثر نگاشت ویژگی ها افزایش داده است.

مقاوم سازی ویژگی های گفتار بوسیله شبکه باور تطبیق پذیر با نویز Keywords:

تطبیق با نویز شبکه باورعمیق بازشناسی گفتار مقاوم سازی تبدیل خطی

مقاوم سازی ویژگی های گفتار بوسیله شبکه باور تطبیق پذیر با نویز authors

محمدرضا عبدالهی

دانشجوی ارشد، دانشکده مهندسی کامپوتر، دانشگاه صنعتی خواجه نصیر الدین طوسی، تهران

بابک ناصر شریف

دانشکده مهندسی کامپیوتر، دانشگاه صنعتی خواجه نصیر الدین طوسی، تهران

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

غلامی‌پور، مجتبی، ناصرشریف، بابک، "مقاوم سازی ویژگی‌های مل کپستروم نسبت ...

Keyvanrad M. A., Homayounpour M. M., "A brief survey on ...

Li J., Deng L, Gong Y., Haeb-Umbach R., , "An ...

Yoshioka T., Gales M., "Environmentaly robust ASR frontend for deep ...

_ _ _ _ _ _ _ IEEE/ACM ...

Gao T., Du J., Dai L. R., Lee C. H. ...

Yu D., Seltzer L, Li J., Huang J., Seide F, ...

Qian Y., Yin M., You Y., Yu K. "multi-task joint-learning ...

Li B., Sim K. C., "A Spectral Masking Approach to ...

Mirsamadi, S., Hansen, J. H. "A Study _ Deep Neural ...

Yu D., Deng L, "Automatic Speech Recognition, _ Deep _ ...

_ _ Processing (ICASSP), pp. 7893-7897, 2013. ...

_ _ _ _ speaker code", International Conference on Acoustics, ...

Du J., Wang Q., Gao T., Xu Y., Dai L., ...

_ _ _ _ under noisy condition", ISCA ITRW ASR, ...

نمایش کامل مراجع