کاربرد نرمال سازی اکوسیتکی برای بهبود بازشناسی گفتار کودکان

قمرناز تدین تبریزی; سعید ستایشی; محمد مولوی کاخکی

کاربرد نرمال سازی اکوسیتکی برای بهبود بازشناسی گفتار کودکان

Publish place: 16th Iranian Conference on Electric Engineering

Publish Year: 1387

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 6 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/47537

شناسه ملی سند علمی:

ICEE16_039

تاریخ نمایه سازی: 6 اسفند 1386

Abstract:

ایجاد مشکلاتی در بازشناسی خودکار گفتار کودکان می شود. تجربه نشان داده در صورتی که از داده صحبت کودکان به عنوان ورودی در مدل های اکوستیکی استفاده شود که با گفتار بزرگسالان آموزش یافته اند، کارایی به اندازه قابل توجهی کاهش می یابد. نرخ خطای کلمه برای شناسایی صحبت کودکان 2 تا 4 بار بیشتر از بزرگسالان است. میزان درستی شناسایی صحبت در کودکان به عواملی مثل سن، جنسیت، فرکانس مبنایی و قد بستگی دارد. در این مقاله برخی از روش های افزایش کارایی شناسایی صحبت کودکان شامل نرمال سازی طول محدوده صوتی (VTLN) آموزش تطبیقی گوینده (SAT) و نرمال سازی گوینده بر اساس رگرسیون خطی با بیشترین درست نمایی محدود شده (CMLSN) مطرح و مقایسه می شوند.

Keywords:

بازشناسی گفتار کودکان , تبدیل صوت , مدل سازی تطبیقی , نرمال سلزی گوینده

Authors

قمرناز تدین تبریزی

دانشجوی دوره دکتری گروه مهندسی کامپیوتر (نرم افزار) دانشکده فنی مهندس

سعید ستایشی

دانشیار گروه مهندسی هسته ای( پرتوپزشکی) دانشکده مهندسی هسته ای و فیزیک

محمد مولوی کاخکی

دانشکده فنی و مهندسی دانشگاه فردوسی مشهد

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

Gerosa, M., Giuliani, D. and Brugnara, F. "Speaker adaptive acoustic ...
Narayanan, _ and Potamianos, A. "Creating CO, versational interfaces for ...
Wilpon, J.G., Jacobsen, C.N. "A study of speech recognition for ...
Giuliani, D. and Gerosa, M. "Investigating recognition of children's speech", ...
Blomberg, M. and Elenius, D. "Collection and recognition of children's ...
Das S., Nix D., Picheny M. *Impro vements in children's ...
Gustafson, J and Sjilander, K. ?Voice transfo rmations for improving ...
Bell, L and Gustafson, J. "Child and Adult Speaker Adaptation ...
Elenius, D. and Blomberg, M. "Adaptation and normalization e.xperiments in ...
Lee, S., Potamianos, A. and Narayanan, S. (1998) "Acoustics of ...
Werker, J. and Yeung, H. (2005) "Infant speech perception bootstraps ...
Hazan, V. and Barrett, S. "The development of phonemic categorication ...
Halavati, R., Shouraki, S. B.. Tajik, H., Cholakian, A., and ...
Lee, L and Rose, R. "A Frequency Warping Approach to ...
Potamianos, A. and Rose, R. 4On combining frequency warping and ...
Potamianos , A. and Narayanan, S. "Robust Recognition of Children's ...
Elenius, D. and Blomberg, M. "Comparing speech recognition for adults ...
Stemmer, G. , Hacker, C. , Steidl, S. and Noth, ...
Wallhoff, F., Willett, D. and Rigoll, G., "Scaled Likelihood Linear ...
Gales, M., ،Maximum likelihood linear transforma tions for HMM-based speech ...
Giuliani, D., Gerosa, M. and Brugnara, F. *Speaker Cons trained ...
Transforms in Proc. of INTERS PEECH/ICS LP, Jeju Island, Korea., ...
Laroche, J. and Dolson, M. "New phase- vocoder techniques for ...
Dolson, M. *The phase 1ocoder: A tutoriae, Computer Music Journal, ...
Cabral, J and Oliveira, L. "Pi tc h-Sync hronous Time- ...
Tran sformations", Interspeech 2005. September, 4-8, Lisbon, Portugal. ...

نمایش کامل مراجع