کاربرد نرمال سازی اکوسیتکی برای بهبود بازشناسی گفتار کودکان
Publish place: 16th Iranian Conference on Electric Engineering
Publish Year: 1387
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,408
This Paper With 6 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICEE16_039
تاریخ نمایه سازی: 6 اسفند 1386
Abstract:
ایجاد مشکلاتی در بازشناسی خودکار گفتار کودکان می شود. تجربه نشان داده در صورتی که از داده صحبت کودکان به عنوان ورودی در مدل های اکوستیکی استفاده شود که با گفتار بزرگسالان آموزش یافته اند، کارایی به اندازه قابل توجهی کاهش می یابد. نرخ خطای کلمه برای شناسایی صحبت کودکان 2 تا 4 بار بیشتر از بزرگسالان است. میزان درستی شناسایی صحبت در کودکان به عواملی مثل سن، جنسیت، فرکانس مبنایی و قد بستگی دارد. در این مقاله برخی از روش های افزایش کارایی شناسایی صحبت کودکان شامل نرمال سازی طول محدوده صوتی (VTLN) آموزش تطبیقی گوینده (SAT) و نرمال سازی گوینده بر اساس رگرسیون خطی با بیشترین درست نمایی محدود شده (CMLSN) مطرح و مقایسه می شوند.
Keywords:
Authors
قمرناز تدین تبریزی
دانشجوی دوره دکتری گروه مهندسی کامپیوتر (نرم افزار) دانشکده فنی مهندس
سعید ستایشی
دانشیار گروه مهندسی هسته ای( پرتوپزشکی) دانشکده مهندسی هسته ای و فیزیک
محمد مولوی کاخکی
دانشکده فنی و مهندسی دانشگاه فردوسی مشهد
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :