ارائه الگوریتمی تعمیم یافته برای بازشناسایی گفتار توسط شبکه عصبی
Publish place: 11th Iranian Student Conference on Electrical Engieering
Publish Year: 1387
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,760
This Paper With 6 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ISCEE11_180
تاریخ نمایه سازی: 15 اسفند 1386
Abstract:
در این مقاله با توجه به معایب هر یک از تکنیک های موجود برای بازشناسایی صوت، روشی ترکیبی ارائه خواهد شد که می تواند با صحت بالا (98%) به طبقه بندی صوت های دریافتی در زمان حداقل دست یابد. در این روش بعد از جمع اوری پایگاه داده database) ابتدا سیگنال صوت پیش پردازش شده که این بخش شامل حذف نویز توسط آنالیز Mels Frequency Capestral بدست اوردن ویژگی های لازم با استفاده از ضرایب تبدیل موجک گسسته wavelet) می باشد. سپس این ویژگی ها به یک شبکه چند لایه پرسپترون برای طبقه بندی اعمال می شود. در نهایت پس از آموزش شبکه با استفاده از الگوریتم UTA ویژگی های موثر در طبقه بندی استخراج می شوند، کلیه مراحل توسط Labview کد شده که بعلت دارا بودن قابلیت پردازش موازی، تاثیر چشمگیری در سرعت یادگیری و تشخیص سیستم داشته است.
Keywords:
Authors
میثم محمدپور
واحد تحقیقات صدا و سیما
فرداد فرخی
هیات علمی دانشگاه آزاد اسلامی واحد تهران مرکزی
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :