Bit Rate Reduction of FS-۱۰۱۵ Speech Coder Using Fuzzy ARTMAP and KSOFM Neural Networks
Publish place: majlesi Journal of Electrical Engineering، Vol: 3، Issue: 1
Publish Year: 1388
نوع سند: مقاله ژورنالی
زبان: English
View: 126
This Paper With 8 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_MJEE-3-1_003
تاریخ نمایه سازی: 28 فروردین 1402
Abstract:
The speech spectrum is very sensitive to linear predictive coding (LPC) parameters, so small quantization errors may cause unstable synthesis filter. Line spectral pairs (LSPs) are more efficient representations than LPC parameters. On the other hand, artificial neural networks (ANNs) have been used successfully to improving the quality and also reduction the computational complexity of speech coders. This work proposes an efficient technique to reduce the bit rate of FS-۱۰۱۵ speech coder, while improving the performance. In this way, LSP parameters are used instead of the LPC parameters. In addition, neural vector quantizers based on Kohonen self-organizing feature map (KSOFM), with a modified-supervised training algorithm, and fuzzy ARTMAP are also employed to reduce the bit rate. By using the mentioned neural vector quantizer models, the quality of synthesized speech, in terms of mean opinion score (MOS), is improved ۰.۱۳ and ۰.۲۶, respectively. The execution time of proposed models, as compared to FS-۱۰۱۵ standard, is also reduced ۲۷% and ۴۳%, respectively.
Keywords:
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :