افزایش کارآیی سیستم تشخیص گوینده مستقل ازمتن بااستفاده ازویژگیهای ترکیبی مبتنی براستخراج دقیق فرکانس پایه
Publish Year: 1392
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 596
This Paper With 8 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICEEE05_419
تاریخ نمایه سازی: 3 آذر 1392
Abstract:
دراین مقاله سعی شده است باافزودن اطلاعات فرکانس پایه ،کارایی سیستم تشخیص گوینده مستقل ازمتن مبتنی برشبکه عصبی پرسپترون چندلایه بهبود داده شود برای تشخیص دقیق نواحی واکدار/بی واک و استخراج فرکانس پایه روش جدیدی معرفی شده است که ازمایشات کارایی آن را درمقایسه با سایرروشهای متداول درنسبت های سینگال به نویز زیاد و متوسط نشان میدهند سیستم تشخیص گوینده اصلی مبتنی برویژگیهای mfcc است و اطلاعات فرکانس پایه ازجمله مقدارفرکانس درهرفریم میانگین مدین، حداقل وحداکثر فرکانس درهرجمله به بردارویژگی اضافه شده است نتایج نشان میدهند افزودن میانگین فرکانس پایه درهرجمله نرخ تشخیص گوینده را به طور میانگین 3درصد وافزودن مقدارفرکانس پایه به همراه میانگین آن نرخ بازشناسی فریم و نرخ تشخیص گوینده را بطور میانگین به ترتیب به میزان 13و4 درصد بهبودمیدهند
Keywords:
Authors
نونا حیدری اصفهانی
دانشگاه آزاد اسلامی واحد نجف آباد
حمید محمودیان
دانشگاه آزاد اسلامی واحد نجف آباد
غزال شیخی
دانشگاه صنعتی امیرکبیر
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :