افزایش کارآیی سیستم تشخیص گوینده مستقل ازمتن بااستفاده ازویژگیهای ترکیبی مبتنی براستخراج دقیق فرکانس پایه
عنوان مقاله: افزایش کارآیی سیستم تشخیص گوینده مستقل ازمتن بااستفاده ازویژگیهای ترکیبی مبتنی براستخراج دقیق فرکانس پایه
شناسه ملی مقاله: ICEEE05_419
منتشر شده در پنجمین کنفرانس ملی مهندسی برق و الکترونیک ایران در سال 1392
شناسه ملی مقاله: ICEEE05_419
منتشر شده در پنجمین کنفرانس ملی مهندسی برق و الکترونیک ایران در سال 1392
مشخصات نویسندگان مقاله:
نونا حیدری اصفهانی - دانشگاه آزاد اسلامی واحد نجف آباد
حمید محمودیان - دانشگاه آزاد اسلامی واحد نجف آباد
غزال شیخی - دانشگاه صنعتی امیرکبیر
خلاصه مقاله:
نونا حیدری اصفهانی - دانشگاه آزاد اسلامی واحد نجف آباد
حمید محمودیان - دانشگاه آزاد اسلامی واحد نجف آباد
غزال شیخی - دانشگاه صنعتی امیرکبیر
دراین مقاله سعی شده است باافزودن اطلاعات فرکانس پایه ،کارایی سیستم تشخیص گوینده مستقل ازمتن مبتنی برشبکه عصبی پرسپترون چندلایه بهبود داده شود برای تشخیص دقیق نواحی واکدار/بی واک و استخراج فرکانس پایه روش جدیدی معرفی شده است که ازمایشات کارایی آن را درمقایسه با سایرروشهای متداول درنسبت های سینگال به نویز زیاد و متوسط نشان میدهند سیستم تشخیص گوینده اصلی مبتنی برویژگیهای mfcc است و اطلاعات فرکانس پایه ازجمله مقدارفرکانس درهرفریم میانگین مدین، حداقل وحداکثر فرکانس درهرجمله به بردارویژگی اضافه شده است نتایج نشان میدهند افزودن میانگین فرکانس پایه درهرجمله نرخ تشخیص گوینده را به طور میانگین 3درصد وافزودن مقدارفرکانس پایه به همراه میانگین آن نرخ بازشناسی فریم و نرخ تشخیص گوینده را بطور میانگین به ترتیب به میزان 13و4 درصد بهبودمیدهند
کلمات کلیدی: تشیخص هویت گوینده، شبکه عصبی MLP، فرکانس پایه
صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/219735/