CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

تشخیص هویت گوینده مستقل از متن مقاوم به نویز در زبان فارسی مبتنی بر تخمین وفقی فرمنت ها و ضرایب کپسترال فرکانس مل

عنوان مقاله: تشخیص هویت گوینده مستقل از متن مقاوم به نویز در زبان فارسی مبتنی بر تخمین وفقی فرمنت ها و ضرایب کپسترال فرکانس مل
شناسه ملی مقاله: ETECH04_084
منتشر شده در چهارمین کنفرانس ملی تکنولوژی در مهندسی برق و کامپیوتر در سال 1398
مشخصات نویسندگان مقاله:

جواد زندی - دانشکده مهندسی و علوم کامپیوتر، دانشگاه شهید بهشتی تهران، ایران
مریم حاتمی - دانشکده مهندسی و علوم کامپیوتر، دانشگاه شهید بهشتی تهران، ایران
مهدی بکرانی - دانشکده برق و کامپیوتر، دانشگاه صنعتی قم، قم، ایران

خلاصه مقاله:
بازشناسی گوینده مستقل از متن در محیط های واقعی نویزی همچنان یک چالش پیش روی سیستم های تشخیص هویت می باشد. در این مقاله، روشی برای بهبود دقت تشخیص هویت گوینده مستقل از متن ارائه می شود که از ترکیب ویژگی ضرایب کپسترال و داده های اخذ شده از تخمین وفقی چهار فرمنت اول گفتار در محیط های نویزی استفاده می کند. به منظور تخمین مقاوم به نویز فرمنت ها از فیلتر تک قطب پیشگوی خطی (LPC) در چهار باند فرکانسی مجزا به همراه فلیتر میانگین لغزشی (MA) استفاده می شود. به منظور استخراج ویژگی ها از سیگنال گفتار، بدلیل عملکرد موثر ضرایب کپسترال بدلیل وجود بانک فیلترهای مل، در محیط های نویزی از این ضرایب استفاده می شود. برای مدل سازی گوینده با رویکرد مستقل از متن و برای حصول دقت بالا روش مدل خطوط گاوسی (GMM) را برای ضرایب کپسترال انتخاب می کنیم. طبقه بندی داده های فرمنت در فضای برداری (VQ) انجام می شود. نهایتا نتایج تصمیم با مدل های GMM و VQ با هم ادغام می شود. گوینده موردنظر تعیین هویت می شود. شبیه سازی های انجام شده با سیگنال های گفتار از پایگاه داده زبان فارسی فارس دات نشان دهنده دقت بالاتر روش پیشنهدی نسبت به روش متعارف متنی بر ضرایب کپسترال می باشد.

کلمات کلیدی:
ضرایب کپسترال، طبقه بندی، مدل سازی گوینده، مدل گوسی، کمی سازی برداری

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/989099/