بازشناسی گوینده در فضای حالت نسبی ساخته شده از گویندگان مرجع

علی, صادقی نایینی; محمدمهدی, همایونپور

بازشناسی گوینده در فضای حالت نسبی ساخته شده از گویندگان مرجع

عنوان مقاله: بازشناسی گوینده در فضای حالت نسبی ساخته شده از گویندگان مرجع
شناسه ملی مقاله: ICEE15_131
منتشر شده در پانزدهیمن کنفرانس مهندسی برق ایران در سال 1386

مشخصات نویسندگان مقاله:

علی صادقی نایینی - آزمایشگاه سیستمهای هوشمند صوتی و گفتاری، دانشکده مهندسی کامپیوتر و ف
محمدمهدی همایونپور - آزمایشگاه سیستمهای هوشمند صوتی و گفتاری، دانشکده مهندسی کامپیوتر و ف

خلاصه مقاله:

ویژگیهای که از دنباله گفتار یک گوینده قابل استخراج هستند را می توان به دو دسته تفکیک کرد: ویژگی های مطلق و ویژگی های نسبی، ویژگی های مطلق که در اکثر سیستمهای بازشناسی گوینده مورد استفاده قرار می گیرند، ویژگی های هستند که به صورت مستقل از گفتار یک گوینده استخراج می شوند و به هیچ گوینده دیگری وابسته نیستند. ویژگی های نسبی ویژگی هایی هستند که نسبت به تعدادی گوینده مرجع محاسبه و استخراج می شوند. در این مقاله روشی برای استخراج ویژگی های نسبی برای استفاده در یک سیستم بازشناسی گوینده ارائه شده است . دراینروش ابتدا فضای نسبی با استفاده از ویژگی های گفتار تعدادی گوینده مرجع ساخته می شود. سپس در فاز آموزش گویندگن سیستم در این فضا ثبت نام میشوند و در فاز آزمایش دنباله گفتار آزمایشی در فضای نسبی تعیین محل شده و نسبت به تایید یا عدم تایید هویت گوینده آن اقدام می گردد. نتایج بدست آمده نشان از برتری این روش نسبت به روشهای متداول بازشناسی گوینده در فضای مطلق دارد. با استفاده از 10 ثانیه داده آموزشی و در حالتی که مدل مخلوط گاوسی در فضای مطلق دارای خطای 1/51% برای تصدیق هویت گوینده بود بود این روش به خطای 0/55% درصد دست یافته است. همچنین استفاده از یکروش هنجار سازی مناسب در این فضا توانسته است این خطا را تا 0/8% کاهش دهد.

کلمات کلیدی:

بازشناسی گوینده ، فضای نسبی ، گوینده مرجع ، مدل خطوط گاوسی ، تحلیل متمایز کننده خطی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/25200/