بررسی روش های تطبیق به گوینده مبتنی بر فضای ویژه در سیستم های بازشناسی گفتار فارسی

زهره, انصاری; فرشاد, الماس گنج; یاسر, شکفته

بررسی روش های تطبیق به گوینده مبتنی بر فضای ویژه در سیستم های بازشناسی گفتار فارسی

عنوان مقاله: بررسی روش های تطبیق به گوینده مبتنی بر فضای ویژه در سیستم های بازشناسی گفتار فارسی
شناسه ملی مقاله: ICBME17_139
منتشر شده در هفدهمین کنفرانس مهندسی پزشکی ایران در سال 1389

مشخصات نویسندگان مقاله:

زهره انصاری - دانشگاه صنعتی امیرکبیر (پلی تکنیک تهران)، دانشکده مهندسی پزشکی، آزما
فرشاد الماس گنج - دانشگاه صنعتی امیرکبیر (پلی تکنیک تهران)، دانشکده مهندسی پزشکی، آزما
یاسر شکفته - دانشگاه صنعتی امیرکبیر (پلی تکنیک تهران)، دانشکده مهندسی پزشکی، آزما

خلاصه مقاله:

از میان الگوریتم های تطبیق به گوینده، تطبیق صدای ویژه (EV) و تطبیق ILIR بر پایه فضای ویژه (EMLLR) به منظور تطبیق به گوینده سریع (با داده تطبیقی کم) مورد استفاده قرار گرفته اند. در این دوالگوریتم، مدل تطبیق یافته به گوینده جدید محدود به تعریف شدن به صورت جمع وزندار بردارهای پایه ای که بر یکدیگر عمودند می شود، به این ترتیب تعداد پارامترهایی که لازم است از داده تطبیقی تخمین زده شوند کاهش می یابد. در این حالت، دست یابی به مدل های دقیق تر با استفاده از داده تطبیقی بیشتر سخت می شود که می توان با استفاده از دسته بندی بهینه پارامترهای مدل این مشکل را برطرف ساخت. نتایج بررسظی های انجام گرفته در این مطالعه روی به کارگیری دو روش EV و EMLLR با استفاده از دادگان فارس دات نشان می دهد که با داشتن داده تطبیقی کوتاه (در حد 5 الی 10 ثانیه)، در حالت سرپرستی شده، هر یک به ترتیب 5/9% و 5/3% و در حالت بدون سرپرستی، 4/6% و 4% بازشناسی واج را بهبود می بخشند در حالی که روش های تطبیق به گوینده متداول نظیر MLLR نمی توانند با داده تطبیقی ک وتاه به درستی عمل کنند. همچنین نشان داده شده است که با استفاده از خوشه بندی فضای ویژه، عملکرد تطبیق EV با داده تطبیقی زیاد در دو حالت سرپرستی شده و بدون سرپرستی بهبود می یابد.

کلمات کلیدی:

آنالیز مؤلفه های اساسی، تطبیق به گوینده، صدای ویژه، فضای ویژه

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/202958/