مدل سازی سه واجی به عنوان واحد آوایی در سیستم های بازشناسی گفتار پیوسته فارسی مبتنی بر مدل مخفی مارکوف

Publish Year: 1386
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,970

متن کامل این Paper منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل Paper (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ACCSI13_177

تاریخ نمایه سازی: 25 آبان 1386

Abstract:

برای سیستم های بازشناسی گفتار پیوسته معمولا استفاده از واحدآوایی سه واجی جهت نیل به عملکرد بهتر غیر قابل اجتناب است . مشکل واحدهای آوایی سه واجی تعداد بالای انها و در نتیجه نیاز به دادگان آموزشی بسیار بزرگ برای آموزش تعداد زیاد حالت های مدل می ابشد. برای حل این مشکل و اختصاص داده کافی برای آموزش هر حالت ازمدل مخفی مارکوف، روش مرسوم استفاده از متد گره زدن حالت ها است. در این مقاله، مراحل گره زدن حالت های مربوط به سه واجی ها در روند آموزش یک سیستم بازشناسی گفتار پیوسته فارسی طراحی و اجرا شده است و بر اساس نتایج و عملکرد سیستم بازشناسی، تعداد بهینه حالت های گره زده شده (زنون ها) و پارامترهایی مانند تعداد گوسی های هر حالت برای مجموعه دادگان های فارسی دات بزرگ و کوچک گزارش شده است. میزان کاهش خطا در سیستم بازشناسی گفتار فارسی پس از به کارگیری سه واجی ها حدود 11% بوده است.

Authors

نسیبه نصیری

آزمایشگاه پردازش گفتار دانشکده مهندسی کامپیوتر دانشگاه صنعتی شریف

حسین صامتی

استادیار و عضو هیئت علمی دانشکده مهندسی کامپوتر دانشگاه صنعتی شریف

محمد بحرانی

آزمایشگاه پردازش گفتار دانشکده مهندسی کامپیوتر دانشگاه صنعتی شریف

باقر باباعلی

آزمایشگاه پردازش گفتار دانشکده مهندسی کامپیوتر دانشگاه صنعتی شریف