مدلسازی گونه های تلفظی کلمات در سیستم بازشناسی اتوماتیک گفتار پیوسته فارسی

بهرام, وزیر نژاد; فرشاد, الماس گنج; محمود, بیجن خان

مدلسازی گونه های تلفظی کلمات در سیستم بازشناسی اتوماتیک گفتار پیوسته فارسی

عنوان مقاله: مدلسازی گونه های تلفظی کلمات در سیستم بازشناسی اتوماتیک گفتار پیوسته فارسی
شناسه ملی مقاله: ICIKT01_021
منتشر شده در اولین کنفرانس بین المللی فناوری اطلاعات و دانش در سال 1382

مشخصات نویسندگان مقاله:

بهرام وزیر نژاد - دانشگاه صنعتی امیرکبیر، دانشکده مهندسی پزشکی
فرشاد الماس گنج - دانشگاه صنعتی امیرکبیر، دانشکده مهندسی پزشکی
محمود بیجن خان - دانشگاه تهران- دانشکده ادبیات و علوم انسانی

خلاصه مقاله:

واژگان یک سیستم بازشناسی گفتار باید حاوی مدلهای تلفظی از کلمات باشد تا بتواند شکلهای مختلف تحقق کلمات بر اساس ترتیب عناصر زیر کلمه که معمولاً واجها میباشند را، توصیف نماید. در این ارتباط روشی را ارائه می نماییم تا مدلهای تلفظی فراتر از ذکر تلفضهای ساده مرجع و اولیه باشند و نیز مدلهای جدیدی که قابلیت توصیف خودکار و همراه با احتمال وقوع آنها دارد، برروش اضافه کردن دستی گونه های تلفظی در واژگان برتری دارد. این روش، قواعد تلفظی را از ورودیهایی شامل فرم های واجی مرجع و باز شناسی شده یاد می گیرد و متعاقباً قواهد یادگرفته شده را بعد از انجام مراحل هرس قواعد، جهت تولید گونه های تلفظی رایج هر کلمه بکار میبرد. با یادگیری قواعد تلفظی بجای گونه های تلفظی از دادگان تعلیم می توان مزایای روشهای مبتنی بر داده و مبتنی بر قاعده را با هم ترکیب نمود. از خصوصیات بارز روش بکار گرفته شده این است که احتمال گونه های تلفظی تولیده شده براساس دادگان تعلیم و بصورت واقعی قابل محاسبه می باشد حتی اگر گونه تلفظی در تمام دادگان دیده نشده باشد.

کلمات کلیدی:

مدلسازی تغییرات تلفظی- واژگان - قواعد تلفظی - گونه های تلفظی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/72123/