طبقه بندی آوادید واکه های زبان فارسی با به کار گیری روش جدید استخراج ویژگی بر اساس مدل مخفی مارکوف

مائده مقدم; اعظم باستان فرد

طبقه بندی آوادید واکه های زبان فارسی با به کار گیری روش جدید استخراج ویژگی بر اساس مدل مخفی مارکوف

Publish place: 4th Broadcasting Engineering Conference

Publish Year: 1390

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 6 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/162406

شناسه ملی سند علمی:

IBBEC04_022

تاریخ نمایه سازی: 11 شهریور 1391

Abstract:

آوادید کوچک ترین واحد قابل تمایز گفتار تصویری است و تعیین کلاس های آوادیدی در هر زبان یکی از گام های اولیه در تحقیقات صورت گرفته بر روی بازشناسی گفتار تصویری، پویانمایی صورت و بهبود نرخ بازشناسی گفتار صوتی است. در این مقاله یک روش - مستقل از گوینده و قوی جهت حل مساله خوشه بندی آوادید واکه های زبان فارسی ارائه شده است. روش ارائه شده شامل سه فاز اصلی است: 1- پیش پردازش، 2- استخراج ویژگی، 3 - خوشه بندی سلسه مراتبی. در این روش، پس از آنکه ناحیه دهان در تمامی فریم ها قطعه بندی شد، بردار ویژگی با به کارگیری مدل مخفی مارکوف استخراج میشود. استفاده از مدل مخفی مارکوف به عنوان یک استخراج کننده ویژگی از جنبه های نوآوری این مقاله است. در نهایت با اعمال خوشه بندی سلسه مراتبی، آوادید واکه های زبان فارسی خوشه بندی می شوند. مهمترین مزیت این روش استقلال خوشه های آوادیدی از گوینده است. روش ارائه شده بر روی مجموعه دادگان آوا 2 اعمال شد.

Keywords:

آوادید , گفتار تصویری , مدل مخفی مارکوف

Authors

مائده مقدم

دانشگاه آزاد قزوین

اعظم باستان فرد

دانشگاه آزاد اسلامی واحد کرج

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

مائده مقدم، اعظم باستان فرد، مریم فاضل، محمد آقا احمدی، ...
تشخیص 6 واژه گفتاری از روی حرکات لب و با استفاده از تصاویر رنگی [مقاله کنفرانسی]
H. McGurk and J. MacDonald, , "Hearing lips and seeing ...
Chen, T. 2001. Audiovisual speech processing, IEEE Signal Processing Mag., ...
C., Fisher, "Confusions among visuallly perceived consonants, " J. Speech ...
S. Werda, W. Mahdi, M. Tmar and A Benhamadou, "Lip ...
_ _ _ _ VRCAI, pp. 29-33, 2009. ...
_ Krhoul, P. Cisaf and J. Matousek, "Design, implementation and ...
G. Zoric, I.S. Pandzic. , "Real-time language independent lip synchronization ...
C., Binnie, A. Montgomery, and P., Jackson. "Auditory and Visual ...
E. Owens, and B., Blazek, "Visemes Observed by Hearing- Impaired ...
M. Caldognetto E. , Zmarich C. Cosi P., Ferrero F. ...
J. Melenchon, J. Simo, G. Cobo, E. Martinez, "Objective Viseme ...
_ _ _ in Proc. AVSP, pp. 154-159, 2010 ...
Wang AH, Bao HQ, Chen JY. "Primary research on the ...
M. Leszczynski and W. Skarbek, "Viseme Classification for Talking Head ...
M. Leszczynski , W. Skarbek and S. Badura, "Fast Viseme ...
N. Alothmany, R. Ching Li, S. Shaiman, J. Durrant, :Classification ...
A. Bastanfard, M. fazel, A. Abd kelisham. Aghaahmadi, M. ...
Multimedia, Accepted 2009. ...
A. Bastanfard, M. Aghaahmadi. A. Abdi M. Fazel, _ comprehensive ...
L. R., Rabiner, _ A tutorial _ Hidden Markov Models ...

نمایش کامل مراجع