بازشناسی مستقل از فرد گفتار پیوسته با استفاده از ویژگی های استخراج شده از لب

Publish Year: 1391
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 831

This Paper With 8 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ICEEE04_123

تاریخ نمایه سازی: 6 مهر 1391

Abstract:

بازشناسی گفتار با استفاده از ویژگی های تصویری به علت کاربردهای فراوان نظیر بهبود بازشناسی گفتار، لب خوانی و ارتباط رایانه و انسان یکی از موضوعات بدیع و مورد توجه است. برای این منظور در این مقاله ابتدا به پیدا کردن منحنی دور لب پرداخته و سپس با استخراج ویژگی های مطلوب به بازشناسی مستقل از فرد گفتار پیوسته مبادرت می شود. برای یافتن منحنی دور لب، پس از ایجاد فضای زنگی جدید، با استفاده از آستانه گذاری بهینه مرز کلی لب پیدا می شود. سپس با روش پیشنهادی به بهبود الگوریتم یافتن مرز دقیق لب پرداخته و مرزی منعطف و بدون داشتن شرط تقارن بدست می آید. پس از تعریف ویژگی های استخراج شده مطلوب از منحنی دور لب، برای بازشناسی از یک مدل شبکه عصبی که اطلاعات زمینه و نوعی نرمال سازی را به همراه دارد، استفاده شده است. نتایج آزمایشات موید کیفیت و دقت بهتر روش های پیشنهادی نسبت به روش های رایج دیگر است.

Authors

کامران قاصدی

دانشجوی دانشگاه صنعتی امیرکبیر

نجمه صدوقی

دانشجوی دانشگاه صنعتی امیرکبیر

سید علی سید صالحی

استادیار دانشگاه صنعتی امیرکبیر

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • شالباف ر.، وفادوست م.، شالباف ا. _ بازشناسی دیداری گفتار ...
  • استخراج هوشمند و خودکارمنحنی دقیق دورلب [مقاله کنفرانسی]
  • th Iranian _ _ _ (ICEEE2012) _ ...
  • Borgstrom B.J., _ Low-Comp lexity Parabolic Lip Contour Model with ...
  • Chiou G.I., Hwang J.N., "Lipreading from color video", IEEEE Trans. ...
  • Cootes T.F., Taylor C.J., Cooper D.H., Graham J., "Active shape ...
  • Eveno N., Caplier A., and Coulon P. Y., ":Accurate and ...
  • Eveno N., Caplier A., Coulon P. Y., "Key Points Based ...
  • Fanelli G., Gall J., Romsdorfer H. Weise T., Gool L. ...
  • Commun ication", IEEE Trans. Multimedia, Vol. 12, No. 6, 2010. ...
  • Hazen T. J., "Visual model structures and synchrony constraints for ...
  • Hsu R. L., Abdel M., Jain A. K., _ Detection ...
  • Igawa S., Ogihara A., Shintani A., and S. Takamatsu, "Speech ...
  • Jiang Yu. K., Bunke X. H., "Lipreading Using Signal Analysis ...
  • Lucey S., Chen T., Sridharan S., and Chandran V., "Integration ...
  • Recognition, " IEEE Trans. Multimedia, Vol. 7, No. 3, pp. ...
  • Ooi W. C., Jeon C., Kim K., Han D. K. ...
  • threshold selection method from gray-level A"ه [15] Otsu N., histograms", ...
  • Putzara L, , Goerendta I., Heeda T., Richardb G., Bichelc ...
  • Savran A., Sankur B., Bilge M. T., "Facial action unit ...
  • Zhang B., Fukui Y., "Research on an Automated Speech Recognition ...
  • نمایش کامل مراجع