تشخیص 6 واژه گفتاری از روی حرکات لب و با استفاده از تصاویر رنگی
Publish place: 12th Annual Conference of Computer Society of Iran
Publish Year: 1385
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,775
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ACCSI12_305
تاریخ نمایه سازی: 23 دی 1386
Abstract:
دقت و اطمینان سیستمهای تشخیص اتوماتیک گفتار صوتی با استفاده از اطلاعات تصویری از حرکات لب گویندگان بهبود می یابد. در این مقاله، یک رویکرد جدید برای تشخیص دیداری گفتار ارائه شده است که شامل دومرحله استخراج ویژگی از دنباله تصاویر لب و تصاویر لب و طبقه بندی ویژگی های بدست آمده میباشد. برای استخراج ویژگی از دنباله تصاویر لب، یک الگوریتم استخراج کانتور لب مبتنی بر ناحیه بر اساس مدلهای انعطاف پذیر پیشنهاد شده است. الگوریتم از یک تابع هزینه آماری برای قسمت بندی تصاویر لب داده شده به ناحیه لب و غیر لب استفاده می کند. ابتدا نگاشت احتمال گسسته با استفاده از روشهای خوشه بندی فازی ایجاد شده است و با داشتن این نگاشت، طریقه بهینه سازی تابع هزینه در حوزه پیوسته نشان داده شده است. با تابع هزینه مبتنی بر ناحیه، الگوریتم برای تصاویر لب با کنتراست رنگی کم و دارای نویز و آرتیفکت مطمئنتر می باشد. پارامترهای استخراج شده با استفاده ازتوزیع احتمال پیوسته مدل شده است ووابستگی انها بوسیله مدلهای مخفی مارکوف مدل شده است. ارزیابی بر روی مجموعه دادگان جمع آوری شده از تصاویر لب 20 گوینده مختلف صورت گرفته و بر روی 6 واژه گفتاری با 92% موفقیت، بازشناسی گفتار انجام شده است.
Keywords:
استخراج کانتور لب , ویژگی های تصویری گفتار , بازشناسی دیداری گفتار , الگوهای انعطاف پذیر , مدل لب , جداسازی لب , خوشه بندی فازی , تصاویر رنگی , تابع هزینه
Authors
رضا شالباف
کارشناسی ارشد مهندسی پزشکی دانشگاه صنعتی امیرکبیر
منصور وفادوست
استادیار دانشکده مهندسی پزشکی دانشگاه صنعتی امیرکبیر