CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

مروری بر پژوهش های لب خوانی خودکار:دادگان و روش ها

عنوان مقاله: مروری بر پژوهش های لب خوانی خودکار:دادگان و روش ها
شناسه ملی مقاله: JR_JMVIP-9-4_005
منتشر شده در در سال 1401
مشخصات نویسندگان مقاله:

مهسا هدایتی پور - دانش آموخته کارشناسی ارشد مهندسی کامپیوتر گرایش هوش مصنوعی و رباتیکز، دانشگاه شهید بهشتی، تهران، ایران
یاسر شکفته - گروه هوش مصنوعی رباتیک و رایانش شناختی ، دانشکده مهندسی و علوم کامپیوتر، دانشگاه شهید بهشتی، تهران، ایران
محسن ابراهیمی مقدم - گروه هوش مصنوعی رباتیک و رایانش شناختی ، دانشکده مهندسی و علوم کامپیوتر، دانشگاه شهید بهشتی، تهران، ایران

خلاصه مقاله:
لب خوانی یا فرآیند بازشناسی دیداری گفتار روش تشخیص گفتار از روی حرکات لب گوینده است. در سال های اخیر علاقه به لب خوانی خودکار رو به افزایش بوده و تحقیقات بسیاری در این زمینه انجام شده است و همچنان به عنوان یک موضوع تحقیقی پیشرو مطرح است. در این مقاله مروری بر تحقیقات انجام شده در زمینه لب خوانی خودکار ارائه شده است. فهرستی از پایگاه داده های مورد استفاده با در نظر گرفتن خصوصیاتی نظیر تعداد گوینده، محتوای گفتار و کیفیت تصاویر ارائه شده است. در این مقاله، تحقیقات متنوع لب خوانی در زمینه تشخیص اعداد، حروف، کلمات و جملات و روش های سنتی استخراج ویژگی و دسته بندی تا روش های جدید مبتنی بر یادگیری عمیق مرور شده اند. بعلاوه فعالیت های لب خوانی زبان فارسی شامل پایگاه داده های فراهم شده و تحقیقات مرتبط با جامعیت بیشتر معرفی شده است.

کلمات کلیدی:
لب خوانی, بازشناسی دیداری گفتار, استخراج ویژگی, یادگیری ماشینی, یادگیری عمیق, شناسایی الگو

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1474671/