ارائه یک سامانه لب خوان در زبان فارسی با استفاده از شبکه های عصبی عمیق

Publish Year: 1398
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 379

This Paper With 16 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ICELE05_337

تاریخ نمایه سازی: 26 بهمن 1398

Abstract:

لب خوانی از موضوعات محبوبی است که اخیرا0 بسیار مورد توجه قرار گرفته و میتواند کاربردهای متعددی مانند تشخیص گفتار در فیلمهای صامت، کمک به افراد ناشنوا و بیمارانی که مشکل تکلم دارند، کمک به شناسایی گفتار در محیطهای نویزی و.... داشته باشد. یک نکته مهم در خصوص لبخوانی آن است که دقت لب خوانی توسط انسان پایین و در سطح مطلوبی نیست. از طرفی دیگر، دقت سامانه های لب خوانی ماشینی نیز تا چند سال پیش پایین و در حد دقت انسان بوده اند. دو عامل بیان شده منجر به این شده که طراحی و پیاده سازی سامانه های لبخوان تاکنون رشد و گسترش زیادی نداشته باشند. خوشبختانه روشهای مبتنی بر شبکه های عصبی عمیق، جایگزین روشهای سنتی لبخوانی شده اند و در این حوزه، کارایی را به صورت بسیار مناسبی افزایش داده اند. با استفاده از این روشها، هم اکنون لبخوانی ماشینی به دقتی، بعضا0 تا بیش از 1,7 برابر لبخوانی انسانی دست پیدا کرده است. در این مطالعه، هدف طراحی یک سامانه کامل لب خوان در زبان فارسی و مبتنی بر استفاده از شبکه های عصبی عمیق، میباشد. در این راستا، ابتدا مجموعه داده بزرگ ومناسبی برای به کارگیری در شبکه های عصبی عمیق، فراهم کردیم. سپس یک مدل شبکه عمیق، تعریف کرده و آموزش دادیم. با توجه به کارهای انجام شده در زبان انگلیسی، رسیدن به دقت حدود 60% در داده های بدون محدودیت، مطلوب و مناسب است، که در این پژوهش به دقتی حدود 87% دست یافتیم.

Authors

فاطمه امجدی

دانشجوی ارشد آیتی، دانشگاه قم

روح اله دیانت

عضو هیئت علمی دانشکده فنی مهندسی، دانشگاه قم