سیویلیکا را در شبکه های اجتماعی دنبال نمایید.

ارائه یک سامانه لب خوان در زبان فارسی با استفاده از شبکه های عصبی عمیق

Publish Year: 1398
Type: Conference paper
Language: Persian
View: 467

This Paper With 16 Page And PDF Format Ready To Download

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

Export:

Link to this Paper:

Document National Code:

ICELE05_337

Index date: 15 February 2020

ارائه یک سامانه لب خوان در زبان فارسی با استفاده از شبکه های عصبی عمیق abstract

لب خوانی از موضوعات محبوبی است که اخیرا0 بسیار مورد توجه قرار گرفته و میتواند کاربردهای متعددی مانند تشخیص گفتار در فیلمهای صامت، کمک به افراد ناشنوا و بیمارانی که مشکل تکلم دارند، کمک به شناسایی گفتار در محیطهای نویزی و.... داشته باشد. یک نکته مهم در خصوص لبخوانی آن است که دقت لب خوانی توسط انسان پایین و در سطح مطلوبی نیست. از طرفی دیگر، دقت سامانه های لب خوانی ماشینی نیز تا چند سال پیش پایین و در حد دقت انسان بوده اند. دو عامل بیان شده منجر به این شده که طراحی و پیاده سازی سامانه های لبخوان تاکنون رشد و گسترش زیادی نداشته باشند. خوشبختانه روشهای مبتنی بر شبکه های عصبی عمیق، جایگزین روشهای سنتی لبخوانی شده اند و در این حوزه، کارایی را به صورت بسیار مناسبی افزایش داده اند. با استفاده از این روشها، هم اکنون لبخوانی ماشینی به دقتی، بعضا0 تا بیش از 1,7 برابر لبخوانی انسانی دست پیدا کرده است. در این مطالعه، هدف طراحی یک سامانه کامل لب خوان در زبان فارسی و مبتنی بر استفاده از شبکه های عصبی عمیق، میباشد. در این راستا، ابتدا مجموعه داده بزرگ ومناسبی برای به کارگیری در شبکه های عصبی عمیق، فراهم کردیم. سپس یک مدل شبکه عمیق، تعریف کرده و آموزش دادیم. با توجه به کارهای انجام شده در زبان انگلیسی، رسیدن به دقت حدود 60% در داده های بدون محدودیت، مطلوب و مناسب است، که در این پژوهش به دقتی حدود 87% دست یافتیم.

ارائه یک سامانه لب خوان در زبان فارسی با استفاده از شبکه های عصبی عمیق Keywords:

ارائه یک سامانه لب خوان در زبان فارسی با استفاده از شبکه های عصبی عمیق authors

فاطمه امجدی

دانشجوی ارشد آیتی، دانشگاه قم

روح اله دیانت

عضو هیئت علمی دانشکده فنی مهندسی، دانشگاه قم

مقاله فارسی "ارائه یک سامانه لب خوان در زبان فارسی با استفاده از شبکه های عصبی عمیق" توسط فاطمه امجدی، دانشجوی ارشد آیتی، دانشگاه قم؛ روح اله دیانت، عضو هیئت علمی دانشکده فنی مهندسی، دانشگاه قم نوشته شده و در سال 1398 پس از تایید کمیته علمی پنجمین کنفرانس ملی مهندسی برق و مکاترونیک ایران پذیرفته شده است. کلمات کلیدی استفاده شده در این مقاله حداکثر سامانه لب خوان، شبکه عصبی بازگشتی، شبکه عصبی کانولوشن، شبکه عصبی عمیق هستند. این مقاله در تاریخ 26 بهمن 1398 توسط سیویلیکا نمایه سازی و منتشر شده است و تاکنون 467 بار صفحه این مقاله مشاهده شده است. در چکیده این مقاله اشاره شده است که لب خوانی از موضوعات محبوبی است که اخیرا0 بسیار مورد توجه قرار گرفته و میتواند کاربردهای متعددی مانند تشخیص گفتار در فیلمهای صامت، کمک به افراد ناشنوا و بیمارانی که مشکل تکلم دارند، کمک به شناسایی گفتار در محیطهای نویزی و.... داشته باشد. یک نکته مهم در خصوص لبخوانی آن است که دقت لب خوانی توسط انسان پایین و در ... . این مقاله در دسته بندی موضوعی شبکه عصبی طبقه بندی شده است. برای دانلود فایل کامل مقاله ارائه یک سامانه لب خوان در زبان فارسی با استفاده از شبکه های عصبی عمیق با 16 صفحه به فرمت PDF، میتوانید از طریق بخش "دانلود فایل کامل" اقدام نمایید.