سیویلیکا را در شبکه های اجتماعی دنبال نمایید.

کاهش خطای سیستم های استخراج متن از صوت در زبان های با منابع کم

Publish Year: 1403
Type: Conference paper
Language: Persian
View: 60

This Paper With 11 Page And PDF Format Ready To Download

Export:

Link to this Paper:

Document National Code:

ELCM08_015

Index date: 10 December 2024

کاهش خطای سیستم های استخراج متن از صوت در زبان های با منابع کم abstract

از دهه های گذشته سیستم هایی جهت تشخیص متن از صوت ساخته شدند، یکی از شناخته شده ترین این سیستم ها، Whisper AI ساخت شرکت OpenAI است که از ده ها زبان زنده دنیا پشتیبانی کرده و می تواند اصوات تولیدی اشخاص با زبان های گوناگون را به متن تبدیل کند. این سیستم عملکرد مناسبی در زبان های با منابع بالا همانند انگلیسی دارد با این حال عملکرد آن در زبان های با منابع کم همانند فارسی چندان مطلوب نیست و دارای نرخ خطای نسبتا بالایی است. از این رو در این مقاله سعی بر این است که نرخ خطا در کلمه در این سیستم را به کمک روش هایی همچون بهره گیری از سیستم های کاهنده نویز و LLM ها، کاهش دهد. در نهایت، روش پیشنهادی در اسنیپت هایی از ۲۰ فایل صوتی مورد سنجش قرار گرفت و نتیجه آن در کاهش خطا با استفاده از LLM ،به طور میانگین در مدل Claude برابر با ۴۰.۲۳ درصد و در مدل Mistral هم۱۹.۳۶ درصد بوده است.

کاهش خطای سیستم های استخراج متن از صوت در زبان های با منابع کم Keywords:

کاهش خطای سیستم های استخراج متن از صوت در زبان های با منابع کم authors

علی خزیر

دانشجو دکتری،گروه مهندسی کامپیوتر،دانشکده فنی و مهندسی واحد رشت،دانشگاه آزاد اسلامی،رشت،ایران

سودابه پورذاکر عربانی

استادیار،گروه مهندسی کامپیوتر،دانشکده فنی و مهندسی واحد لاهیجان،دانشگاه آزاد اسلامی،لاهیجان،ایران

مقاله فارسی "کاهش خطای سیستم های استخراج متن از صوت در زبان های با منابع کم" توسط علی خزیر، دانشجو دکتری،گروه مهندسی کامپیوتر،دانشکده فنی و مهندسی واحد رشت،دانشگاه آزاد اسلامی،رشت،ایران؛ سودابه پورذاکر عربانی، استادیار،گروه مهندسی کامپیوتر،دانشکده فنی و مهندسی واحد لاهیجان،دانشگاه آزاد اسلامی،لاهیجان،ایران نوشته شده و در سال 1403 پس از تایید کمیته علمی هشتمین کنفرانس بین المللی مهندسی برق، کامپیوتر و مکانیک پذیرفته شده است. کلمات کلیدی استفاده شده در این مقاله تشخیص خودکار گفتار، کاهش نویز صوت، مدل زبانی بزرگ هستند. این مقاله در تاریخ 20 آذر 1403 توسط سیویلیکا نمایه سازی و منتشر شده است و تاکنون 60 بار صفحه این مقاله مشاهده شده است. در چکیده این مقاله اشاره شده است که از دهه های گذشته سیستم هایی جهت تشخیص متن از صوت ساخته شدند، یکی از شناخته شده ترین این سیستم ها، Whisper AI ساخت شرکت OpenAI است که از ده ها زبان زنده دنیا پشتیبانی کرده و می تواند اصوات تولیدی اشخاص با زبان های گوناگون را به متن تبدیل کند. این سیستم عملکرد مناسبی در زبان های با منابع ... . برای دانلود فایل کامل مقاله کاهش خطای سیستم های استخراج متن از صوت در زبان های با منابع کم با 11 صفحه به فرمت PDF، میتوانید از طریق بخش "دانلود فایل کامل" اقدام نمایید.