کاهش خطای سیستم های استخراج متن از صوت در زبان های با منابع کم

علی خزیر; سودابه پورذاکر عربانی

کاهش خطای سیستم های استخراج متن از صوت در زبان های با منابع کم

Publish place: 8th International Conference on Electrical, Computer and Mechanical Engineering

Publish Year: 1403

Type: Conference paper

Language: Persian

This Paper With 11 Page And PDF Format Ready To Download

DOWNLOAD Paper

Certificate
I'm the author of the paper

Export:

Link to this Paper:

https://civilica.com/doc/2131406

Document National Code:

ELCM08_015

Index date: 10 December 2024

کاهش خطای سیستم های استخراج متن از صوت در زبان های با منابع کم abstract

از دهه های گذشته سیستم هایی جهت تشخیص متن از صوت ساخته شدند، یکی از شناخته شده ترین این سیستم ها، Whisper AI ساخت شرکت OpenAI است که از ده ها زبان زنده دنیا پشتیبانی کرده و می تواند اصوات تولیدی اشخاص با زبان های گوناگون را به متن تبدیل کند. این سیستم عملکرد مناسبی در زبان های با منابع بالا همانند انگلیسی دارد با این حال عملکرد آن در زبان های با منابع کم همانند فارسی چندان مطلوب نیست و دارای نرخ خطای نسبتا بالایی است. از این رو در این مقاله سعی بر این است که نرخ خطا در کلمه در این سیستم را به کمک روش هایی همچون بهره گیری از سیستم های کاهنده نویز و LLM ها، کاهش دهد. در نهایت، روش پیشنهادی در اسنیپت هایی از ۲۰ فایل صوتی مورد سنجش قرار گرفت و نتیجه آن در کاهش خطا با استفاده از LLM ،به طور میانگین در مدل Claude برابر با ۴۰.۲۳ درصد و در مدل Mistral هم۱۹.۳۶ درصد بوده است.

کاهش خطای سیستم های استخراج متن از صوت در زبان های با منابع کم Keywords:

تشخیص خودکار گفتار , کاهش نویز صوت , مدل زبانی بزرگ

کاهش خطای سیستم های استخراج متن از صوت در زبان های با منابع کم authors

علی خزیر

دانشجو دکتری،گروه مهندسی کامپیوتر،دانشکده فنی و مهندسی واحد رشت،دانشگاه آزاد اسلامی،رشت،ایران

سودابه پورذاکر عربانی

استادیار،گروه مهندسی کامپیوتر،دانشکده فنی و مهندسی واحد لاهیجان،دانشگاه آزاد اسلامی،لاهیجان،ایران