تشخیص ارقام گفتاری فارسی با استفاده از شبکه های یادگیری عمیق

سحر زربافی; کورش کیانی; راضیه راستگو

تشخیص ارقام گفتاری فارسی با استفاده از شبکه های یادگیری عمیق

Publish place: Journal Of Modeling in Engineering، Vol: 21، Issue: 74

Publish Year: 1402

نوع سند: مقاله ژورنالی

زبان: Persian

This Paper With 10 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/1919097

شناسه ملی سند علمی:

JR_JME-21-74_011

تاریخ نمایه سازی: 30 بهمن 1402

Abstract:

طبقه بندی ارقام جدا شده چالش اساسی برای بسیاری از سیستم های طبقه بندی گفتار است. درحالی که کارهای زیادی بر روی زبان های گفتاری انجام شده است، تحقیقات محدودی در مورد داده های رقمی گفتاری فارسی در ادبیات گزارش شده است و تمامی تحقیقات مربوط به اعداد صفر تا ۹ بوده است. برای این منظور، پایگاه داده ی جامعی شامل بازه ی وسیعتری از اعداد با مشارکت ۱۴۵ نفر که شامل هفتاد نفر مرد و ۷۵ نفر زن هستند، جمع آوری گردیده است. پایگاه داده مذکور، بازه عددی صفر تا ۵۹۹ را پوشش می دهد. پس از پیش پردازش داده ها، داده های صوتی تبدیل به طیف نگار مل شده و برای استخراج ویژگی و طبقه بندی داده ها از شبکه عصبی کانولوشنی و نیز یک مدل ترکیبی شامل مدل ترنسفورمر و حافظه کوتاه و بلند مدت استفاده گردیده است. نتایج تجربی بر روی پایگاه داده جمع آوری شده حاکی از دقت اعتبارسنجی ۹۸.۰۳ درصد می باشد. آنالیزهای مختلفی نیز بر روی آزمایش و آزمون مدل ها صورت گرفته است.

Keywords:

ارقام گفتاری , طبقه بندی , ارقام گفتاری فارسی , طیف نگار مل , پایگاه داده , ترنسفورمر

Authors

سحر زربافی

دانشگاه سمنان، دانشکده برق و کامپبوتر

کورش کیانی

دانشکده مهندسی برق و کامپیوتر دانشگاه سمنان

راضیه راستگو

دانشکده برق و کامپیوتر دانشگاه سمنان

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

P. Sanderson, "Cognitive work analysis and the analysis, design, and ...
A. Gunawan, "English digits speech recognition system based on hidden ...
R. Rastgoo and V. Sattari Naeini, "A neurofuzzy QoS-aware routing ...
Rastgoo, R. and Sattari Naeini, V. Tuning parameters of the ...
N. Majidi, K. Kiani, and R. Rastgoo, "A deep model ...
K. Kiani, R. Hematpour, and R. Rastgoo, "Automatic grayscale image ...
R. Rastgoo, and V. Sattari-Naeini, "Gsomcr: Multi-constraint genetic-optimized qos-aware routing ...
R. Rastgoo, and K. Kiani, "Face recognition using fine-tuning of ...
Y. Xu, "English speech recognition and evaluation of pronunciation quality ...
M.K. Scheuerman, J.M. Paul, and J.R. Brubaker, "How computers see ...
Li, H., et al., "A convolutional neural network cascade for ...
R. Sharmin, S.K. Rahut, and M.R. Huq, "Bengali spoken digit ...
O. Sen, and P. Roy, "A convolutional neural network based ...
W. Xiong, et al., "The Microsoft ۲۰۱۷ conversational speech recognition ...
A. Graves, N. Beringer, and J. Schmidhuber, "A comparison between ...
A. Graves, and J. Schmidhuber, "Framewise phoneme classification with bidirectional ...
D.P. Kingma, and J. Ba, "Adam: A method for stochastic ...
A. Dixit, A. Vidwans, and P. Sharma, "Improved MFCC and ...
Z. Ali, et al., "Database development and automatic speech recognition ...
G. Muhammad, Y.A. Alotaibi, and M.N. Huda, "Automatic speech recognition ...
S.A. Sumon, et al., "Bangla short speech commands recognition using ...
S.K. Ghanty, S.H. Shaikh, and N. Chaki, "On recognition of ...
A. Gupta, and K. Sarkar, "Recognition of spoken bengali numerals ...
D.S.S. Megala, "Detection And Classification Of Speech Pathology Using Deep ...
Y. Gu, et al., "Speech intention classification with multimodal deep ...
O. Mamyrbayev, et al., "Voice identification using classification algorithms," Intelligent ...
B. Zada, and R. Ullah, "Pashto isolated digits recognition using ...
M. Dawodi, et al., "Dari speech classification using deep convolutional ...
F.M. Marcolla, R. de Santiago, and R.L. Dazzi, "Novel Lie ...

نمایش کامل مراجع