سامانه شناسایی گفتار فارسی انتها به انتها با استفاده از پس پردازش دادگان پروژه موزیلا

سعید زارعی; یاسر شکفته

سامانه شناسایی گفتار فارسی انتها به انتها با استفاده از پس پردازش دادگان پروژه موزیلا

Publish place: Fifth National Conference on Computer Engineering

Publish Year: 1400

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 6 Page And PDF and WORD Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/1281601

شناسه ملی سند علمی:

TECCONF05_092

تاریخ نمایه سازی: 11 مهر 1400

Abstract:

سامانه های شناسایی گفتار انتها به انتها، سیگنال خام گفتار را به عنوان ورودی گرفته و دنباله برچسب متناظر آن سیگنال را تولید می کنند. پیاده سازی یک سامانه شناسایی گفتار برای هر زبان نیازمند دادگان مناسب برای آن زبان است و بدون دادگان این امر میسر نخواهد شد. تولید دادگانی که هم دارای برچسب مناسب باشد و هم فایل صوتی آن از کیفیت مناسبی برخوردار باشد، نیازمند صرف هزینه است. پروژه موزیلا اخیرا با استفاده از مجموعه دادگانی که برای زبان های مختلف تهیه کرده به ساخت این سامانه ها حتی برای زبان هایی که دادگان کمی در دسترس دارند، کمک شایانی نموده است. در این مقاله ابتدا بر روی این دادگان پس پردازش انجام شد و سپس با استفاده از آن، یک مدل صوتی آموزش داده شد. با این پیاده سازی درصد خطای کلمه سامانه بر روی دادگان آزمون فارس دات کوچک به ۴۶.۶۰ و درصد خطای حرف سامانه به ۱۷.۸۴ رسید

Keywords:

انتها به انتها , پس پردازش دادگان موزیلا , شناسایی خودکار گفتار.

Authors

سعید زارعی

دانشکده مهندسی و علوم کامپیوتر، دانشگاه شهید بهشتی تهران، ایران

یاسر شکفته

دانشکده مهندسی و علوم کامپیوتر، دانشگاه شهید بهشتی تهران، ایران