سامانه شناسایی گفتار فارسی انتها به انتها با استفاده از پس پردازش دادگان پروژه موزیلا

سعید, زارعی; یاسر, شکفته

سامانه شناسایی گفتار فارسی انتها به انتها با استفاده از پس پردازش دادگان پروژه موزیلا

عنوان مقاله: سامانه شناسایی گفتار فارسی انتها به انتها با استفاده از پس پردازش دادگان پروژه موزیلا
شناسه ملی مقاله: TECCONF05_092
منتشر شده در پنجمین کنفرانس ملی فناوری در مهندسی برق و کامپیوتر (Tec ۲۰۲۱) در سال 1400

مشخصات نویسندگان مقاله:

سعید زارعی - دانشکده مهندسی و علوم کامپیوتر، دانشگاه شهید بهشتی تهران، ایران
یاسر شکفته - دانشکده مهندسی و علوم کامپیوتر، دانشگاه شهید بهشتی تهران، ایران

خلاصه مقاله:

سامانه های شناسایی گفتار انتها به انتها، سیگنال خام گفتار را به عنوان ورودی گرفته و دنباله برچسب متناظر آن سیگنال را تولید می کنند. پیاده سازی یک سامانه شناسایی گفتار برای هر زبان نیازمند دادگان مناسب برای آن زبان است و بدون دادگان این امر میسر نخواهد شد. تولید دادگانی که هم دارای برچسب مناسب باشد و هم فایل صوتی آن از کیفیت مناسبی برخوردار باشد، نیازمند صرف هزینه است. پروژه موزیلا اخیرا با استفاده از مجموعه دادگانی که برای زبان های مختلف تهیه کرده به ساخت این سامانه ها حتی برای زبان هایی که دادگان کمی در دسترس دارند، کمک شایانی نموده است. در این مقاله ابتدا بر روی این دادگان پس پردازش انجام شد و سپس با استفاده از آن، یک مدل صوتی آموزش داده شد. با این پیاده سازی درصد خطای کلمه سامانه بر روی دادگان آزمون فارس دات کوچک به ۴۶.۶۰ و درصد خطای حرف سامانه به ۱۷.۸۴ رسید

کلمات کلیدی:

انتها به انتها، پس پردازش دادگان موزیلا، شناسایی خودکار گفتار.

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1281601/