سامانه شناسایی گفتار فارسی انتها به انتها با استفاده از پس پردازش دادگان پروژه موزیلا

Publish Year: 1400
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 352

This Paper With 6 Page And PDF and WORD Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

TECCONF05_092

تاریخ نمایه سازی: 11 مهر 1400

Abstract:

سامانه های شناسایی گفتار انتها به انتها، سیگنال خام گفتار را به عنوان ورودی گرفته و دنباله برچسب متناظر آن سیگنال را تولید می کنند. پیاده سازی یک سامانه شناسایی گفتار برای هر زبان نیازمند دادگان مناسب برای آن زبان است و بدون دادگان این امر میسر نخواهد شد. تولید دادگانی که هم دارای برچسب مناسب باشد و هم فایل صوتی آن از کیفیت مناسبی برخوردار باشد، نیازمند صرف هزینه است. پروژه موزیلا اخیرا با استفاده از مجموعه دادگانی که برای زبان های مختلف تهیه کرده به ساخت این سامانه ها حتی برای زبان هایی که دادگان کمی در دسترس دارند، کمک شایانی نموده است. در این مقاله ابتدا بر روی این دادگان پس پردازش انجام شد و سپس با استفاده از آن، یک مدل صوتی آموزش داده شد. با این پیاده سازی درصد خطای کلمه سامانه بر روی دادگان آزمون فارس دات کوچک به ۴۶.۶۰ و درصد خطای حرف سامانه به ۱۷.۸۴ رسید

Keywords:

انتها به انتها , پس پردازش دادگان موزیلا , شناسایی خودکار گفتار.

Authors

سعید زارعی

دانشکده مهندسی و علوم کامپیوتر، دانشگاه شهید بهشتی تهران، ایران

یاسر شکفته

دانشکده مهندسی و علوم کامپیوتر، دانشگاه شهید بهشتی تهران، ایران