شناسایی لهجه های زبان فارسی مبتنی بر مدل بردار هویت

Publish Year: 1398
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 471

This Paper With 6 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CECCONF08_037

تاریخ نمایه سازی: 30 آذر 1398

Abstract:

سیستم شناسایی لهجه یکی از زمینه های پرکاربرد در پردازش گفتار است که لهجه یک گوینده را از روی صحبتش تشخیص میدهد. در این پژوهش دقت شناسایی برای 5 لهجه بومی زبان فارسی (ترکی ، تهرانی ، کردی، اصفهانی ،شمالی) با استفاده از ویژگیهای MFCC و MFCC+SDC و مدل سازهای قدرتمندی همچون GMM_UBM و بردار هویت و به دنبال آن توسط معیار معروف شباهت کسینوسی مورد ارزیابی قرار گرفت. نتایج نشان می دهد که استفاده از ویژگی MFCC+SDC و مدلساز بردار هویت می تواند دقت میانگین سیستم شناسایی لهجه را تا 66.08 درصد بالاببرد در حالیکه دقت میانگین برای مدل ساز 49.11 GMM_UBM درصد میباشد.

Authors

رسول مهدوی

دانشگاه صداو سیمای جمهوری اسلامی ایران

اعظم باستان فرد

دانشگاه صداو سیمای جمهوری اسلامی ایران