شناسایی لهجه های زبان فارسی مبتنی بر مدل بردار هویت

سیستم شناسایی لهجه یکی از زمینه های پرکاربرد در پردازش گفتار است که لهجه یک گوینده را از روی صحبتش تشخیص میدهد. در این پژوهش دقت شناسایی برای 5 لهجه بومی زبان فارسی (ترکی ، تهرانی ، کردی، اصفهانی ،شمالی) با استفاده از ویژگیهای MFCC و MFCC+SDC و مدل سازهای قدرتمندی همچون GMM_UBM و بردار هویت و به دنبال آن توسط معیار معروف شباهت کسینوسی مورد ارزیابی قرار گرفت. نتایج نشان می دهد که استفاده از ویژگی MFCC+SDC و مدلساز بردار هویت می تواند دقت میانگین سیستم شناسایی لهجه را تا 66.08 درصد بالاببرد در حالیکه دقت میانگین برای مدل ساز 49.11 GMM_UBM درصد میباشد.

Keywords:

شناسایی لهجه بومی , مدل GMM_UBM , مدل بردار هویت

Authors

رسول مهدوی

دانشگاه صداو سیمای جمهوری اسلامی ایران

اعظم باستان فرد

دانشگاه صداو سیمای جمهوری اسلامی ایران

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/984816

شناسه ملی سند علمی:

CECCONF08_037

تاریخ نمایه سازی: 30 آذر 1398

How to Cite to This Paper:

If you want to refer to this Paper in your research work, you can simply use the following phrase in the resources section:

مهدوی، رسول و باستان فرد، اعظم،1398،شناسایی لهجه های زبان فارسی مبتنی بر مدل بردار هویت،The 8th National Conference on Computer Science and Engineering and Information Technology،Babol،https://civilica.com/doc/984816

Scientometrics

The specifications of the publisher center of this Paper are as follows:

Ranking of Iran Broadcasting University

Type of center: دانشگاه دولتی

Paper count: 890

In the scientometrics section of CIVILICA, you can see the scientific ranking of the Iranian academic and research centers based on the statistics of indexed articles.

مقالات پیشنهادی مرتبط

مقالات فوق بر اساس داده کاوی مقالات مطالعه شده توسط پژوهشگران محاسبه شده است.