CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

عملکرد الگوریتم های رگرسیون در بازشناسی احساس از طریق گفتار در فضای پیوسته احساس

عنوان مقاله: عملکرد الگوریتم های رگرسیون در بازشناسی احساس از طریق گفتار در فضای پیوسته احساس
شناسه ملی مقاله: ICTCK03_091
منتشر شده در سومین کنگره بین المللی فن آوری، ارتباطات و دانش در سال 1395
مشخصات نویسندگان مقاله:

زری فاتح - دانشگاه آزاد اسلامی واحد الکترونیکی تهران، گروه فنی و مهندسی، تهران، ایران
محمد خیراندیش - دانشگاه آزاد اسلامی واحد الکترونیکی تهران، گروه فنی و مهندسی، تهران، ایران

خلاصه مقاله:
بازشناسی احساس از طریق گفتار، موضوعی میان رشته ای در حوزهی روانشناسی، بازشناسی الگو و پردازش سیگنال می باشد که در دهه اخیر، توجه بسیاری از پژوهشگران را به خود جلب نموده است. در این مقاله، پنج گروه از ویژگی های مهم صوتی شامل ویژگی های عروضی LPC ،PLP ،MFCC و فرمنت ها جهت استخراج ویژگی، الگوریتم های کاهش ویژگی ، SBS و SFS جهت انتخاب بردار ویژگی بهینه و الگوریتم های رگرسیون خطی، بردار پشتیبان و فرآیند گوسی به منظور تخمین مولفه های احساسی گفتار شامل برانگیختگی، تسلط و جاذبه، در فضای پیوسته سه بعدی با استفاده از پایگاه داده VAM، بکار گرفته شده است. بر اساس نتایج آزمایشها، از بین پنج گروه ویژگی استفاده شده، بهترین نتایج با استفاده از ویژگی های عروضی حاصل شده است. اما برای ترکیب ویژگی های مختل، نتیجه کاملا بستگی به الگوریتم های رگرسیون و کاهش ویژگی دارد. بطوریکه بهترین نتایج مربوط به ترکیب همه ویژگی ها و با استفاده از الگوریتم رگرسیون فرآیند گوسی و کاهشی ویژگی SFS می باشد. در این شرایط، شریب همبستگی برای سه مولفه احساسی جاذبه، برانگیختگی و تسلط بترتیب برابر 43%، 74% و 74% می باشد.

کلمات کلیدی:
بازشناسی احساس از طریق گفتار، فضای پیوسته احساس، ویژگی های عروضی و طیفی، رگرسیون خطی، رگرسیون بردار پشتیبان، رگرسیون فرایند

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/611313/