بررسی تاثیر ترکیب امتیازات حاصل از بردارهای ویژگی متفاوت گفتار در فضای i-Vector برای سیستم تایید هویت گوینده مستقل از متن

Publish Year: 1395
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 609

This Paper With 8 Page And PDF and WORD Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ACCSI22_031

تاریخ نمایه سازی: 13 شهریور 1396

Abstract:

استفاده از گفتار برای تشخیص هویت افراد با وجود مزایای زیادی چون کاربرپسند بودن و پیچیدگی پیاده سازی کم، محدودیت هایی نیز دارد که از آن جمله می توان به کاهش دقت این روش در محیط های واقعی به دلیل حضور نویزهای مختلف اشاره کرد. تا کنون روش های گوناگونی برای حل این مشکل در مراحل مختلف سیستم تایید هویت گوینده یعنی استخراج ویژگی، مدل سازی و مقایسه و امتیازدهی ارایه شده است که البته هیچکدام مصون از خطا نیستند. ترکیب روش های مختلف در مراحل گوناگون یک راه حل مرسوم برای بهبود کارایی سیستم های تشخیص هویت است. در این مقاله تاثیر ترکیب ویژگی های مختلف در مرحله امتیازات بر کارایی سیستم تایید هویت گوینده، برای چهار بردار ویژگی MFCC، LFCC، IMFCC و PNCC، در شرایط گفتار تمیز و نویزی مورد ارزیابی و مقایسه قرار گرفته است. مدل سازی گوینده در فضای بردارهای هویت و بر مبنای الگوریتم i-Vector/PLDA انجام گرفته و در پیاده سازی آزمون ها برای سیگنال گفتار و نویز به ترتیب از دادگان های TIMIT و NOISEX-92 استفاده گردیده است. نتایج آزمون ها نشان می دهد ترکیب امتیازات حاصل از بردارهای متفاوت انرژی خطای سیستم تایید هویت گوینده را کاهش می دهد و این کاهش در برخی حالات بسیار چشمگیر است.

Authors

محسن محمدی

دانشجوی دکتری برق/مخابرات سیستم، پژوهشکده برق جهاد دانشگاهی، تهران

حمیدرضا صادق محمدی

دانشیار پژوهش، پژوهشکده برق جهاد دانشگاهی، تهران