تصدیق هویت گوینده با نرخ بیت بسیار پایین مبتنی بر چندی سازی برداری چند مرحله ای و مقاوم نسبتبه نویزهای نادیده

Publish Year: 1386
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,235

This Paper With 7 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ACCSI13_107

تاریخ نمایه سازی: 25 آبان 1386

Abstract:

استفاده از روشهای کد نمودن اطلاعات گفتاری برای ارسال و استفاده از کاربردهای مختلف به خصوص در عرصه اینترنت، یکی از زمینه های مهم تحقیقات پژوهشگران در زمینه گفتار می باشد. در میان روشهای مختلف تفکیک فعالیتهای شناسایی میان سرویس دهنده و سرویس گیرنده، روش توامان سرویس دهنده – سرویس گیرنده نتایج بهتری را هم در میزان کاهش بار محاسباتی و هم در کاهش نیاز به پهنای باند زیاد به دست می دهد. همچنین استفاده از روش چندی سازی برداری چند مرحله ای یا MSVQ به علت کاهش نرخ بین ارسالی و دقت قابل قبول در کوانتیزه نمودن داده ها یک روش مناسب برای این امر می باشد. با تلفیق توپولوژی سرویس دهنده – سرویس گیرنده و روش MSVQ در بحث بازشناسی گوینده، راندمان های قابل قبولی بدست آمده است. کاهش نرخ بیت ارسالی از حدود 400 بیت بر فریم بر حدود 40 بیت بر فریم نیز از دیگر موارد جالب توجه در اینروش می باشد. همچنین با در نظر گرفتن چند مدل بر اساس نویزها و SNR های مختلف رای هر گوینده، فرایند مقاوم سازی سیستم نسبت به نویزهای مختلف با شدت های گوناگون انجام گرفته است که نتایج حاصل نشان دهنده کارایی خوب این روش حتی در مواردی است که نوع نویز داده های آموزش و داده های تست متفاوت هستند.

Keywords:

Authors

محمدمهدی همایون پور

عضو هیئت علمی ، دانشگاه صنعتی امیرکبیر، دانشکده مهندسی کامپیوتر و فن

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • مجید رئیسی دهکردی، محمد مهدی همایونپور، جهانشاه کبودیان، بهبود روشهای ...
  • C. G. M. Fant, "Acoustic Description and Classification of Phonetic ...
  • Digalakis, Vassilis Neumeyer, Leonardo Perakakis, Manolis, "Product-code Vector quantization of ...
  • V. Digalakis, L. Neumeyer, and M. Perakakis, *Quantization of Cepstral ...
  • Ganesh N. Ramaswamy, Ponani S. Gopalakri shnan, "Compression of acoustic ...
  • Wai c. chu , "speech coding algorithms, foundation and evolution ...
  • W. P. LeBlanc, B. Battacharya, S. A. Mahmoud, and V. ...
  • S. Grassi, M. Ansorge, F. Pellandini, and P.-A. Farine, "Distributed ...
  • C. Broun, W. Campbell, D. Pearce, H. Kelleher, "Speaker recognition ...
  • Client-Server I Client Side l2 Server Side ...
  • نمایش کامل مراجع