ارائه چند روش ترکیبی جهت تقویت پارامترها در برابر شرائط غیر متعارف در سیستم های تعیین هویت گوینده

Publish Year: 1384
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,378

This Paper With 10 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ICIKT02_048

تاریخ نمایه سازی: 12 دی 1386

Abstract:

در این مقاله به بررسی بعضی روشهای مقابله با نویز ، عوامل مزاحم روی خط تلفن، تاثیرات کانال و نوع میکروفن نظیر تکنیک وزندهی خطی، تکنیک لیفتر کردن میانگذر، تکنیک PFL و ضرائب دینامیکی دلتا کپسترال بتنهائی یا در ترکیب با یکدیگر در کارائی تعیین هویت گوینده پرداخته ایم. بدین جهت گفتار 50 گوینده برای اموزش مدلهای گویندگان و آزمایش سیستم، از دادگان گفتار فارسی دات تلفنی استفاده گردید. ابتدا سکوت از گفتارگویندگان حذف و سپس جهت اعمال شرائط متفاوت آموزش و آزمایش، نسبت سیگنال به نویر فایلهای صوتی به مقادیر 5، 10، 15 و 20 دسی بل تغییر داده شد. ویژگی مورد استفاده ضرائب کپسترال مبتنی بر معیار مل می باشد . اکثر روشهای فوق باعث بهبود عملکرد سیستم تعیین هویت شدند و روش وزندهی خطی از بین این روشها نسبت به روش استفاده از ضرائب کپسترال مبتنی بر معیار مل بتنهائی و بدون حذف ضریب اول کپستروم، بهترین روش مقاوم سازی در برابر نویز و تاثیرات کانال انتقال تشخیص داده شد. همچنین در این مقاله ترکیبهای جدیدی از روش های فوق ارائه گردیده است که با توجه به نتایج بدست آمده در افزایش مقاومت سیستم در برابر فاکتورهای محیطی بسیار موثر می باشند. بهترین نتیجه بدست امده ترکیب ضرائب کپسترال مبتنی بر معیار مل و اعمال روش وزندهی خطی در یک بردار ویژگی همراه با ضرائب دلتا می باشد که موجب افزایش 5/4% در میانگین راندمان سیستم بازاء داده های اموزشی و 2/39% بازاء داده های آزمایشی گردید.

Authors

محمدمهدی همایونپور

استادیار ، آزمایشگاه سیستم های هوشمند صوتی و گفتاری، دانشکده مهندسی ک

ابراهیم شریف نبوی

کارشناسی ارشد مهندسی کامپیوتر، آزمایشگاه سیستم های هوشمند صوتی و گفت

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • R.J. Mammone, X. Zhang _، #Robust Speaker Recognition - A ...
  • B. H. Juang, L. R. Rabiner, and J. Wolpon, "On ...
  • of ADPCM Speech Coding with Enhancement؛ [3] V. Ramamoorthy, N. ...
  • L. R. Rabiner, , B. H. Juang, "Fundamentals of Speech ...
  • نمایش کامل مراجع