استخراج ویژگی های در برگیرنده الگوهای زمانی سیگنال گفتار با استفاده از مدل AR

Publish Year: 1386
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,809

This Paper With 9 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ACCSI13_034

تاریخ نمایه سازی: 25 آبان 1386

Abstract:

استفاده از الگوهای زمانی موجود در دنباله زمانی هر یک از ویژگیهای استخراج شده، منجر به بهبود بازشناسی گفتار در شرایط تطابق و عدم تطابق دادگان تعلیم و آزمون میگردد. در این مقاله یک روش جدید استخراج و پیادهسازی الگوهای زمانی بیان میگردد. در این روش ابتدا، توالی زمانی هر یک از ویژگیهای استخراج شده از قابهای گفتاری به عنوان یک سری زمانی در نظر گرفته میشود. سپس ضرایب مدلAR از سریهای زمانی دادگان تعلیم محاسبه میگردد. سرانجام با استفاده از پارامترهایِ مدل های بدست آمده ، سری های زمانی استخراج شده از مجموعه دادگان، مورد پالایش زمانی قرار می گیرد . استفاده از ویژگیهای پالایش شده در مرحلة آزمایش، منجر به بهبود بازشناسی (دقت واج) به میزان 3/4% % در دادگان آزمون تمیز می شود . این در حالی است که در شرایط نویزی، تا ٣٢ درصد بهبود بازشناسی حاصل میگردد. علاوه بر این، نتایج به دست آمده از روش پیشنهادی با روشهای مشابه مورد مقایسه قرار گرفته است . همچنین کارائی این روش، در مراحل قبل و بعد از پالایش ویژگیها، بررسی خواهد شد.

Authors

یاسر شکفته

دانشجوی کارشناسی ارشد دانشگاه صنعتی امیرکبیر

فرشاد الماس گنج

استادیار دانشکده مهندسی پزشکی دانشگاه صنعتی امیرکبیر

یاسر مریخی آهنگرکلایی

دانشجوی کارشناسی ارشد دانشگاه علوم پزشکی شهید بهشتی

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • م. رحیمی‌نژاد، س.ع. سیدصالحی، مقایسه و ارزیابی کارآیی انواع روش‌های ...
  • ی. شکفته، ف. الماس‌گنج، بهبود بازشناسی گفتار با استفاده از ...
  • ی. شکفته، ف. الماس‌گنج، ا. دلیری، پردازش غیرخطی و چندباند ...
  • Lippmann, R.P., Speech perception by humans and machines. Speech Comrmun ...
  • Hermansky H., and Sharma S., Temporal patterns (TRAPS) in ASR ...
  • Athineos M., and Ellis D., Autoregress ive Modeling of Temporal ...
  • Chen C., and Bilmes J., MVA Processing of Speech Features, ...
  • Chen B., Chang S., and Sivadas S., Learning discriminative temporal ...
  • FARSDAT, Persian speech database, Available from: _ ://www _ e ...
  • SPIB, SPIB noise data, 1995, Available ...
  • HTK, HMM Tool Kit, Available ...
  • Hermansky H., and Fousek P., Mul ti-resolution RASTA filtering for ...
  • نمایش کامل مراجع