تشخیص سن از روی سیگنال صوتی با استفاده از طیف گفتاری
Publish Year: 1394
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 4,004
This Paper With 7 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
POWERMINOO02_044
تاریخ نمایه سازی: 30 بهمن 1394
Abstract:
برآورد سن از طریق ویژگی های گفتار انسان یک موضوع جالب در تشخیص خودکار صدا است. اگرچه مطالعات زیادی در این زمینه وجود دارد اما نیاز به مطالعات بیشتر به ویژه برای گویندگان فارسی زبان وجود دارد. در برآورد سن مانند سایر سیستم های پردازش صدا ما با دو چالش اساسی روبه رو هستیم، ابتدا پیدا کردن روشی مناسب برای استخراج ویژگی های صدا و سپس انتخاب یکروش قابل اعتماد برای الگوی طبقه بندی. در این مقاله ما یک سیستم تخمین سن برای طبقه بندی چهار گروه سنی مختلف پیشنهادکرده ایم. ضرایب پیش بینی خطی ادراکی و ضریب کپسترال مل- فرکانس به عنوان ویژگی های گفتار استخراج و مدل پرسپترون چندلایهبرای روش طبقهبندی استفاده شده است. در نهایت، نتایج حاصل از این تحقیق با روش ماشین بردار پشتیبانمقایسه شده است. براین اساس ما توانستیم با کمک شبکه عصبی از نوعپرسپترون چند لایه درصد خطا را نسبت به روش ماشین بردار پشتیبان، به میزان قابل توجهی بهبود دهیم. هدف اصلی ما ایجاد یک سیستم خودکار سریع جهت تخمین سن افراد و همچنین بالا تر بردن دقت تخمین سن می باشد
Keywords:
تخمین سن , ماشین بردار پشتیبان , شبکه عصبی پرسپترون چند لایه , , ضرایب پیش بینی خطی ادراکی , ضرایب کپسترال مل فرکانسی
Authors
امیر مزینی
دانشجوی کارشناسی ارشد، گروه برق، واحد بجنورد، دانشگاه آزاد اسلامی تربت حیدریه، ایران
محمد نصیری
دانشجوی دکتری، گروه برق، عضو هیات علمی دانشگاه آزاد اسلامی واحد بجنورد، مشهد، ایران-
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :