سیویلیکا را در شبکه های اجتماعی دنبال نمایید.

بازشناسی گفتار با استفاده از روش های مدلهای مخفی مارکوف و شبکه های عصبی مصنوعی و سیستم های بازشناسی گفتار ترکیب ANN/HMM

Publish Year: 1393
Type: Conference paper
Language: Persian
View: 2,799

This Paper With 11 Page And PDF Format Ready To Download

Export:

Link to this Paper:

Document National Code:

AIHE08_277

Index date: 4 November 2014

بازشناسی گفتار با استفاده از روش های مدلهای مخفی مارکوف و شبکه های عصبی مصنوعی و سیستم های بازشناسی گفتار ترکیب ANN/HMM abstract

هدف ایجاد یک سیستم بازشناسی گفتار است که قادر به بازشناسی ارقام فارسی می باشد. سیستم های بازشناسی رقم دارای تعداد لغات کم هستند و برای کاربردهای مرتبط با تلفن، مانند شماره گیری از راه دور و یا صدور صورتحساب تلفنی بسیار اهمیت دارند. مسئله ارقام مسئله قابل دسترسی است، زیرا تعداد لغات محدود و ثابت است. البته بالا بودن کارایی این بازشناسی ها به شدت اهمیت دارد، زیرا این سیستم ها نیاز به دقت بسیار بالایی دارند. برای پیاده سازی مدل ترکیبی ANN/HMM برای بازشناسی گفتار فارسی از جعبه ابزار CSLU استفاده شد. تعداد 210 نمونه از گفتارهای یک فرد مذکر جمع آوری شد پس از حذف نویز و 47 عدد از نمونه ها به صورت دستی بر چسب گذاری آوایی شد. سپس بوسیله آن نمونه های آموزشی باقیمانده بصورت خودکار بر چسب زنی گردیده و شبکه های عصبی ANN جدیدی برای بازشناسی نهایی از نوع MLP سه لایه ایجاد شد. این ANN ها دارای 130 گره در لایه ورودی، 20 گره در لایه خروجی بودند. گره های لایه های پنهان متغیر و برابر 200،160،100،60 گرفته شده و مقایسه ای بین آنها انجام شد. برای استخراج ویژگی از چهار روش شامل MEL (12 ضریب)، مشتق MEL (12 ضریب)، انرژی (1ضریب)، و مشتق انرژی(1 ضریب)، استفاده شد و مقادیر هر کدام از این چهار روش با هم ترکیب و به شبکه عصبی داده شدند. ( به 130 گره ورودی شبکه عصبی). با اعمال بازشناسی روی داده های تست 99/4 درصد، حتی در یک مورد به دقت 100 درصد رسیدیم که با توجه به تعداد کم داده های گفتاری، نتیجه بسیار مطلوبی می باشد.

بازشناسی گفتار با استفاده از روش های مدلهای مخفی مارکوف و شبکه های عصبی مصنوعی و سیستم های بازشناسی گفتار ترکیب ANN/HMM Keywords:

شبکه های عصبی مصنوعی , مدلهای مخفی مارکوف , تبدیل فوریه گسسته , رقم کننده بردار , کدینگ پیشگویانه خطی , الگوریتم ویتربی , بیشینه کردن امید فازی , شبکه های عصبی احتمالی , شبکه های عصبی بازگشتی

بازشناسی گفتار با استفاده از روش های مدلهای مخفی مارکوف و شبکه های عصبی مصنوعی و سیستم های بازشناسی گفتار ترکیب ANN/HMM authors

فاطمه صالحی

Department of Computer Engineering, Najafabad Branch, Islamic Azad University, Isfahan, Iran Faculty of Electrical and Computer Engineering, Computer and Communication Networks Research Group

مقاله فارسی "بازشناسی گفتار با استفاده از روش های مدلهای مخفی مارکوف و شبکه های عصبی مصنوعی و سیستم های بازشناسی گفتار ترکیب ANN/HMM" توسط فاطمه صالحی، Department of Computer Engineering, Najafabad Branch, Islamic Azad University, Isfahan, Iran Faculty of Electrical and Computer Engineering, Computer and Communication Networks Research Group نوشته شده و در سال 1393 پس از تایید کمیته علمی کنفرانس ملی علوم مهندسی، ایده های نو (۸) پذیرفته شده است. کلمات کلیدی استفاده شده در این مقاله شبکه های عصبی مصنوعی، مدلهای مخفی مارکوف، تبدیل فوریه گسسته، رقم کننده بردار، کدینگ پیشگویانه خطی، الگوریتم ویتربی، بیشینه کردن امید فازی، شبکه های عصبی احتمالی، شبکه های عصبی بازگشتی هستند. این مقاله در تاریخ 13 آبان 1393 توسط سیویلیکا نمایه سازی و منتشر شده است و تاکنون 2799 بار صفحه این مقاله مشاهده شده است. در چکیده این مقاله اشاره شده است که هدف ایجاد یک سیستم بازشناسی گفتار است که قادر به بازشناسی ارقام فارسی می باشد. سیستم های بازشناسی رقم دارای تعداد لغات کم هستند و برای کاربردهای مرتبط با تلفن، مانند شماره گیری از راه دور و یا صدور صورتحساب تلفنی بسیار اهمیت دارند. مسئله ارقام مسئله قابل دسترسی است، زیرا تعداد لغات محدود و ثابت است. البته بالا بودن ... . برای دانلود فایل کامل مقاله بازشناسی گفتار با استفاده از روش های مدلهای مخفی مارکوف و شبکه های عصبی مصنوعی و سیستم های بازشناسی گفتار ترکیب ANN/HMM با 11 صفحه به فرمت PDF، میتوانید از طریق بخش "دانلود فایل کامل" اقدام نمایید.