دسته بندی گفتار و موسیقی بوسیله شبکه عصبی فازی - PSO با استفاده از بعد فراکتالی

عباس, یزدان پناه; محمد مهدی, همایون پور

دسته بندی گفتار و موسیقی بوسیله شبکه عصبی فازی - PSO با استفاده از بعد فراکتالی

عنوان مقاله: دسته بندی گفتار و موسیقی بوسیله شبکه عصبی فازی - PSO با استفاده از بعد فراکتالی
شناسه ملی مقاله: ACCSI14_227
منتشر شده در چهاردهمین کنفرانس سالانه انجمن کامپیوتر ایران در سال 1387

مشخصات نویسندگان مقاله:

عباس یزدان پناه - آزمایشگاه سیستم های هوشمند صوتی-گفتاری دانشکده مهندسی کامپیوتر و فن
محمد مهدی همایون پور - آزمایشگاه سیستم های هوشمند صوتی-گفتاری دانشکده مهندسی کامپیوتر و فن

خلاصه مقاله:

برای جداسازی گفتار از موسیقی روش های متفاوتی پیشنهاد شده و مورد استفاده قرار گرفته است. در این مقاله با پیشنهاد دو ویژگی برگرفته از بعد فراکتالی و استفاده از یک شبکه عصبی فازی و بهبود آن به کمک PSO نشان داده است که استفاده از این راهبرد نسبت به راهبردهای مشابه، که معمولا از تعداد ویژگی های زیادی برای دسته بندی استفاده می کنند، نتایج قابل قبولتری دارد. همچنین نشان داده شده است با استفاده از شبکه عصبی فازی می توان به نتایج بهتری نسبت به استفاده از روش های معمول همانند مدل مخلوط گوسی GMM با پیچیدگی یکسان با شبکه عصبی فازی، دست یافت.

کلمات کلیدی:

جداسازی گفتار از موسیقی، دسته بندی، شبکه عصبی فازی، مدل مخلوط گوسی ، PSO ، ANFIS

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/60975/