سیویلیکا را در شبکه های اجتماعی دنبال نمایید.

ادغام دو ویژگی MFCC و LPCC با استفاده از الگوریتم PSO برای تشخیص جنسیت گوینده

Publish Year: 1403
Type: Conference paper
Language: Persian
View: 162

This Paper With 13 Page And PDF Format Ready To Download

Export:

Link to this Paper:

Document National Code:

STCONF07_163

Index date: 10 August 2024

ادغام دو ویژگی MFCC و LPCC با استفاده از الگوریتم PSO برای تشخیص جنسیت گوینده abstract

شناسایی هویت گوینده در داده های صوتی ، باعث جهش در جمع آور ی اطلاعات سیگنال ی شده است ، به این منظور ویژگی های ضرایب کپسترال بر پایه مل MFCC و ضرایب کپسترال بر پایه پیش گویی خطی LPCC دو ویژگی موفق در زمینه دسته بندی های حوزه گفتار، مخصوصا تشخیص جنسیت گوینده صدا شناخته می شوند. این ویژگی های گفته شده چند بعدی هستند ، اما همه ضرایب موجود در این ویژگی ها تاثیر مثبت در افزایش دقت دسته بندی ندارند و تعدادی از ضرایب با تاثیر منفی خود سبب کاهش دقت دسته بندی می شوند. در این مقاله یک روش جدید ارائه شده است که با استفاده از الگوریتم PSO ضریب هایی از این دو ویژگی که باعث افزایش دقت دسته بندی می شوند را انتخاب و ضرایبی که تاثیر منفی در افزایش دقت دسته بندی دارد را حذف می کند. ضرایب مفید با هم ادغام می شوند و از آن برای تشخیص جنسیت گوینده صدا استفاده می گردد. نتایج نشان می دهد صحت تشخیص جنسیت گوینده صدا برای ۵۰ صدای مرد و زن مختلف با استفاده از روش پیشنهادی بیشتر بوده است و صحت دسته بندی برای ۵۰ صدای مرد و زن مختلف در محیط غیر نویزی ۱۰۰ درصد بوده است . بررسی ها نشان داده است که ضرایب بهینه در پنج محیط نویزی تست شده با هم فرق دارند و هر محیط نویزی ضرایب بهینه مخصوص به خود را دارد که باید از آن ضرایب برای آموزش استفاده گردد. بعد از اعمال ضرایب بهینه مخصوص به هر محیط به دقت دسته بندی ۹۰ درصد در تمامی محیط های نویزی رسیدیم .

ادغام دو ویژگی MFCC و LPCC با استفاده از الگوریتم PSO برای تشخیص جنسیت گوینده Keywords:

تشخیص جنسیت گوینده صدا , دسته بندی SVM , ویژگی MFCC , ویژگی LPCC , مقاوم سازی در برابر نویز.

ادغام دو ویژگی MFCC و LPCC با استفاده از الگوریتم PSO برای تشخیص جنسیت گوینده authors

سیدمحمد حسینی

کارشناسی ارشد مهندسی کامپیوتر، موسسه آموزش عالی سلمان ، مشهد ، ایرا ن

مصطفی کمالی پور

کارشناسی ارشد مهندسی کامپیوتر، موسسه آموزش عالی سلمان ، مشهد ، ایرا ن

حامد رستگارمقدم نجار

دانشجوی دکتری مهندسی کامپیوتر، دانشگاه آزاد اسلا می نیشابور، نیشابور ، ایرا ن

مهدی کوره پز

دانشجوی دکتری گروه مهندسی کامپیوتر، واحد مشهد، دانشگاه آزاد اسلامی، مشهد، ایران

مقاله فارسی "ادغام دو ویژگی MFCC و LPCC با استفاده از الگوریتم PSO برای تشخیص جنسیت گوینده" توسط سیدمحمد حسینی، کارشناسی ارشد مهندسی کامپیوتر، موسسه آموزش عالی سلمان ، مشهد ، ایرا ن؛ مصطفی کمالی پور، کارشناسی ارشد مهندسی کامپیوتر، موسسه آموزش عالی سلمان ، مشهد ، ایرا ن؛ حامد رستگارمقدم نجار، دانشجوی دکتری مهندسی کامپیوتر، دانشگاه آزاد اسلا می نیشابور، نیشابور ، ایرا ن؛ مهدی کوره پز، دانشجوی دکتری گروه مهندسی کامپیوتر، واحد مشهد، دانشگاه آزاد اسلامی، مشهد، ایران نوشته شده و در سال 1403 پس از تایید کمیته علمی هفتمین همایش ملی فناوریهای نوین در مهندسی برق، کامپیوتر و مکانیک ایران پذیرفته شده است. کلمات کلیدی استفاده شده در این مقاله تشخیص جنسیت گوینده صدا، دسته بندی SVM، ویژگی MFCC، ویژگی LPCC، مقاوم سازی در برابر نویز. هستند. این مقاله در تاریخ 20 مرداد 1403 توسط سیویلیکا نمایه سازی و منتشر شده است و تاکنون 162 بار صفحه این مقاله مشاهده شده است. در چکیده این مقاله اشاره شده است که شناسایی هویت گوینده در داده های صوتی ، باعث جهش در جمع آور ی اطلاعات سیگنال ی شده است ، به این منظور ویژگی های ضرایب کپسترال بر پایه مل MFCC و ضرایب کپسترال بر پایه پیش گویی خطی LPCC دو ویژگی موفق در زمینه دسته بندی های حوزه گفتار، مخصوصا تشخیص جنسیت گوینده صدا شناخته می شوند. این ویژگی ... . برای دانلود فایل کامل مقاله ادغام دو ویژگی MFCC و LPCC با استفاده از الگوریتم PSO برای تشخیص جنسیت گوینده با 13 صفحه به فرمت PDF، میتوانید از طریق بخش "دانلود فایل کامل" اقدام نمایید.