تشخیصمحدودهی گفتاری در سیگنال صوتی مبتنی بر دسته بندی گروهی دادگان

رضا وفاشعار; سعید شیری

تشخیصمحدودهی گفتاری در سیگنال صوتی مبتنی بر دسته بندی گروهی دادگان

Publish place: 12th Iranian Conference on Intelligent Systems

Publish Year: 1392

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 6 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/276158

شناسه ملی سند علمی:

ICS12_078

تاریخ نمایه سازی: 11 مرداد 1393

Abstract:

جداسازی گفتار از نویز ضمینه یکی از پیشپردازشهای مهم در اغلب کابردهای گفتاری میباشد که روشهای مختلف آماری،یادگیری ماشین و مکاشفهای برای آن مطرح شدهاند. در این مقاله روشجدیدی برای تشخیصمحدودهی گفتاری در سیگنال صوتیبر اساسدسته بندی گروهی دادگان ارائه شده است. در دستهبندی گروهی دادگان هدف تشخیصدستهی گروهی از دادگان ورودی است، که با توجه به دانشاولیهی موجود، به یک دسته تعلق دارند. با توجه به اینکه در سیگنال گفتار بخشهای مربوط به نویز وگفتار معمولا به صورت متوالی و پیوسته میباشند، میتوان از روشهای مربوط به دسته بندی گروهی دادگان برای تشخیصآنهااستفاده نمود. روشارائه شده از دسته بندی گروهی مبتنی بر نزدیکترین همسایه استفاده میکند، بنابراین نیاز به آموزشخاصی برای ایجاد مدلهایی از نویز و گفتار نمیباشد و تنها نیاز به مجموعهای از دادگان اولیه است که به عنوان دادگان مرجع مورد استفادهقرار گیرد؛ به همین دلیل دارای زمان فاز آموزشآن بسیار ناچیز میباشد، به علاوه نسبت به روشهای آماری و مکاشفهای دارای دقت بالاتری میباشد و نسبت به آنها سادهتر است. روش پیشنهادی با چند روشمتداول برای تشخیصمحدودهی گفتاری، درمحیط های مختلف باSNR متفاوت، مقایسه شده که نتایج مقایسات نشان دهندهی کارای بالای روشارائه شده برای تشخیص محدودهی گفتار میباشد و در مقایسه با روشهای مقایسه شده توانسته با نرخ تشخیصاشتباه پایین به نرخ تشخیص صحیح بالایی دست یابد.

Keywords:

تشخیصمحدودهی گفتاری در سیگنال صوتی , دسته بندی گروهی , دسته بندی برمبنای نزدیکترین همسایه

Authors

رضا وفاشعار

دانشجوی دکتری دانشکده مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه صنعتی امیرکبیر ، تهران،

سعید شیری

استادیار، دانشکده مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه صنعتی امیرکبیر ، تهران

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

Hoyt, J.D., Wechsler, H., "Detection of human speech in structured ...
Juang, B.H., Chou, W., Lee, C.H., "Mimum classification error rate ...
Liang, Y., Liu, X., Lou, Y., Shan, B., "An improved ...
Wu, J., Zhang, X., _ efficient voice activity detection algorithm ...
Gorriz, J.M., Ramirez, J., Lang, E.W.. Puntonet, C.G., "Hard C-means ...
Vlaj, D.. Kacic, Z., Kos, M., "Voice activity detection algorithm ...
Engineering, Vol. 38(6), pp. 1820-1836, 2012. ...
Sasudin N.A., Bradley, A.P.. "Nearest neighbour group-based classification ", Pattern ...
Mitani, Y., Hamamoto, Y., _ local mean-based nonparametric classifier", Pattern ...
Hwang, S., Cho, S., _ 'Clus tering-Based Reference Set Reduction ...
TIMIT ac oustic-phonetic continuous speech corpus: http://www. ldc. _ edu/Ca ...
Tan, L.N., Borgstrom, B.J., Alwan, A., "Voice Activity Detection using ...
Sohn, J., Kim, N.S., Sung, W., "A statistical model-based voice ...

نمایش کامل مراجع