یک سیستم چند مرحله ای برای شاخص گذاری گوینده بصورت مستقل از کانال
Publish place: 15th Annual Conference of Computer Society of Iran
Publish Year: 1388
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,116
This Paper With 8 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CSICC15_247
تاریخ نمایه سازی: 26 مهر 1388
Abstract:
در این مقاله، یک سیستم چند مرحلهای برای شاخص گذاری گوینده، با قابلیت تخمین خودکار تعداد گوینده ها، به منظور استفاده درسیستمهای بازشناسی گوینده تلفنی و اینترنتی، ارائه میشود. درسیستم مذکور، در نخستین مرحله، پس از حذف سکوت از سیگنال صوتی، مرزهای تغییر گوینده با استفاده از معیار GLR تعیین میشود. در ادامه، قطعات کنار هم و متوالی، بر اساس شباهتی که با هم دارند،تلفیق میشوند. در مرحله بعد، با استفاده از خوشه بندی سلسله مراتبی، قطعات متعلق به هر گوینده در یک خوشه قرار میگیرند. این مراحل با اعمال مدل GMM برای هریک از خوشه ها و تقطیع مجدد سیگنال گفتار با الگوریتم ویتربی خاتمه مییابد. از سیستم ارائه شده برای تقطیع و شاخص گذاری گوینده در گفتار تلفنی استفاده به عمل آمد و خطای شاخص گذاری با معیار NIST یا همان DER به 7/9% رسید. پیاده سازیهای انجام شده روی چند مجموعه مختلف از دادگان، نشانگر مقاوم بودن سیستم ارائه شده نسبت به نوع کانال، نویز محیط وروشهای فشرده سازی با نرخ بیت متفاوت است.
Keywords:
Authors
طاهره امامی آزادی
پژوهشکده پردازش هوشمند علائم، تهران.
جهانشاه کبودیان
پژوهشکده پردازش هوشمند علائم، تهران.
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :