روشی هوشمند برای تشخیص جنسیت صدای گوینده مبتنی بر شبکه عصبی MLP

Publish Year: 1397
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 487

This Paper With 5 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

IDS03_117

تاریخ نمایه سازی: 31 اردیبهشت 1398

Abstract:

مطالعات پزشکی نشان می دهد که ساختار سیستم صوتی آقایان بزرگ تر از سیستم صوتی خانم ها می باشد. از آنجایی که بسیاری از ویژگی های صوتی ناشی از اندازه و شکل اندام گویایی است پس این تفاوت مطمینا باید (حداقل) در یک ویژگی صوتی تاثیر بگذارد. یکی از این تاثیرها روی تفاوت فرکانسی است. فرکانس گفتار خانم ها و آقایان یکسان نیست. بنابراین اگر فرکانس پایه گفتار را در صوت تشخیص بدهیم بنابر محدوده فرکانسی گفتار قادر به تشخیص جنسیت گوینده هستیم که با روش های مختلفی می توان این فرکانس پایه را بدست آورد. در این مقاله، هدف شناسایی جنسیت گوینده از طریق واکه ها بر مبنای فرمنت و موج انتروپی wavelet و طبقه بندی بر اساس شبکه عصبی چند لایه ای رو به جلو می باشد. آزمایشات انجام شده نشان می دهد که این روش در مقایسه با الگوریتم های کلاسیک، دقت خوبی در شناسایی جنسیت گوینده دارد. یک نکته منحصر به فرد در این مقاله این است کهبرعکس کارهای گذشته، ویژگی ها از جملات و کلمات استخراج نمی گردند، بلکه برای این کار تنها از واکه ها استفاده می کنیم. مزیت استخراج ویژگی ها از واکه ها این است که هنگامی که فایل سخنرانی یا گفتار ناقص است و کلمات نیمه ثبت شده هستند، می توان از این روش برای شناسایی جنسیت گوینده استفاده کرد.

Keywords:

تعیین جنسیت , شبکه عصبی چند لایه ای رو به جلو , MLP , فرمنت , واکه wavelet Entropy

Authors

مینا اتحادی ابری

کارشناسی ارشد هوش مصنوعی، دانشگاه صنعتی امیرکبیر، دانشکده کامپیوتر