CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

روشی هوشمند برای تشخیص جنسیت صدای گوینده مبتنی بر شبکه عصبی MLP

عنوان مقاله: روشی هوشمند برای تشخیص جنسیت صدای گوینده مبتنی بر شبکه عصبی MLP
شناسه ملی مقاله: IDS03_117
منتشر شده در سومین کنفرانس سیستم های تصمیم گیری هوشمند در سال 1397
مشخصات نویسندگان مقاله:

مینا اتحادی ابری - کارشناسی ارشد هوش مصنوعی، دانشگاه صنعتی امیرکبیر، دانشکده کامپیوتر

خلاصه مقاله:
مطالعات پزشکی نشان می دهد که ساختار سیستم صوتی آقایان بزرگ تر از سیستم صوتی خانم ها می باشد. از آنجایی که بسیاری از ویژگی های صوتی ناشی از اندازه و شکل اندام گویایی است پس این تفاوت مطمینا باید (حداقل) در یک ویژگی صوتی تاثیر بگذارد. یکی از این تاثیرها روی تفاوت فرکانسی است. فرکانس گفتار خانم ها و آقایان یکسان نیست. بنابراین اگر فرکانس پایه گفتار را در صوت تشخیص بدهیم بنابر محدوده فرکانسی گفتار قادر به تشخیص جنسیت گوینده هستیم که با روش های مختلفی می توان این فرکانس پایه را بدست آورد. در این مقاله، هدف شناسایی جنسیت گوینده از طریق واکه ها بر مبنای فرمنت و موج انتروپی wavelet و طبقه بندی بر اساس شبکه عصبی چند لایه ای رو به جلو می باشد. آزمایشات انجام شده نشان می دهد که این روش در مقایسه با الگوریتم های کلاسیک، دقت خوبی در شناسایی جنسیت گوینده دارد. یک نکته منحصر به فرد در این مقاله این است کهبرعکس کارهای گذشته، ویژگی ها از جملات و کلمات استخراج نمی گردند، بلکه برای این کار تنها از واکه ها استفاده می کنیم. مزیت استخراج ویژگی ها از واکه ها این است که هنگامی که فایل سخنرانی یا گفتار ناقص است و کلمات نیمه ثبت شده هستند، می توان از این روش برای شناسایی جنسیت گوینده استفاده کرد.

کلمات کلیدی:
تعیین جنسیت، شبکه عصبی چند لایه ای رو به جلو، MLP، فرمنت، واکه wavelet Entropy

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/855116/