CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ارایه یک روش بهبودیافته نهان کاوی گفتار در داده های صوتی مبتنی بر VoIP با استفاده از رویکرد یادگیری عمیق

عنوان مقاله: ارایه یک روش بهبودیافته نهان کاوی گفتار در داده های صوتی مبتنی بر VoIP با استفاده از رویکرد یادگیری عمیق
شناسه ملی مقاله: JR_ADST-14-2_001
منتشر شده در در سال 1402
مشخصات نویسندگان مقاله:

حجت اله مقدسی - دانشگاه صنعتی مالک اشتر
حمید دهقانی - دانشیار دانشگاه صنعتی مالک اشتر تهران

خلاصه مقاله:
امروزه پروتکل انتقال صدا از طریق اینترنت(VoIP) به صورت گسترده در ارتباطات بلادرنگ و شبکه های اجتماعی مورد استفاده قرار گرفته و به حامل مناسبی برای روش های نهان نگاری تبدیل شده است. در راستای مقابله با این تهدیدات، روش های متعدد نهان کاوی ابداع شده اند که در میان راه حل های ارائه شده، ترکیب روش های پردازش سیگنال و یادگیری ماشین، امکان ایجاد نهان کاوهایی با دقت بسیار بالا را فراهم نموده است. در این مقاله یک رویکرد ترکیبی از روش های پردازش سیگنال گفتار و الگوریتم های هوش مصنوعی استفاده شده است. در این تحقیق ابتدا پیش پردازش داده بر روی سیگنال صوتی فشرده شده با کدک G.۷۲۹ صورت می گیرد که ویژگی های درون فریمی و همبستگی های بین فریمی را با دقت خوبی استخراج می کند. سپس نتایج به دست آمده به یک شبکه یادگیری عمیق داده شده تا آموزش داده های پاک از داده های نهان نگاشته انجام گیرد. ارزیابی نتایج حاصل از پیاده سازی، میزان بهبود را هم در بخش صحت تشخیص و در بحث زمان محاسبات شامل می شود. روش پیشنهادی برای دو خانواده مهم نهان نگاری یعنی QIM و PMS مورد ارزیابی قرار گرفته و برای نرخ های مختلف ادغام روش مذکور تست و پیاده سازی شده است. نکته مهم دیگر تست برخط بودن روش ارائه شده بوده که برای فایل های ۱۰۰۰ میلیثانیه ای، زمان پاسخ گویی کمتر از ۵ میلیثانیه بوده که نشان از سرعت بالای مدل پیشنهادی در مرحله اجرا می باشد.

کلمات کلیدی:
نهان نگاری, نهان کاوی, یادگیری عمیق, نهان نگاری مدولاسیون شاخص کوانتیزاسیون, نهان نگاری مدولاسیون فرکانس گام

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1918828/