بهره گیری از الگوریتم بهینه سازی پروگزیمال در یادگیری تقویتی جهت تشخیص پویا و خنثی سازی حملات مسمومیت موتورهای جستجو برای امنیت سایبری

Publish Year: 1404
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 93

This Paper With 15 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

INDEXCONF07_006

تاریخ نمایه سازی: 28 مهر 1404

Abstract:

حملات مسمومیت موتورهای جستجو (SEO Poisoning) یکی از تهدیدات رو به رشد در حوزه امنیت سایبری است که با دستکاری نتایج موتورهای جستجو کاربران را به سمت وب سایتهای مخرب هدایت می کند. در این پژوهش، یک روش نوین مبتنی بر یادگیری تقویتی با استفاده از الگوریتم بهینه سازی سیاست پروگزیمال (PPO) برای تشخیص و خنثی سازی این حملات پیشنهاد شده است. مدل پیشنهادی در یک محیط شبیه سازی شده با احتمالی حدود ۳۰ درصد وقوع حمله آموزش داده شده و عملکرد آن با معیارهایی نظیر دقت، F-Score، نرخ کاذب مثبت و منفی و زمان پاسخ ارزیابی شده است. بر اساس نتایج بدست آمده، مدل PPO با میانگین پاداش حدود ۱۲۷۰ و زمان پاسخ بسیار سریع، پتانسیل بالایی برای کاربردهای زمان واقعی دارد. از طرف دیگر، مقایسه با روش های پایه مانند SVM و RNN نشان می دهد که این روش ها در دقت و عملکرد بهتری دارند، اما الگوریتم PPO از نظر زمان پاسخ و عدم نیاز به داده های برچسب دار برتری دارد. در نهایت، پیشنهادات برای بهبود شامل تنظیم، پاداش ها، افزایش گام های آموزشی و استفاده از داده های واقعی است.

Authors

پریسا سعیدی قلعه

دانشجوی دکتری، مهندسی کامپیوتر دانشگاه آزاد اسلامی ارومیه

امین بابازاده سنگر

استادیار مهندسی فناوری اطلاعات و کامپیوتر دانشگاه آزاد اسلامی ارومیه