بهبود در تشخیص حملات بات نت مبتنی بر یک رویکرد بهینه شده یادگیری ماشین

Publish Year: 1401
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 302

This Paper With 16 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ITCT16_035

تاریخ نمایه سازی: 22 شهریور 1401

Abstract:

بات نت ها از جمله جدیدترین نوع بدافزارها در مقیاس اینترنت میباشندکه در سالهای اخیر بیشترین تهدیدات را متوجه سامانه های اینترنتی نمودهاند. گزارشهای اخیر نشان داده است که حملات بدافزاری بات نتی با افزایش ۳۱۵,۷ درصدی از ۱۰,۳ میلیون در سال ۲۰۱۷ به ۳۲,۷ میلیون در سال ۲۰۱۸ و در سال ۲۰۲۰ به بیش از ۶۰ میلیون رسیده است.آنچه که بات نت ها را دردسرساز می سازد ایجاد اختلال فزاینده ای است که در بستر شبکه و وب ایجاد میکنند. بنابراین نیاز به تکنیکهای موثر و کارآمد تشخیص و کاهش این حملات در چنین محیطهایی جهت جلوگیری از انواع زیان ها، وجود دارد. روشهای تشخیص این حملات به دلیل اهمیت بسیار بالایی که دارند، از روش های کلاسیک تا روشهای مبتنی بر یادگیری عمیق دسته بندی می شوند. اما امروزه به دلیل رشد روز افزون و همچنین مزایا و کارآمدی بالایی که روش های مبتنی بر یادگیری ماشین دارند، اکثریت به سمت روشهای مبتنی بر یادگیری ماشین و یادگیری عمیق سوق داده شده اند.در این پژوهش هدف افزایش صحت (accuracy) در شناسایی حملات بات نت بااستفاده از بهینه کردن متدهای یادگیری ماشین می باشد. بهمین منظور، در قسمت روش تحقیق، ابتدا مقایسه ای بین ۴ الگوریتم یادگیری ماشین باتوجه به هدف پژوهش (افزایش میزان صحت در تشخیص) انجام شد.دیتاست جامعه آماری استفاده شده در این پژوهش، دیتاست معروف دانشگاه نیوسات ولز استرالیا (unsw) بوده و همچنین برای پیاده سازی فرضیه اصلی پژوهش از نرم افزار رپیدماینر استفاده گردیدکه معلوم شد از بین ۴ الگوریتم انتخاب شده یعنی درخت تصمیم ، نزدیکترین همسایه-k ، بیزین ساده و ماشین بردار پشتیبان ، در دو مرحله ، دو الگوریتم درخت تصمیم و نزدیکترین همسایه-k ، با صحت ۹۹,۸۲ و ۹۹,۱۲درصدی، بالاترین میزان صحت را در شناسایی حملات در جامعه آماری ما دارند. درنهایت در قسمت دوم روش تحقیق، با ترکیب کردن الگوریتم های فوق به روش پشته ای (stacking)، توانستیم میزان صحت در تشخیص را تا حدودی بهبود بخشیده و آن را در همان دو مرحله فوق ، به عدد ۹۹,۹۵ و ۹۹,۱۴ درصد برسانیم.

Authors

حامد صادقی

دانشجوی ارشد رشته فناوری اطلاعات، موسسه آموزش عالی غیرانتفاعی عقیق شاهین شهر،،اصفهان،ایران

راضیه عسگرنژاد

استادیار گروه مهندسی کامپیوتر، موسسه آموزش عالی غیرانتفاعی عقیق شاهین شهر،،اصفهان،ایران