دسته بندی سامانه های وب فارسیِ زیرساخت های کشور با استفاده از شبکه عصبی

Publish Year: 1399
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 202,916

This Paper With 10 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CECCONF11_030

تاریخ نمایه سازی: 6 دی 1399

Abstract:

شناسایی و دسته بندي سامانه هاي وب فارسیِ زیرساخت هاي کشور نقطه شروع براي ارزیابی مخاطرات و هشداردهی هوشمند به زیرساخت هاي حیاتی، حساس و مهم است. در حال حاضر فهرست مشخصی براي شناسایی و تفکیک وب سایت ها ي مهم و خدماتی کشور وجود ندارد. در این پژوهش، ارزیابی گسترده و سراسري آسیب پذیري از تمام سامانه ها ي وب کشور صورتگرفته است و سپس خروجی حاصل، بصورت کلی ارائه گردیده است. با شناسایی سامانه هاي وب فارس یِ زیرساخت ی کشور، سرعت ارزیابی مخاطرات بسیار کاهش یافت و در نتیجه طی دوره هاي زمانی کوتاه تري می توان فرآیند ارزیابی آسیب پذیري را با هزینه کمتر و دقت بالاتر انجام داد. ما در این مقاله اقدام به استخراج محتویات وب سایت ها، پیش پردازش داده ها شامل مراحل حذف علائم، حذف اعداد، حذف کلمات و واژه ها ي انگلیس ی، حذف ایست واژه ها و ریشه یابی کلمات به روش Lemmatization و سپس شناسایی و طبقه بندي وب سایت ها در دسته هاي مختلف زیرساختی کرد یم. با استفاده از زبان پایتون، عمل یادگیري در مدل شبکه عصبی با 10 نرون در لایه مخف ی و با مومنتوم 0.2 و میزان epoch 50 هزار تکرار صورت گرفت که بر روي CPU حدود 10 ساعت زمان براي یادگیري این شبکه صرف شد و پس از آموزش این مدل، داده هاي نمونه را با میزان دقت حدود 95 درصد دسته بندي کرد

Keywords:

شبکه عصبی , دسته بندی و بسایت , دسته بندی سامانه های وب زیرساختی , وب کاوی

Authors

محمدرضا حسنی آهنگر

دانشیار و عضو هیئت علمی دانشگاه جامع امام حسین (ع)

مهدی فیروزمندی

دانشجو کارشناسی ارشد دانشگاه جامع امام حسین (ع)