دسته بندی سامانه های وب فارسیِ زیرساخت های کشور با استفاده از شبکه عصبی
Publish place: Eleventh National Conference on Computer Science and Engineering and Information Technology
Publish Year: 1399
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 202,916
This Paper With 10 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CECCONF11_030
تاریخ نمایه سازی: 6 دی 1399
Abstract:
شناسایی و دسته بندي سامانه هاي وب فارسیِ زیرساخت هاي کشور نقطه شروع براي ارزیابی مخاطرات و هشداردهی هوشمند به زیرساخت هاي حیاتی، حساس و مهم است. در حال حاضر فهرست مشخصی براي شناسایی و تفکیک وب سایت ها ي مهم و خدماتی کشور وجود ندارد. در این پژوهش، ارزیابی گسترده و سراسري آسیب پذیري از تمام سامانه ها ي وب کشور صورتگرفته است و سپس خروجی حاصل، بصورت کلی ارائه گردیده است. با شناسایی سامانه هاي وب فارس یِ زیرساخت ی کشور، سرعت ارزیابی مخاطرات بسیار کاهش یافت و در نتیجه طی دوره هاي زمانی کوتاه تري می توان فرآیند ارزیابی آسیب پذیري را با هزینه کمتر و دقت بالاتر انجام داد. ما در این مقاله اقدام به استخراج محتویات وب سایت ها، پیش پردازش داده ها شامل مراحل حذف علائم، حذف اعداد، حذف کلمات و واژه ها ي انگلیس ی، حذف ایست واژه ها و ریشه یابی کلمات به روش Lemmatization و سپس شناسایی و طبقه بندي وب سایت ها در دسته هاي مختلف زیرساختی کرد یم. با استفاده از زبان پایتون، عمل یادگیري در مدل شبکه عصبی با 10 نرون در لایه مخف ی و با مومنتوم 0.2 و میزان epoch 50 هزار تکرار صورت گرفت که بر روي CPU حدود 10 ساعت زمان براي یادگیري این شبکه صرف شد و پس از آموزش این مدل، داده هاي نمونه را با میزان دقت حدود 95 درصد دسته بندي کرد
Authors
محمدرضا حسنی آهنگر
دانشیار و عضو هیئت علمی دانشگاه جامع امام حسین (ع)
مهدی فیروزمندی
دانشجو کارشناسی ارشد دانشگاه جامع امام حسین (ع)