CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

تشخیص داده های پرت در سری های زمانی با استفاده از الگوریتم ژنتیک چند منظوره

عنوان مقاله: تشخیص داده های پرت در سری های زمانی با استفاده از الگوریتم ژنتیک چند منظوره
شناسه ملی مقاله: CSCG03_129
منتشر شده در سومین کنفرانس بین المللی محاسبات نرم در سال 1398
مشخصات نویسندگان مقاله:

دانیال شبانه بوشهری - دانشجوی کارشناسی ارشد، دانشکده مکاترونیک، دانشگاه آزاد اسلامی، واحد کرج
امینه امینی - استادیار ، دانشکده مکاترونیک، دانشگاه آزاد اسلامی، واحد کرج
جواد محمدزاده - استادیار ، دانشکده مکاترونیک، دانشگاه آزاد اسلامی، واحد کرج

خلاصه مقاله:
امروزه مدیریت حفظ داده ها فقط یک مزیت نیست بلکه شناسایی، جذب تکنیک ها و نگهداشتن آنها در ادامه، امری ضروری است. تکنیک ها در گذشته به علت محدودیت تنوع و عدم دسترسی به اطلاعات کافی، از روش های ساده جهت شناسایی خطرات و مدیریت آنها استفاده می کردند و همین امر موجب شده بود روش های کمی جایگزین روش های کیفی شود. یکی از مشکلات، عدم وجود روشی کارآمد برای شناسایی دقیق و مواجهه با داده های پرت که مسئله ای مهم در زمینه های سری زمانی هستند می باشد. داده های سری زمانی بدون داده های پرت برای ایجاد مدل های دقیق ضروری هستند. بنابراین اصلاح ، جلوگیری از شناسایی اشتباه و تخمین زدن آنها ضروری است. بنابراین در این پژوهش به منظور شناسایی داده های پرت و تدوین استراتژیهای مناسب برای برخورد با آنها از داده کاوی استفاده شد. بدین منظور اساس کار این پژوهش را افزایش دقت تشخیص داده های پرتدر سری های زمانی قرار دادیم. بدین شکل که داده ها در مرحله اول مورد پیش پردازش قرار گرفتند و پس از استخراج ویژگی، با استفاده از مدل ARIMA پیش بینی سری زمانی برای گام های زمانی انجام شد. به منظور استفاده از NSGA-II جهت تشخیص داده های پرت، خروجی ARIMA به عنوان ورودی این الگوریتم درنظر گرفته و داده های پرت تشخیص داده شدند؛ برای ارزیابی کیفیت جواب های بدست آمده از معیار ارزیابی Accuracy یا دقت استفاده شد. پس از اعمال مدل ها و ترکیب آنها به الگوریتمی می رسیم که به عنوان الگوریتم ترکیبی AR-NSG ارائه می شود. با استفاده از معیار ارزیابی، مقایسه الگوریتم های ژنتیکی انجام گرفت و مشخص شد الگوریتم AR-NSG توانسته، بهبودی حدودا 3 درصدی را در رابطه با دقت و صحت درستی جواب ها ارائه دهد.

کلمات کلیدی:
داده کاوی - داده های پرت - سری های زمانی - الگوریتم ژنتیک چند منظوره

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1006068/