CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

درجه ی همگرایی روش های تشخیص داده های دورافتاده در داده کاوی

عنوان مقاله: درجه ی همگرایی روش های تشخیص داده های دورافتاده در داده کاوی
شناسه ملی مقاله: RSTCONF01_540
منتشر شده در کنفرانس بین المللی پژوهش در مهندسی، علوم و تکنولوژی در سال 1394
مشخصات نویسندگان مقاله:

مریم رهروان - کارشناسی ارشد، مهندسی کامپیوتر، نرم افزار،گروه کامپیوتر دانشکده فنی دانشگاه آزاد رشت
فاطمه احمدی آبکناری - استادیار، دکتری فناوری اطلاعات، دانشگاه پیام نور رشت

خلاصه مقاله:
تشخیص داده های دور افتاده یا تشخیص ناهنجاری داده در پایگاه های داده بزرگ که به دلایل مختلف از جمله خطاهای مکانیکی،تغییر در رفتار سیستم، رفتار جعلی، خطاهای انسانی و ... بوجود می آیند به علت تاثیر مستقیم و گاه مخرب آن بر مدلسازی صورت گرفته توسط ابزارهای داده کاوی از اهمیت بسیاری برخوردار است. روش های متفاوتی برای تشخیص داده های دور افتاده و آنومالی در داده ها وجود دارد که هریک با الگوریتمی متفاوت به یافتن داده های دورافتاده در یک دیتاست می پردازند. در این مقاله، میزان همگرایی چند روش تشخیص آنومالی با ملاک قرار دادن روش خوشه بندی K-Means از نظر توانایی آن ها در یافتن تعداد بیشتری داده ی دورافتاده در بستر نرم افزار داده کاوی RapidMiner آزمایش و با یکدیگر مقایسه شده است

کلمات کلیدی:
الگوریتم های خوشه بندی، تشخیص آنومالی ، تشخیص داده های دورافتاده ، داده کاوی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/398606/