درجه ی همگرایی روش های تشخیص داده های دورافتاده در داده کاوی

Publish Year: 1394
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 629

This Paper With 13 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

RSTCONF01_540

تاریخ نمایه سازی: 30 آبان 1394

Abstract:

تشخیص داده های دور افتاده یا تشخیص ناهنجاری داده در پایگاه های داده بزرگ که به دلایل مختلف از جمله خطاهای مکانیکی،تغییر در رفتار سیستم، رفتار جعلی، خطاهای انسانی و ... بوجود می آیند به علت تاثیر مستقیم و گاه مخرب آن بر مدلسازی صورت گرفته توسط ابزارهای داده کاوی از اهمیت بسیاری برخوردار است. روش های متفاوتی برای تشخیص داده های دور افتاده و آنومالی در داده ها وجود دارد که هریک با الگوریتمی متفاوت به یافتن داده های دورافتاده در یک دیتاست می پردازند. در این مقاله، میزان همگرایی چند روش تشخیص آنومالی با ملاک قرار دادن روش خوشه بندی K-Means از نظر توانایی آن ها در یافتن تعداد بیشتری داده ی دورافتاده در بستر نرم افزار داده کاوی RapidMiner آزمایش و با یکدیگر مقایسه شده است

Keywords:

الگوریتم های خوشه بندی , تشخیص آنومالی , تشخیص داده های دورافتاده , داده کاوی

Authors

مریم رهروان

کارشناسی ارشد، مهندسی کامپیوتر، نرم افزار،گروه کامپیوتر دانشکده فنی دانشگاه آزاد رشت

فاطمه احمدی آبکناری

استادیار، دکتری فناوری اطلاعات، دانشگاه پیام نور رشت

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • اسماعیلی، مهدی (1391). مفاهیم و تکنیک های داده کاوی. دانشگاه ...
  • بابایی، غلامرضا (1386). روش های تعیین داده های پرت در ...
  • توکلی زاده راوری، محمد؛ نجابتیان، مریم (1389). خوشه بندی مبتنی ...
  • حاجی حیدری، نسرین؛ خاکباز، سیدبهنام؛ (392 1)، داده کاوی جلد ...
  • دیانی، محمد حسین (1381). داده پردازی برای کتابداران و اطلاع ...
  • صنیعی آباده، محمد؛ محمودی، سینا؛ طاهرپور، محدثه (1393). داده کاوی ...
  • فرمانی اردهائی، راضیه (1390). کاربرد رگرسیون مولفه های اصلی برای ...
  • محمدزاده، محسن (1380). روشهای شناسایی داده های دور افتاده فضایی، ...
  • مزدک، زینب؛ پیوندی، پدرام؛ علمداری یزدی، علی اصغر (1391). استخراج ...
  • Aleksandar Lazarevic, Aysel Ozgur, Levent Ertoz, Jaideep Srivastava, Vipin Kumar. ...
  • C HARUC. AGGRW AL. (2012). OUTLIER ANALYSIS, IBM T . ...
  • Gao Zengan. (2009). Application of Cluster-Based Local Outlier Factor Algorithm ...
  • Gerrhard Munz, Sa Li, Georg Carle. (2007). Traffic Anomaly Detection ...
  • Pei Sun Sanjay Chawla Bavani Arunasalam. (2006). Mining for Outliers ...
  • Prasanta Gogoi1, D.K Bhattcharyya1 , B.Borah1. (2011). A Survey of ...
  • Post-Doctoral Station of Theoretical Economics. (2004). China Center for Anti-Money ...
  • Victoria J. Hodge and Jim Austin. (2004). A Survey of ...
  • نمایش کامل مراجع