ارائه یک روش جدید برای تخمین مقادیر گمشده در مجموعه داده

Publish Year: 1397
نوع سند: مقاله ژورنالی
زبان: Persian
View: 435

This Paper With 8 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

JR_JME-16-55_012

تاریخ نمایه سازی: 21 اسفند 1399

Abstract:

اغلب مجموعه داده های مربوط به داده کاوی و ماشین یادگیری دارای داده هایی با مقادیر Missing Values یا داده گمشده می باشند. چگونگی برخورد با داده گمشده و نیز ارائه راهکارهایی مبتنی بر تخمین مقدار مربوط به داده گمشده، منجر به بروز یک مسئله بسیار مهم در زمینه داده کاوی و ماشین یادگیری  شده است. در بین الگوریتم های داده کاوی، الگوریتم C4.5، به دلیل کارآیی، استفاده در کاربردهای مختلف داده کاوی و نیز توانایی در کار کردن و تخمین مقدار داده گمشده در مجموعه داده ها، به طور مکرر مورد استفاده قرار گرفته است. پژوهشگران و محققان روش ها و الگوهای متعددی جهت برخورد با مقادیر داده گمشده و تخمین مقدار آن در مجموعه داده های الگوریتم C4.5 ارائه داده اند که هر یک از روش ها به نحوی موجب افزایش دقت درخت تصمیم و در نتیجه تولید یک درخت تصمیم موثر و کاراتر شده است. لذا در مقاله حاضر ابتدا به بررسی و مرور روش ها و راهکارهای ارائه شده پیشین و سپس به ارائه روش پیشنهادی با عنوان روش جابجایی خصوصیت ها جهت تخمین مقادیر گمشده در مجموعه داده پرداخته خواهد شد و سپس در پایان به مقایسه و ارزیابی دقت حاصل شده روش پیشنهادی با روش های حذف و میانگین خواهیم پرداخت.

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • [1] Bhardwaj, R., Vatta, S. (2013).  “Implemention of ID3 Algorithm”. ...
  •  [2] Gey, S.,  Nedelec, E.  (2005). “Model Selection for CART ...
  • [3] Zhu, H., Chen, S. (2013). “Rang Tree:A Feauter Selection ...
  • [4] Chen, MH.,  Lipsitz, SR. (2008). “Bayesian methods for generalized ...
  • [5] Marwala, T. (2009). “Computational Intelligence for Missing Data Imputation, ...
  • [6] Little RJA. (1988). “A test of missing completely at ...
  • [7] Fleiss, JL., Levin, B., Paik MC. (2002).“ Statistical Methods ...
  • [8] Priyadharsini, C, Selvadoss, P. (2014). “Prediction of Missing Values ...
  • [9] Kaiser, J. (2014). “Dealing with Missing Values in Data”, ...
  • [10] Augustin, M.,  Sakena,  S. (2015). “Machine Learning with Missing ...
  • [11] Chen, T. (2015).  “A comparison of approaches for dealing ...
  • [12] Huaxiong, Li.(2013).  “Missing Values Imputation Based on Iterative Learning”, ...
  • [13] Clark, P., Niblett, T. (2012).  “The LEM2 and C4.5 ...
  • [14] Jerzy,  W. (2015).  “A Comparison of Rule Induction Using ...
  • [15] Grzymala, J. (2014). “On the unknown attribute values in ...
  • [16] Quinlan, J. (2014).  “C4.5 Programs for Machine Learning”, MorganKaufman ...
  • [17] Sharma, A. Mehta, N. (2013). “Reasoning with Missing Values ...
  • [18] Jeerz, A. (2016). “Coordinate Metology”, Acuuracy of Systema and ...
  • نمایش کامل مراجع