تصحیح خودکار داده ها مبتنی بر وابستگی تابعی و سیستم یادگیری مرکب

Publish Year: 1397
نوع سند: مقاله ژورنالی
زبان: Persian
View: 380

This Paper With 18 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

JR_TJEE-48-2_029

تاریخ نمایه سازی: 17 تیر 1398

Abstract:

صحت داده ها یکی از مهم ترین ابعاد کیفیت داده ها به شمارمی رود. با توجه به حجم بالای منابع داده ای نیاز به روش هایی خودکار وجود دارد. در این مقاله راهکاری خودکار برای تصحیح داده هایی با انواع داده ای متفاوت ارائه شده است. در این راهکار در ابتدا رکوردهایی که احتمالا حاوی ویژگی خطا است با استفاده از وابستگی تابعی شناسایی می گردد، بدین صورت که رکوردی که به ازای یک وابستگی تابعی با بیش از  از رکوردها در تناقض باشد، مشکوک به خطا است. سپس به ازای هر ویژگی از منبع داده مورد بررسی، سیستم یادگیری مرکب ساخته می شود. سیستم یادگیری مرکب از سه طبقه بند بیز، درخت تصمیم و شبکه عصبی MLP تشکیل شده است و دارای استراتژی ترکیب رای اکثریت است. سیستم یادگیری مرکب به وسیله رکوردهای صحیح شناسایی شده مورد آموزش قرارداده می شود. پس از آموزش طبقه بندها، هر ویژگی غلط به عنوان کلاس هدف سیستم یادگیری مرکب قرارمی گیرد و مقداری برای آن پیش بینی می گردد. روش پیشنهادی قادراست چندین خطا در یک رکورد را شناسایی نماید. آزمایش ها نشان می دهد که true negative rate الگوریتم پیشنهادی در بخش تشخیص خطا به طور متوسط 93.7% و در بخش تصحیح خطا به طور متوسط 90.6% است. هم چنین آزمایش ها نشان می دهد که میزان پارامترهای ارزیابی در الگوریتم پیشنهادی در مقایسه با دو الگوریتم مشابه مبتنی بر وابستگی تابعی بهبود داشته است.

Authors

مهدیه عطاییان

تهران - دانشگاه تربیت دبیر شهید رجایی - دانشکده مهندسی کامپیوتر

نگین دانشپور

تهران - دانشگاه تربیت دبیر شهید رجایی - دانشکده مهندسی کامپیوتر

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • الناز زعفرانی معطر، محمدرضا فیضی درخشی و آزاده روحانی، تشخیص ... [مقاله ژورنالی]
  • مرتضی خرم کشکولی و مریم دهقانی، تشخیص، شناسایی و جداسازی ... [مقاله ژورنالی]
  • یوکابد صدری، علی آقاگلزاده و مهدی ازوجی، ادغام تصویر چندفوکوسه ... [مقاله ژورنالی]
  • G. Rahman and Z. Islam, Missing value imputation using decision ...
  • W. Fan, F. Geerts, X. Jia and A. Kementsietsidis, Conditional ...
  • P. H. WilliAMS, C. R. Margules, and D. W. Hilbert, ...
  • G. Rahman and Z. Islam, Decision Tree-based Missing Value Imputation ...
  • X. Chu and I. F. Ilyas, Qualitative Data Cleaning, The ...
  • L. Breiman, Bagging predictors, Machine Learning, vol. 24, no. 2, ...
  • M. Yakout, L. Berti-Équill, and A. K. Elmagarmid, Don’t be ...
  • N. Tang, Big Data Cleaning , Proceedings of the 16th ...
  • J. Hipp, U. Gu¨ntzer, and U. Grimmer, Data quality mining-making ...
  • S. Bruggemann, Rule Mining for Automatic Ontology Based Data Cleaning, ...
  • C. He, Z. Tan, Q. Chen, C. Sha, Z. Wang, ...
  • F. Chiang and R. J. Miller, A Unified Model for ...
  • M. Fijałkowska and B. Antoszewski, Classification of congenital nasal deformities: a proposal ...
  • C. M. Teng, Correcting Noisy Data, Proceedings of the 16th ...
  • C. M. Teng, A Comparison of Noise Handling Techniques, Proceedings ...
  • C. M. Teng, Polishing Blemishes: Issues in Data Correction, Intelligent ...
  • S. Kolahi and L. Lakshmanan, On Approximating Optimum Repairs for ...
  • G. Beskales, I. F. Ilyas, L. Golab and A. Galiullin, ...
  • M. Volkovs, F. Chiang, J. Szlichta and R. J. Miller, ...
  • G. Beskales, I. F. Ilyas, L. Golab and A. Galiullin, ...
  • X. Chu, J. Morcos, I. F. Ilyas, M. Ouzzani, P. ...
  • W. Fan, S.  Ma, N. Tang and W. Yu, Interaction ...
  • J. Segeren, D. Gairola and F. Chiang, CONDOR: A System ...
  • S. Song, H. Zhu and J. Wang, Constraint-Variance Tolerant Data ...
  • F. Chiang and S. Sitaramachandran, Unifying Data and Constraint Repairs, ...
  • J. Han, M. Kamber and J. Pei, Data Mining Concept ...
  • H. Yao and H. J. Hamilton, Mining functional dependencies from ...
  • Y. Huhtala, J. Kärkkäinen, P. Porkka and H. Toivonen, Tane: ...
  • P. Kontkanen, J. Lahtinen, P. Myllymaki, T. Silander and H. ...
  • R. Agrawal and R. Ikant and D. Thomas, Privacy Preserving ...
  • I. Yoncaci, Maximum a Posteriori Tree Augmented Naive Bayes Classifiers, ...
  • S. Haykin, Neural Networks: A Comprehensive Foundation, 2nd. ...
  • Englewood Cliffs, NJ: Prentice-Hall, 1999. ...
  • نمایش کامل مراجع