اعمال مدل های رگرسیون بر زیرمجموعه های با همبستگی بالا برای بهبود جایگذاری مقادیر جاافتاده عددی

Publish Year: 1397
نوع سند: مقاله ژورنالی
زبان: Persian
View: 285

This Paper With 14 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

JR_TJEE-48-3_022

تاریخ نمایه سازی: 17 تیر 1398

Abstract:

حضور مقادیر جاافتاده در داده های دنیای واقعی مشکلی بسیار رایج و غیرقابل اجتناب است. بنابراین لازم است تا پیش از عملیات اکتشاف دانش، این مقادیر جاافتاده به طور دقیق پر شوند. در این مقاله، سه رویکرد جدید برای تخمین مقادیر جاافتاده عددی پیشنهاد می شود. در تمامی روش های پیشنهادی، مدل های رگرسیون بر زیرمجموعه هایی با همبستگی بالا اعمال می شوند. در انتخاب زیرمجموعه های مطلوب سعی می شود تا همبستگی بین صفت جاافتاده و دیگر صفات حداکثر شود. انتخاب این زیرمجموعه ها با استفاده از رویکردهایی مبتنی بر انتخاب روبه جلو انجام می شود. از معیار ضریب همبستگی برای اندازه گیری میزان ارتباط بین صفات استفاده شده است. همچنین در روش های پیشنهادی، ترتیب صفات جاافتاده برای انجام عمل جایگذاری اولویت دهی می شوند. عملکرد رویکردهای پیشنهادشده بر روی پنج مجموعه داده از دنیای واقعی با مقادیر مختلف جاافتادگی ارزیابی شده است. عملکرد رویکردهای ارائه شده با پنج رویکرد جایگذاری با مقدار میانگین، جایگذاری با استفاده از نزدیک ترین همسایگان، روش جایگذاری با خوشه بندی c-means فازی، روش جایگذاری با درخت تصمیم و روشی مبتنی بر رگرسیون به نام الگوریتم جایگذاری با رگرسیون افزایشی صفات (IARI) مقایسه شده است. از دو معیار شناخته شده ی ریشه میانگین مربعات خطا و ضریب تعیین برای مقایسه عملکرد رویکردهای پیشنهادی با دیگر روش های جایگذاری استفاده شده است. نتایج آزمایش ها نشان می دهد که رویکردهای ارائه شده، حتی زمانی که درصد جاافتادگی بالا است، بهتر از دیگر روش های مقایسه شده عمل می کنند.

Authors

امیرمسعود سفیدیان

دانشکده مهندسی کامپیوتر - دانشگاه تربیت دبیر شهید رجایی - تهران

نگین دانشپور

دانشکده مهندسی کامپیوتر - دانشگاه تربیت دبیر شهید رجایی - تهران

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • مرتضی خرم کشکولی و مریم دهقانی، تشخیص، شناسایی و جداسازی ... [مقاله ژورنالی]
  • علیرضا سردار و رمضان هاونگی، بهبود عملکرد الگوریتم خوشه یابی ... [مقاله ژورنالی]
  • Y. Qin, S. Zhang, X. Zhu, J. Zhang, and C. ...
  • G. Sun, J. Shao, H. Han, and X. Ding, Missing ...
  • M. Lichman, UCI Machine Learning Repository, Available online at: http://archive.ics.uci.edu/ml, ...
  • P. J. Garcia-Laencina, J. L. Sancho-Gomez, and AR. Figueiras-Vidal, Pattern ...
  • E. L. Silva-Ramrez, R. Pino-Mejas, and M. Lpez-Coello, Single imputation ...
  • M. G. Rahman and M. Z. Islam, Missing value imputation ...
  • M. Amiri and R. Jensen, Missing data imputation using fuzzy-rough ...
  • H. Wang and S. Wang, Mining incomplete survey data through ...
  • C.F. Tsai and F.Y. Chang, Combining instance selection for better ...
  • C. T. Tran, M. Zhang, P. Andreae, and B. Xue, ...
  • M. G. Rahman and M. Z. Islam, Data quality improvement ...
  • B. van Stein and W. Kowalczyk, An incremental slgorithm for ...
  • G. Rahman and Z. Islam, A decision tree-based missing value ...
  • L. Breiman, Random Forests, Machine learning, vol. 45, no. 1, ...
  • C.H. Wu, C.H. Wun, and H.J. Chou, Using association rules ...
  • N. Singh, A. Javeed, S. Chhabra, and P. Kumar, Missing ...
  • J. Han, M. Kamber, and J. Pei, Data Mining: Concepts ...
  • C. Jiang and Z. Yang, CKNNI: an improved knn-based missing ...
  • R. Krishnamoorthy, S. S. Kumar, and B. Neelagund, A new ...
  • C. Zhang, X. Zhu, J. Zhang, Y. Qin, and S. ...
  • B. M. Patil, R. C. Joshi, and D. Toshniwal, Missing ...
  • V. Ayuyev, J. Jupin, P. Harris, and Z. Obradovic, Dynamic ...
  • D. Li, J. Deogun, W. Spaulding, and B. Shuart, Towards ...
  • P. Raja and K. Thangavel, Soft clustering based missing value ...
  • N. Ankaiah and V. Ravi, A novel soft computing hybrid ...
  • S. Azim, S. Aggarwal, Hybrid model for data imputation: using ...
  • S. Bashir, S. Razzaq, U. Maqbool, S. Tahir, and A. ...
  • D. R. Wilson and T. R. Martinez, Reduction techniques for ...
  • Batista, G. E., & Monard, M. C. (2002). A study ...
  • F. Pedregosa, G. Varoquaux, A. Gramfort, V. Michel, B. Thirion, ...
  • نمایش کامل مراجع