طبقه بندی اجماع با توجه به گوناگونی برای یادگیری داده های نامتعادل

Publish Year: 1395
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 829

This Paper With 11 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ITCC03_011

تاریخ نمایه سازی: 6 اردیبهشت 1396

Abstract:

امروزه با توجه به گسترش روز افزون اطلاعاتی که بشر با آنها سر و کار دارد، بهره گیری از روشهایی همچون داده کاویبرای استخراج دانش و اطلاعات نهفته در دادهها، امری غیرقابل اجتناب می باشد. مساله دیگری که امروزه در بحث داده-کاوی وجود دارد، بحث دادههای نامتعادل است. داده های نامتعادل می توانند توسط خطای اندازه گیری ایجاد شوند یاممکن است نتیجه نوع داده ی درونی باشند. بنابراین روشهای زیادی مانند نمونه برداری، یادگیری حساس به هزینه،bagging و boosting مبتنی بر روشهای جمعی ارایه شده است ولی این روشها باعث حذف بعضی داده های مفید یاافزودن داده اضافی می شوند بنابراین بر آن شدیم که روشی جدید ارایه کنیم که بر مشکلات روشهای قبلی غلبه کند.در روش پیشنهادی ابتدا کلاس داده دودویی نامتعادل را به چندین کلاس داده دودویی متعادل تبدیل می کند. این کار رابا بکارگیری تقسیم تصادفی یا خوشه بندی نمونه های کلاس اکثریت انجام می دهد. بعد از آن یک الگوریتم طبقه بندیخاص بکار می رود تا چندین داده دودویی متعادل را به چندین طبقه بند تبدیل کند سرانجام نتایج طبقه بندی، این طبقهبند های دودویی را برای یک داده جدید با پنج قانون جمعی جدید شامل MaxDistance ، MinDistance ،ProDistance ، MajDistance و SumDistance ترکیب می کند سپس با توجه به گوناگونی روی طبقه بندجمعی رابطه بین داده جدید و داده قدیمی را شرح می دهد.نتایج آزمایشات روی 64 مجموعه داده نامتعادل نشان می دهد که روش ارایه شده قادر است مسایل کلاس دادهدودویینامتعادل را مدیریت کند و معمولا از روشهای مرسوم شامل روشهای مدیریت داده نامتعادل داخلی و خارجی موثرترعمل می کند.

Authors

مصطفی بصیرنژاد

دانشکده فنی و مهندسی، موسسه آموزش عالی خراسان

صادق کمالیان

دانشجوی مرکز آموزش علمی کاربردی مدیریت صنعتی خراسان رضوی

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • Z. Sun, Q. Song, X. Zhu, Using coding-based ensemble learning ...
  • D. Thammasiri, D. Delen, P. Meesad, N. Kasap, A critical ...
  • W. Fan, S. J. Stolfo, J. Zhang, et al., "AdaCost: ...
  • Y.C. Tang, Y.-Q. Zhang, N. V. Chawla, et al., "SVMs ...
  • L. Zhuang and H. Dai, "Parameter estimation of one-class SVM ...
  • N. V. Chawla, K. W. Bowyer, L. O. Hall, W. ...
  • Y. Freund, R. Schapire, Experiments with a new boosting algorithm, ...
  • N. Tomasev, D. Mladeni c, Class imbalance and the curse ...
  • M. A. Tahir, J. Kittler, F. Yan, Inverse random under ...
  • V. Garc na, J. S. S anchez, R. Mart n-F'elez, ...
  • Z. Sun, Q. Song, X. Zhu, H. Sun, B. Xu, ...
  • G.-Z. Li, H.-H. Meng, W.-C. Lu, et al, "Asymmetric bagging ...
  • C. G.-Z. Li, H.-H. Meng, W.-C "Classifying imbalanced data using ...
  • S. Hido, H. Kashima, and Y. Takahashi, "Roughly balanced bagging ...
  • Y. Sun, M.S. Kamel, A.K.C. Wong, et al., "Cost-sensitie boosting ...
  • N. V. Chawla, A. Lazarevic, L. O. Hall, et al., ...
  • C. Seiffert, T. M. Khoshgoftaar, J. V. Hulse, et al., ...
  • H. Guo and H.L Viktor, "Learning from imbalanced data sets ...
  • C. Elkan, "The foundations of cost-sensitive learring, " Proc. 17th ...
  • H. He and E. A. Garcia, "Learning from imbalanced data, ...
  • Z.-H. Zhou and X.-Y. Liu, "Training cost-sensitive neural networks with ...
  • P. Domingos, "MetaCost: A general method for making classifiers cost-sensitive, ...
  • X. Liu, J.Wu, Z. Zhou, Exploratory undersampling for class -imbalance ...
  • A. Fern andez, M. J. del Jesus, F. Herrera, On ...
  • J. Alcal a, A. Fern andez, J. Luengo, J. Derrac, ...
  • M. Friedman, The use of ranks to avoid the assumption ...
  • J. Dem sar, Statistical comparisons of classifiers over multiple data ...
  • P. Nemenyi, D istribution-fre multiple comparisons, Ph.D. thesis, Princeton, 1963. ...
  • نمایش کامل مراجع