استفاده از الگوهای مرزی و غیر مرزی در طبقه بندی داده های نامتوازن

Publish Year: 1395
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 591

This Paper With 10 Page And PDF and WORD Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

COMCONF03_129

تاریخ نمایه سازی: 6 اردیبهشت 1396

Abstract:

مسیله کلاس های نامتوازن مشکلی است که اکثر طبقه بندها در برخورد با این کلاس ها خوب عمل نمی کنند. اکثر طبقه بندها در تشخیص کلاس اقلیت و اکثریت دیتاست های نامتوازن به خطا می انجامند. برای برخورد با این مشکل محققان، ابتدا سایز کلاس ها را متوازن می کنند. برای انجام این کار از روش های under sampling کلاس اکثریت و یا over sampling کلاس اقلیت استفاده می شود. سپس دادهای متوازن شده را برای آموزش طبقه بند مورد استفاده قرار می دهند. این عمل منجر به ایجاد الگوهای موردعلاقه برای انجام عمل طبقه بندی می شود. از طرفی با انجام متوازن کردن کلاس ها، می توان مقدار پارامتر AUC را افزایش داد. AUC یک کمیت اندازه گیری خوب برای بیان میزان کارایی طبقه بندی است. در این مقاله، ما با استفاده از روش های جداسازی الگوهای مرزی و غیر مرزی، کلاس اکثریت و اقلیت را به این دو مجموعه تبدیل می کنیم. تحت عمل under sampling الگوهای مرزی کلاس اکثریت را حذف می کنیم. این به نوعی باعث متوازن شدن دیتاست نامتوازن می شود. نتیجه این که کمیت AUC بهبود داده می شود. آزمایش های انجام شده بهبود AUC را نسبت به سایر الگوریتم ها نشان می دهد.

Keywords:

الگوهای مرزی و غیرمرزی , داده های نامتوازن , کلاس بندی داده , طبقه بندی داده ها

Authors

علی یعقوبی

کارشناس ارشد مهندسی نرم افزار موسسه آموزش عالی پارس رضوی شهرستان گناباد

حمیدرضا رضاپور

دانشجوی کارشناسی ارشد هوش مصنوعی آستان قدس رضوی-کتاخانه امام رضا(ع)

محسن کرامتی شهری

دانشگاه آزاد اسلامی مشهد، واحد مشهد

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • Mollineda, V. G. J. S. R., and R. A. J. ...
  • Akbani R, Kwek S, Japkowicz N: Applying Support Vector Machines ...
  • Z. Jin, J.Y. Yang, Z.S. Hu, Z. Lou, Face recognition ...
  • M. Loog, R.P.W. Duin, R. Haeb-Umbach, Multiclass Linear Dimension Reduction ...
  • Yaghoubi, A., & Ghaffari, H. R. Improved LDA by using ...
  • _ Loog and R.P.W. Duin, "Non-Iterative Heteros cedastic Linear Dimension ...
  • Fisher, R. A. (1936). The use of multiple measuremens in ...
  • J.H. Na, S.M. Yun, M. Kim, J.Y. Choi, Relevant Pattern ...
  • Duda R, Hart P, Stork D:Pattern Classification 2nd edition. New ...
  • Salvi, Giampiero. "Accent clustering in Swedish using the Bhattacharya distance." ...
  • Na, J. H., Park, M. S., & Choi, J. Y. ...
  • Fisher, Ronald A. "The Luse of multiple measurement in taxonomic ...
  • Duin, R. P. W., & Loog, M. (2004). Linear dimensionality ...
  • J. Alcala-Fdez, A. Fernandez, J. Luengo, J. Derrac, S. Garcia, ...
  • Ding, S., Zhang, S., Li, Y, & Wang, T. (2012). ...
  • prediction method based on predicted secondary structure. Biochimie, 94(5), 1166- ...
  • Tom Fawcett, "An introduction to ROC analysis", Elsevier, Pattern Recognition ...
  • Friedman, Jerome H. "Regularized discriminant analysis. " Journal of the ...
  • Masip, David, Ludmila I. Kuncheva, and Jordi Vitria. "An ens ...
  • Transactions On Patter Analysis And Machine Intelligence, Vol. 23, No. ...
  • نمایش کامل مراجع