مطالعه ای بر روش های متوازن سازی در سطح داده ها در رویکردهای تحت یادگیری با نظارت

Publish Year: 1398
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 2,892

This Paper With 8 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ECME05_034

تاریخ نمایه سازی: 13 بهمن 1398

Abstract:

با توسعه علوم داده ها به خصوص تکنیک های داده کاوی استفاده از رویکردهای تحت یادگیری با نظارت نیز گسترش یافته است. هنگامی که در یک فرایند داده کاوی مبتنی بر یادگیری با نظارت از یک مجموعه داده کاوی کلاس های با ماهیت فوق العاده نامتوازن استفاده می شود سوگیری بسیار از الگوریتم های داده کاوی نیز به سمت پیش بینی کلاس اکثریت متمایل می شود، این در حالی است که در چنین رویکردهایی عموما تشخیص صحیح برچسب کلاس اقلیت حائز اهمیت است. یکی از روش های حل مشکل فوق، استفاده از روش های متوازن سازی در سطح داده ها است که خود مبتنی بر روش های تحت Oversampling و Undersampling است. با توجه به اهمیت موضوع به نظر می رسد وجود یک پژوهش در راستای مطالعه جامع تر روش هی مذکور ضروری به نظر می رسد، در این پژوهش روش های متوازن سازی در سطح داده ها شامل Random over sampling و Random Under sampling و ADASYN و SMOTE به شکل جاع تر و با جزئیات بیشتری نسبت به مطالعات پیشین مورد بررسی و مطالعه قرار می گیرد.

Keywords:

متوازن سازی داده ها , SMOTE , ADASYN , Oversampling , Undersampling

Authors

احسان شفیعی نژاد

کارشناس ارشد مهندسی نرم افزار، دانشگاه رجاء