بررسی روشهای مختلف بیش نمونه گیری در رده بندی داده های نامتوازن

Publish Year: 1398
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,154

This Paper With 7 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CEDAB03_058

تاریخ نمایه سازی: 28 مهر 1398

Abstract:

در استخراج دانش از داده ها، از نظر توازن، به داده های متوازن و نامتوازن برخورد میشود. برای رده بندی داده های نامتوازن، اگر از روش های معمول رده بندی مانند ماشین های بردار و غیره استفاده شود، مشکلاتی مانند: مدل جانبدارانه، رده بندی اشتباه رده ی اقلیت، صرفه نظر کردن از داده های رده ی اقلیت و بیشپوشش به وجود خواهد آمد. برای اجتناب از مشکلات، باید از روشهای خاصی برای ردهبندی داده های نامتوازن استفاده شود. برای رده بندی داده های نامتوازن، از یکی از روشهای سطح داده، روش های سطح الگوریتم، روشهای یادگیری حساس به هزینه و روشهای یادگیری ترکیبی استفاده میشود که استفاده از هر یک از روشها به اهداف استخراج دانش بستگی دارد. در روشهای سطح داده، یکی از روشهای مرسوم، افزایش نمونه های ردهی اقلیت است که به بیش نمونه گیری معروف است. در این تحقیق انواع روشهای بیش نمونه گیری در داده کاوی داده های نامتوازن که یکی از زیرمجموعه های رویکرد سطح داده است، بررسی میشوند.

Authors

هادی مهدوی نیا

دانشجوی دکتری مهندسی نرم افزار دانشگاه آزاد اسلامی واحد خوراسگان