CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بررسی روشهای مختلف بیش نمونه گیری در رده بندی داده های نامتوازن

عنوان مقاله: بررسی روشهای مختلف بیش نمونه گیری در رده بندی داده های نامتوازن
شناسه ملی مقاله: CEDAB03_058
منتشر شده در سومین کنفرانس ملی مهندسی کامپیوتر،داده کاوی و داده های حجیم در سال 1398
مشخصات نویسندگان مقاله:

هادی مهدوی نیا - دانشجوی دکتری مهندسی نرم افزار دانشگاه آزاد اسلامی واحد خوراسگان

خلاصه مقاله:
در استخراج دانش از داده ها، از نظر توازن، به داده های متوازن و نامتوازن برخورد میشود. برای رده بندی داده های نامتوازن، اگر از روش های معمول رده بندی مانند ماشین های بردار و غیره استفاده شود، مشکلاتی مانند: مدل جانبدارانه، رده بندی اشتباه رده ی اقلیت، صرفه نظر کردن از داده های رده ی اقلیت و بیشپوشش به وجود خواهد آمد. برای اجتناب از مشکلات، باید از روشهای خاصی برای ردهبندی داده های نامتوازن استفاده شود. برای رده بندی داده های نامتوازن، از یکی از روشهای سطح داده، روش های سطح الگوریتم، روشهای یادگیری حساس به هزینه و روشهای یادگیری ترکیبی استفاده میشود که استفاده از هر یک از روشها به اهداف استخراج دانش بستگی دارد. در روشهای سطح داده، یکی از روشهای مرسوم، افزایش نمونه های ردهی اقلیت است که به بیش نمونه گیری معروف است. در این تحقیق انواع روشهای بیش نمونه گیری در داده کاوی داده های نامتوازن که یکی از زیرمجموعه های رویکرد سطح داده است، بررسی میشوند.

کلمات کلیدی:
داده های نامتوازن، رده اکثریت، رده اقلیت، بیش نمونه گیری

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/949592/