طبقه بندی داده های نامتعادل چندکلاسه مبتنی بر تجزیه چندکلاسی و بهینه سازی ازدحام ذرات abstract
یادگیری یک طبقه بند از یک مجموعه داده نامتعادل یک مسیله مهم در داده کاوی و یادگیری ماشین است. ازآنجاکه اطلاعات بیشتری درباره کلاس های حداکثر نسبت به کلاس های حداقل در یک مجموعه داده نامتعادل وجود دارد، طبقه بند درباره نمونه های کلاس حداکثر دچار بیش برازش میشود. مطالعات قبلی بر افزایش حساسیت یادگیری نسبت به نمونه های کلاس حداقل تمرکز کردهاند و یا از روشهای متوازنسازی قبل از یادگیری، بهره گرفتهاند. اما تعیین اینکه کلاس های حداکثر و حداقل تا چه اندازه باید متوازن شوند، هنوز یک مسیله حل نشده است. بیشتر مطالعات انجام شده، روی مسایل طبقه بندی نامتعادل دوکلاسی تمرکز کرده اند. یکی از متداول ترین روشهای حل مسایل نامتعادل چندکلاسی، تجزیه آنها به یک سری از مسایل نامتعادل دودویی است. از میان این استراتژی ها، روش های تجزیه یکی در مقابل همه و یکی در مقابل یکی توجه زیادی را به خود جلب کرده اند. در این پژوهش، برای حل مسیله طبقه بندی نامتعادل چندکلاسی از تجزیه یکی در مقابل یکی استفاده شده است بدین ترتیب مسیله چندکلاسی به چندین زیر مسیله دوکلاسی تبدیل میشود. برای غلبه بر مشکل عدم توازن در زیر مسیله های دوکلاسی، از ایده ترکیب تجمعی استفادهشده که در آن از الگوریتم های هوش جمعی برای انتخاب ترکیب بهینه از نمونه ها جهت طبقه بندی بهره گرفته شده است. در مقایسه با روش های متداول متوازن سازی مانند جستجوی خطی، روش پیشنهادی میتواند ترکیب های بهینه را با صحت و قابلیت اعتماد بیشتر بیابد. الگوریتم ارایه شده با سایر الگوریتم های موجود مقایسه شده است و نتایج، عملکرد مناسب روش پیشنهادی را در مقایسه با سایر روش ها نشان میدهد.
طبقه بندی داده های نامتعادل چندکلاسه مبتنی بر تجزیه چندکلاسی و بهینه سازی ازدحام ذرات Keywords:
یادگیری نامتعادل - تجزیه چندکلاسی - ترکیب تجمعی-بهینه سازی