CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بهبود کلاس بندی داده های نامتوازن با استفاده از ترکیب الگوریتم SMOTE و رقابت استعماری

عنوان مقاله: بهبود کلاس بندی داده های نامتوازن با استفاده از ترکیب الگوریتم SMOTE و رقابت استعماری
شناسه ملی مقاله: AIHE08_396
منتشر شده در کنفرانس ملی علوم مهندسی، ایده های نو (۸) در سال 1393
مشخصات نویسندگان مقاله:

عارف طهماسب - دانشجوی کارشناسی ارشد دانشگاه شهید باهنر
علی اکبر نیک نفس - استادیار دانشگاه شهید باهنر
حمید علی میروزیری - استادیار دانشگاه شهید باهنر

خلاصه مقاله:
در دنیای امروز مسئله دسته بندی داده های نامتوازن از اهمیت خاصی برخوردار است. دسته بندی این داده ها به گونه ای هست که ، کلاسی که از نظر دامنه کاربرد اهمیت زیادی دارد( کلاس اقلیت) شامل تعداد حالات کمتری نسبت به کلاسی است که از اهمیت خاصی برخوردار نیست ( کلاس اکثریت) بهمجموعه این داده ها داده های نامتوازن می گویند. روش های مختلفی برای دسته بندی این نوع داده ها ارائه شده است. در دسته بندی این داده ها می کوشیم تا تعداد حالات کلاس اقلیت را نسبت به کلاس اکثریت افزایش دهیم. در این مقاله، ما پیشنهاد می کنیم یک الگوریتم جدید و موثر بر کلاس بندی داده های 5 سال بیماران سرطانی که در این دیتاست خاصیت نامتوازن بودن وجود دارد. الگوریتم پیشنهادی ترکیبی از الگوریتم های SMOTE ، الگوریتم رقابت اسعتماری ICA و برخی از کلاسیفایرهای مشهور است و همچنین برای محاسبه کارای الگوریتم پیشنهادی از ارزیاب هایی مانند Sensitivity, Specificity , Accuracy,GMean استفاده شده است. نتایج نشان می دهد که ترکیب الگوریتم های SMOTE+ICA+C5 بهترین نتیجه را در کلاس بندی داده های نامتوازن دارد. پس این یک رویکرد موثر در کلاس بندی داده های نامتوازن است.

کلمات کلیدی:
الگوریتم رقابت استعماری، داده های نامتوازن، کلاس بندی داده های نامتوازن

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/308379/