CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بررسی و بهبود روشی برای مسائل عدم تعادل کلاس بندی مجموعه داده های نامتوازن

عنوان مقاله: بررسی و بهبود روشی برای مسائل عدم تعادل کلاس بندی مجموعه داده های نامتوازن
شناسه ملی مقاله: CECCONF01_030
منتشر شده در اولین کنفرانس ملی علوم و مهندسی کامپیوتر و فناوری اطلاعات در سال 1395
مشخصات نویسندگان مقاله:

اسماعیل صادقی هفشجانی - دانشگاه آزاد اسلامی شهرکرد
زهره صحرانشین سامانی - دانشگاه آزاد اسلامی شهرکرد
شیرین بنی طالبی - دانشگاه آزاد اسلامی شهرکرد

خلاصه مقاله:
امروزه مسئله کلاس بندی داده های نامتوازن از اهمیت خاصی برخوردار است. کلاس بندی این داده ها بدین گونه است که، کلاسی که از نظر دامنه کاربرد اهمیت زیادی دارد کلاس اقلیت oversampling نامیده می شود و شامل تعداد حالات کمتری نسبت به کلاس اکثریت undersampling می باشد. سعی می شود در کلاس بندی این داده ها، تعداد حالات کلاس اقلیت را نسبت به کلاس اکثریت افزایش دهیم. در این مقاله، روشی برای نمونه برداری نیمه بدون نظارت وزن دار وفقی (A-SUWO) را برای بهبود طبقه بندی مجموعه داده های باینری نامتوازن ارائه و بررسی می کنیم. این روش با استفاده از خوشه بندی سلسه مراتبی بدون نظارت وزن و اندازه قابل تطبیق به oversampling هریک از زیر خوشه ها با استفاده از پیچیدگی کلاس بندی و اعتبار سنجی متقابل می پردازد، سپس نمونه های اقلیت بسته به فاصله اقلیدسی خود نسبت به کلاس اکثریت، طبقه بندی می شوند.

کلمات کلیدی:
مجموعه داده نامتوازن، دسته بندی، فراگیری بطورجمعی، خوشه بندی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/527004/