بررسی و بهبود روشی برای مسائل عدم تعادل کلاس بندی مجموعه داده های نامتوازن
Publish place: The first national conference of computer science and engineering and information technology
Publish Year: 1395
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 872
This Paper With 8 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CECCONF01_030
تاریخ نمایه سازی: 22 آبان 1395
Abstract:
امروزه مسئله کلاس بندی داده های نامتوازن از اهمیت خاصی برخوردار است. کلاس بندی این داده ها بدین گونه است که، کلاسی که از نظر دامنه کاربرد اهمیت زیادی دارد کلاس اقلیت oversampling نامیده می شود و شامل تعداد حالات کمتری نسبت به کلاس اکثریت undersampling می باشد. سعی می شود در کلاس بندی این داده ها، تعداد حالات کلاس اقلیت را نسبت به کلاس اکثریت افزایش دهیم. در این مقاله، روشی برای نمونه برداری نیمه بدون نظارت وزن دار وفقی (A-SUWO) را برای بهبود طبقه بندی مجموعه داده های باینری نامتوازن ارائه و بررسی می کنیم. این روش با استفاده از خوشه بندی سلسه مراتبی بدون نظارت وزن و اندازه قابل تطبیق به oversampling هریک از زیر خوشه ها با استفاده از پیچیدگی کلاس بندی و اعتبار سنجی متقابل می پردازد، سپس نمونه های اقلیت بسته به فاصله اقلیدسی خود نسبت به کلاس اکثریت، طبقه بندی می شوند.
Keywords:
Authors
اسماعیل صادقی هفشجانی
دانشگاه آزاد اسلامی شهرکرد
زهره صحرانشین سامانی
دانشگاه آزاد اسلامی شهرکرد
شیرین بنی طالبی
دانشگاه آزاد اسلامی شهرکرد
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :