بررسی و بهبود روشی برای مسائل عدم تعادل کلاس بندی مجموعه داده های نامتوازن

Publish Year: 1395
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 872

This Paper With 8 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CECCONF01_030

تاریخ نمایه سازی: 22 آبان 1395

Abstract:

امروزه مسئله کلاس بندی داده های نامتوازن از اهمیت خاصی برخوردار است. کلاس بندی این داده ها بدین گونه است که، کلاسی که از نظر دامنه کاربرد اهمیت زیادی دارد کلاس اقلیت oversampling نامیده می شود و شامل تعداد حالات کمتری نسبت به کلاس اکثریت undersampling می باشد. سعی می شود در کلاس بندی این داده ها، تعداد حالات کلاس اقلیت را نسبت به کلاس اکثریت افزایش دهیم. در این مقاله، روشی برای نمونه برداری نیمه بدون نظارت وزن دار وفقی (A-SUWO) را برای بهبود طبقه بندی مجموعه داده های باینری نامتوازن ارائه و بررسی می کنیم. این روش با استفاده از خوشه بندی سلسه مراتبی بدون نظارت وزن و اندازه قابل تطبیق به oversampling هریک از زیر خوشه ها با استفاده از پیچیدگی کلاس بندی و اعتبار سنجی متقابل می پردازد، سپس نمونه های اقلیت بسته به فاصله اقلیدسی خود نسبت به کلاس اکثریت، طبقه بندی می شوند.

Authors

اسماعیل صادقی هفشجانی

دانشگاه آزاد اسلامی شهرکرد

زهره صحرانشین سامانی

دانشگاه آزاد اسلامی شهرکرد

شیرین بنی طالبی

دانشگاه آزاد اسلامی شهرکرد

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :