رویکردی مبتنی بر خوشه بندی برای طبقه بندی داده های نامتوازن دو کلاسی با استفاده از مفهوم عدم قطعیت

Publish Year: 1394
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 889

This Paper With 14 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ITCC01_245

تاریخ نمایه سازی: 9 فروردین 1395

Abstract:

در طبقه بندی، مساله داده های نامتوازن زمانی که مجموعه داده دارای توزیع نابرابر کلاس باشد رخ می دهد. اغلبالگوریتم های طبقه بندی، فرض می کنند که توزیع کلاس ها یکسان است و در صورتی که توزیع کلاس ها نامتوازن باشد،این الگوریتم ها در تشخیص خود دچار مشکل می شوند. در این مقاله، روشی جدید مبتنی بر خوشه بندی ارائه شده است.داده های نامتوازن توسط یک الگوریتم خوشه بندی می شوند، سپس نسبت فراوانی نمونه های اقلیت به نمونه های اکثریتدر هر خوشه محاسبه می گردد. عدد مربوط به هر خوشه برای داده های همان خوشه به عنوان یک ویژگی جدید در نظرگرفته می شود. در مرحله بعد داده ها توسط الگوریتم های استاندارد طبقه بندی با برچسب جدید، طبقه بندی خواهند شد. بااستفاده از ویژگی جدید علاوه بر تعیین دقیق برچسب کلاس یک نمونه، میزان احتمال تعلق به کلاس دیگر نیز بیانمی شود. تست روش بر روی 17 مجموعه داده از پایگاه KEEL انجام شده و سپس با نتایج دو مقاله معتبر مقایسهمی گردد. نتایج نشان می دهد که کارایی طبقه بندی توسط روش پیشنهادی بهبود یافته است.

Authors

ملیحه وضیع

دانشجوی کارشناسی ارشد نرم افزار دانشگاه آزاد اسلامی بیرجند

مصطفی سبزه کار

استاد مدعو دانشگاه آزاد اسلامی بیرجند

حامد وحدت نژاد

عضو هیئت علمی دانشگاه بیرجند

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • مکفی، طه، 1392، تعریف رده‌بندی و پیش‌بینی، گروه داده کاوی ...
  • طباطبائی‌عینکی، فاطمه سادت مینایی‌بیدگلی، بهروز، مینی‌بیدگلی، فریبا، تشخیص سرطان سینه ... [مقاله کنفرانسی]
  • بوبه، مهدی‌زاده، مهدی، افتخاری، طراحی سیستم طبقه بندی مبتنی بر ...
  • مهسا‌طاهری، بهرام، صادقی‌بی‌غم. روش هزینه دهی جدید برای کلاس بندی ... [مقاله کنفرانسی]
  • _ Internatiotal Conference om Information Technology, Computer & Communication 28 ...
  • Yen S-J, Lee Y-S. (2009) .Cluster-based under- sampling approaches for ...
  • Rissanen J.(1978). Modeling by the shortest data description. Automatica. 14(1978). ...
  • Maloof, M. A. (2003). Learning When Data Sets Are Imbalanced ...
  • He H, Garcia EA.(2009). Learning from Imbalanced Data. Knowledge and ...
  • Kubat, M., Holte, R., Matwin, S.(1998). Machine learning for detection ...
  • Krawczyk B, Wo zniak M, Schaefer G.(2014). Cost-sensitive decision tree ...
  • Fernandez A. _ Barrenechea, E. ; Bustince, H. _ Herrera, ...
  • _ YBERNETI S-PART C: AP PLICATION S AND REVIEWS .(42)20 ...
  • Wei Liu, Sanjay Chawla, David A Cieslak, Nitesh V Chawla.(201 ...
  • V Lopez, A Fernandez, JG Moreno -Torres, F Herrera , ...
  • نمایش کامل مراجع