رویکردی مبتنی بر خوشه بندی برای طبقه بندی داده های نامتوازن دو کلاسی با استفاده از مفهوم عدم قطعیت
Publish Year: 1394
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 889
This Paper With 14 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ITCC01_245
تاریخ نمایه سازی: 9 فروردین 1395
Abstract:
در طبقه بندی، مساله داده های نامتوازن زمانی که مجموعه داده دارای توزیع نابرابر کلاس باشد رخ می دهد. اغلبالگوریتم های طبقه بندی، فرض می کنند که توزیع کلاس ها یکسان است و در صورتی که توزیع کلاس ها نامتوازن باشد،این الگوریتم ها در تشخیص خود دچار مشکل می شوند. در این مقاله، روشی جدید مبتنی بر خوشه بندی ارائه شده است.داده های نامتوازن توسط یک الگوریتم خوشه بندی می شوند، سپس نسبت فراوانی نمونه های اقلیت به نمونه های اکثریتدر هر خوشه محاسبه می گردد. عدد مربوط به هر خوشه برای داده های همان خوشه به عنوان یک ویژگی جدید در نظرگرفته می شود. در مرحله بعد داده ها توسط الگوریتم های استاندارد طبقه بندی با برچسب جدید، طبقه بندی خواهند شد. بااستفاده از ویژگی جدید علاوه بر تعیین دقیق برچسب کلاس یک نمونه، میزان احتمال تعلق به کلاس دیگر نیز بیانمی شود. تست روش بر روی 17 مجموعه داده از پایگاه KEEL انجام شده و سپس با نتایج دو مقاله معتبر مقایسهمی گردد. نتایج نشان می دهد که کارایی طبقه بندی توسط روش پیشنهادی بهبود یافته است.
Authors
ملیحه وضیع
دانشجوی کارشناسی ارشد نرم افزار دانشگاه آزاد اسلامی بیرجند
مصطفی سبزه کار
استاد مدعو دانشگاه آزاد اسلامی بیرجند
حامد وحدت نژاد
عضو هیئت علمی دانشگاه بیرجند
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :