CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

رویکردی مبتنی بر خوشه بندی برای طبقه بندی داده های نامتوازن دو کلاسی با استفاده از مفهوم عدم قطعیت

عنوان مقاله: رویکردی مبتنی بر خوشه بندی برای طبقه بندی داده های نامتوازن دو کلاسی با استفاده از مفهوم عدم قطعیت
شناسه ملی مقاله: ITCC01_245
منتشر شده در کنفرانس بین المللی پژوهش های کاربردی در فناوری اطلاعات، کامپیوتر ومخابرات در سال 1394
مشخصات نویسندگان مقاله:

ملیحه وضیع - دانشجوی کارشناسی ارشد نرم افزار دانشگاه آزاد اسلامی بیرجند
مصطفی سبزه کار - استاد مدعو دانشگاه آزاد اسلامی بیرجند
حامد وحدت نژاد - عضو هیئت علمی دانشگاه بیرجند

خلاصه مقاله:
در طبقه بندی، مساله داده های نامتوازن زمانی که مجموعه داده دارای توزیع نابرابر کلاس باشد رخ می دهد. اغلبالگوریتم های طبقه بندی، فرض می کنند که توزیع کلاس ها یکسان است و در صورتی که توزیع کلاس ها نامتوازن باشد،این الگوریتم ها در تشخیص خود دچار مشکل می شوند. در این مقاله، روشی جدید مبتنی بر خوشه بندی ارائه شده است.داده های نامتوازن توسط یک الگوریتم خوشه بندی می شوند، سپس نسبت فراوانی نمونه های اقلیت به نمونه های اکثریتدر هر خوشه محاسبه می گردد. عدد مربوط به هر خوشه برای داده های همان خوشه به عنوان یک ویژگی جدید در نظرگرفته می شود. در مرحله بعد داده ها توسط الگوریتم های استاندارد طبقه بندی با برچسب جدید، طبقه بندی خواهند شد. بااستفاده از ویژگی جدید علاوه بر تعیین دقیق برچسب کلاس یک نمونه، میزان احتمال تعلق به کلاس دیگر نیز بیانمی شود. تست روش بر روی 17 مجموعه داده از پایگاه KEEL انجام شده و سپس با نتایج دو مقاله معتبر مقایسهمی گردد. نتایج نشان می دهد که کارایی طبقه بندی توسط روش پیشنهادی بهبود یافته است.

کلمات کلیدی:
طبقه بندی، نامتوازن، خوشه بندی، عدم قطعیت

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/451033/