طبقه بندی داده های چند برچسبی نامتعادل مبتنی بر نمایش اسپارس و طبقه بند2pknn

Publish Year: 1396
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 620

This Paper With 7 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ELECONFK04_072

تاریخ نمایه سازی: 11 شهریور 1397

Abstract:

این پژوهش به طبقه بندی و تجزیه وتحلیل یادگیری غیرمتعادل در سناریوی چند برچسبی می پردازد. در پژوهش های قبل به وسیله حذف برچسب های گروه اکثریت و کپی برچسب های اقلیت سعی در ایجاد تعادل در برچسبها شده است که این روش ها باعث از دست دادن داده های صحیح و یا کپی داده میشود، این امکان وجود دارد که داده کپی شده دارای برچسب های اکثریت نیاز باشد که این امر باعث بالا رفتن تعداد برچسب های اکثریت نیز میشود.الگوریتم پیشنهادی جهت کاهش عدم تعادل در مجموعه داده های چندبرچسبی در یک روش مستقل طبقه بندی کننده، با استفاده از تکنیک های نمونه برداری مجدد می باشد. الگوریتمی که برای تقسیم بندی نمونه ها در دو گروه اقلیت و اکثریت مورد مطالعه قرار گرفته و به ارزیابی فردی سطح عدم تعادل در برچسبها می پردازد، الگوریتم نمونه برداری بزرگ تصادفی براساس نمایش اسپارس میباشد که به وسیله انتشار برچسب های اقلیت سعی در ایجاد تعادل در برچسب های هدف دارد ، و سپس جهت طبقه بندی از یک طبقه بندی کننده چند برچسبی استفاده شده است. براساس معیارهای ارزیابی الگوریتم طبقه بندی کننده چند برچسبی نامتعادل صحت طبقه بندی در داده ها را افزایش داده است ،در مجموعه داده bibtex معیار Micro-FMeasure میزان صحت 72,05 درصد را داشته است که از روشهای مشابه در مقالات دیگر بهتر می باشد و معیار Macro-FMeasure میزان صحت 65,64 گزارش شده است که این معیار نیز در مقایسه با سایر روشها دارای میزان دقت بیشتری میباشد.

Keywords:

داده های چند برچسبی-داده های نامتعادل- الگوریتم های نمونه برداری مجدد

Authors

سیدروح الله مرتضوی

دانشجو مقطع کارشناسی ارشد دانشگاه امام رضا(ع)

عادل قاضی خانی

استادیار و عضو هییت علمی دانشگاه امام رضا(ع)