طبقه بندی داده های چند برچسبی نامتعادل مبتنی بر نمایش اسپارس و طبقه بند2pknn
عنوان مقاله: طبقه بندی داده های چند برچسبی نامتعادل مبتنی بر نمایش اسپارس و طبقه بند2pknn
شناسه ملی مقاله: ELECONFK04_072
منتشر شده در چهارمین کنفرانس ملی مهندسی برق و کامپیوتر سیستمهای توزیع شده و شبکه های هوشمند و نخستین کنفرانس ملی مهندسی پزشکی در سال 1396
شناسه ملی مقاله: ELECONFK04_072
منتشر شده در چهارمین کنفرانس ملی مهندسی برق و کامپیوتر سیستمهای توزیع شده و شبکه های هوشمند و نخستین کنفرانس ملی مهندسی پزشکی در سال 1396
مشخصات نویسندگان مقاله:
سیدروح الله مرتضوی - دانشجو مقطع کارشناسی ارشد دانشگاه امام رضا(ع)
عادل قاضی خانی - استادیار و عضو هییت علمی دانشگاه امام رضا(ع)
خلاصه مقاله:
سیدروح الله مرتضوی - دانشجو مقطع کارشناسی ارشد دانشگاه امام رضا(ع)
عادل قاضی خانی - استادیار و عضو هییت علمی دانشگاه امام رضا(ع)
این پژوهش به طبقه بندی و تجزیه وتحلیل یادگیری غیرمتعادل در سناریوی چند برچسبی می پردازد. در پژوهش های قبل به وسیله حذف برچسب های گروه اکثریت و کپی برچسب های اقلیت سعی در ایجاد تعادل در برچسبها شده است که این روش ها باعث از دست دادن داده های صحیح و یا کپی داده میشود، این امکان وجود دارد که داده کپی شده دارای برچسب های اکثریت نیاز باشد که این امر باعث بالا رفتن تعداد برچسب های اکثریت نیز میشود.الگوریتم پیشنهادی جهت کاهش عدم تعادل در مجموعه داده های چندبرچسبی در یک روش مستقل طبقه بندی کننده، با استفاده از تکنیک های نمونه برداری مجدد می باشد. الگوریتمی که برای تقسیم بندی نمونه ها در دو گروه اقلیت و اکثریت مورد مطالعه قرار گرفته و به ارزیابی فردی سطح عدم تعادل در برچسبها می پردازد، الگوریتم نمونه برداری بزرگ تصادفی براساس نمایش اسپارس میباشد که به وسیله انتشار برچسب های اقلیت سعی در ایجاد تعادل در برچسب های هدف دارد ، و سپس جهت طبقه بندی از یک طبقه بندی کننده چند برچسبی استفاده شده است. براساس معیارهای ارزیابی الگوریتم طبقه بندی کننده چند برچسبی نامتعادل صحت طبقه بندی در داده ها را افزایش داده است ،در مجموعه داده bibtex معیار Micro-FMeasure میزان صحت 72,05 درصد را داشته است که از روشهای مشابه در مقالات دیگر بهتر می باشد و معیار Macro-FMeasure میزان صحت 65,64 گزارش شده است که این معیار نیز در مقایسه با سایر روشها دارای میزان دقت بیشتری میباشد.
کلمات کلیدی: داده های چند برچسبی-داده های نامتعادل- الگوریتم های نمونه برداری مجدد
صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/768209/