طبقه بندی اجماع با توجه به گوناگونی برای یادگیری داده های نامتعادل
Publish place: سومین کنگره بین المللی کامپیوتر، برق و مخابرات
Publish Year: 1395
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 829
This Paper With 11 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ITCC03_011
تاریخ نمایه سازی: 6 اردیبهشت 1396
Abstract:
امروزه با توجه به گسترش روز افزون اطلاعاتی که بشر با آنها سر و کار دارد، بهره گیری از روشهایی همچون داده کاویبرای استخراج دانش و اطلاعات نهفته در دادهها، امری غیرقابل اجتناب می باشد. مساله دیگری که امروزه در بحث داده-کاوی وجود دارد، بحث دادههای نامتعادل است. داده های نامتعادل می توانند توسط خطای اندازه گیری ایجاد شوند یاممکن است نتیجه نوع داده ی درونی باشند. بنابراین روشهای زیادی مانند نمونه برداری، یادگیری حساس به هزینه،bagging و boosting مبتنی بر روشهای جمعی ارایه شده است ولی این روشها باعث حذف بعضی داده های مفید یاافزودن داده اضافی می شوند بنابراین بر آن شدیم که روشی جدید ارایه کنیم که بر مشکلات روشهای قبلی غلبه کند.در روش پیشنهادی ابتدا کلاس داده دودویی نامتعادل را به چندین کلاس داده دودویی متعادل تبدیل می کند. این کار رابا بکارگیری تقسیم تصادفی یا خوشه بندی نمونه های کلاس اکثریت انجام می دهد. بعد از آن یک الگوریتم طبقه بندیخاص بکار می رود تا چندین داده دودویی متعادل را به چندین طبقه بند تبدیل کند سرانجام نتایج طبقه بندی، این طبقهبند های دودویی را برای یک داده جدید با پنج قانون جمعی جدید شامل MaxDistance ، MinDistance ،ProDistance ، MajDistance و SumDistance ترکیب می کند سپس با توجه به گوناگونی روی طبقه بندجمعی رابطه بین داده جدید و داده قدیمی را شرح می دهد.نتایج آزمایشات روی 64 مجموعه داده نامتعادل نشان می دهد که روش ارایه شده قادر است مسایل کلاس دادهدودویینامتعادل را مدیریت کند و معمولا از روشهای مرسوم شامل روشهای مدیریت داده نامتعادل داخلی و خارجی موثرترعمل می کند.
Keywords:
Authors
مصطفی بصیرنژاد
دانشکده فنی و مهندسی، موسسه آموزش عالی خراسان
صادق کمالیان
دانشجوی مرکز آموزش علمی کاربردی مدیریت صنعتی خراسان رضوی
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :