ارایه روش جدید برای استخراج داده های نامتعادل در بانکداری با استفاده از الگوریتم ترکیبی kRNN – Boost

Publish Year: 1396
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 480

This Paper With 8 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

PECCON01_053

تاریخ نمایه سازی: 24 شهریور 1397

Abstract:

افزایش روزافزون حجم اطلاعات باعث به وجود آمدن داده های متعادل و نامتعادل در بانک های اطلاعاتی شده است که برای دسته بندی مسایل دودویی، یکی از چالش ها وجود داده های نامتعادل می باشد که در مجموعه داده ها ممکن است دسته هایی با حجم اکثریت و اقلیت به وجود آید و مسلما اگر نمونه برداری روی این مسایل صورت گیرد، نمونه ها با حجم داده اکثریت، اغلب نمونه های با حجم داده اقلیت را تحت تاثیر قرار می دهند. برای روبرو شدن با این چالش و متعادل نمودن مجموعه داده ها در این پژوهش از الگوریتم kRNN و Boost استفاده خواهد شد تا از یک روش ترکیبی جدید برای استخراج مجموعه داده های نامتعادل در صنعت بانکداری استفاده شود. روند کار پژوهش به این صورت است که برای ارزیابی ایده به حالت کلاسیک ، 20 درصد داده ها از طریق روش نمونه گیری تصادفی انتخاب و برای بررسی عملکرد روش پیشنهادی کنار گذاشته خواهد شد و از میان 80 درصد داده های باقیمانده چون مجموعه های داده های مورد استفاده در حوزه بانکداری نامتعادل اند و دارای نمونه با برچسب های بسیار زیاد و بسیار کم می باشند و هدف متعادل نمودن داده ها است در نتیجه نمونه های با حجم اقلیت و اکثریت از هم جدا خواهند شد.

Authors

بهنام محمدی

دانشکده مهندسی کامپیوتر، دانشگاه آزاد اسلامی استان زنجان زنجان، ایران

مهدی افضلی

دانشکده مهندسی کامپیوتر، دانشگاه آزاد اسلامی استان زنجان زنجان، ایران