ارایه روش جدید برای استخراج داده های نامتعادل در بانکداری با استفاده از الگوریتم ترکیبی kRNN – Boost
Publish Year: 1396
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 480
This Paper With 8 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
PECCON01_053
تاریخ نمایه سازی: 24 شهریور 1397
Abstract:
افزایش روزافزون حجم اطلاعات باعث به وجود آمدن داده های متعادل و نامتعادل در بانک های اطلاعاتی شده است که برای دسته بندی مسایل دودویی، یکی از چالش ها وجود داده های نامتعادل می باشد که در مجموعه داده ها ممکن است دسته هایی با حجم اکثریت و اقلیت به وجود آید و مسلما اگر نمونه برداری روی این مسایل صورت گیرد، نمونه ها با حجم داده اکثریت، اغلب نمونه های با حجم داده اقلیت را تحت تاثیر قرار می دهند. برای روبرو شدن با این چالش و متعادل نمودن مجموعه داده ها در این پژوهش از الگوریتم kRNN و Boost استفاده خواهد شد تا از یک روش ترکیبی جدید برای استخراج مجموعه داده های نامتعادل در صنعت بانکداری استفاده شود. روند کار پژوهش به این صورت است که برای ارزیابی ایده به حالت کلاسیک ، 20 درصد داده ها از طریق روش نمونه گیری تصادفی انتخاب و برای بررسی عملکرد روش پیشنهادی کنار گذاشته خواهد شد و از میان 80 درصد داده های باقیمانده چون مجموعه های داده های مورد استفاده در حوزه بانکداری نامتعادل اند و دارای نمونه با برچسب های بسیار زیاد و بسیار کم می باشند و هدف متعادل نمودن داده ها است در نتیجه نمونه های با حجم اقلیت و اکثریت از هم جدا خواهند شد.
Authors
بهنام محمدی
دانشکده مهندسی کامپیوتر، دانشگاه آزاد اسلامی استان زنجان زنجان، ایران
مهدی افضلی
دانشکده مهندسی کامپیوتر، دانشگاه آزاد اسلامی استان زنجان زنجان، ایران