امروزه تجارت الکترونیک و پرداخت های الکترونیکی به گونه ای چشم گیر در میان افراد جامعه محبوبیت یافته است. با توجه به فراگیری اینترنت و سیستم های دریافت و پرداخت روز به روز به این محبوبیت افزوده میشود، اما در پس هر تکنولوژی مشکلاتی نیز بوجود می آید که تقلب را مهمترین مشکل این تکنولوژی می توان نام برد که نیازمند برخورد سریع و دقیق است.امروزه با توجه به گسترش روز افزون اطلاعات بهره گیری از روشهایی همچون
داده کاوی برای استخراج دانش و اطلاعات نهفته در داده ها، امر ی غیرقابل اجتناب میباشد. بنابراین شناخت، شناسایی و ساخت الگویی برای تراکنش های هر شخص با توجه به سابقه تراکنش او و پیشبینی وضعیت تراکنش فعلی برای اجازه به ادامه تراکنش یا کسب تایید صحت از صاحب حساب و به روز رسانی الگو به جهت بهبود و کنترل بهتر تراکنش ها در آینده می تواند راه کار مناسبی به کمک علم
داده کاوی -
یادگیری ماشین و کالن داده باشد. موضوع اصلی موجود در این تحقیق، مشکل، نبودن داده های کافی تراکنش های مشتریان بانکها می باشد.سرعت شناسایی تقلب و برخط بودن آن یکی از عوامل مهم در پیشگیری بوده که در این تحقیق سعی کردیم با استفاده از یافتن ارتباط و نزدیکی داده ها، با استفاده از تکنیکهای پیش پردازش داده K-Means و سپس با استفاده از الگوریتم جنگل تصادفی و به کمک ابزارهای برخط پردازش داده به سرعت نسبتا بیشتری در کشف و تشخیص تقلب دست یابیم. در این پژوهش ما توانستیم سرعت را در بازه ۱.۰۴ درصد تا دوازده درصد افزایشدهیم این در حالی است که دقت تنها در بازه ۱.۱۷ تا ۲.۴۳ درصد کاهش یافته است.