یافتن مشاهدات ناهنجار استوار بر اساس الگوریتم داده کاوی جنگل تصادفی در تشخیص تقلبکارت های اعتباری

سید مژان احمدیان; سید امیر اصغری توچایی; قربان خردمندیان

یافتن مشاهدات ناهنجار استوار بر اساس الگوریتم داده کاوی جنگل تصادفی در تشخیص تقلبکارت های اعتباری

Publish place: 9th The National Conference of Command, Control, Communication and Computers & Intelligence (C4I)

Publish Year: 1395

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 9 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > داده کاوی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/661395

شناسه ملی سند علمی:

CCCI09_057

تاریخ نمایه سازی: 29 مهر 1396

Abstract:

در این پژوهش، روشی برای تشخیص مشاهدات ناهنجار استوار در تشخیص تقلب کارت های اعتباری ارایه شده است. به طور کلی تشخیص تقلب، یک مسیله طبقه بندی با نظارت است که در آن تراکنش های کارت های اعتباری، به دو کلاس قانونی و کلاهبردارانه طبقه بندی میشوند. این پژوهش به دنبال آن است که بتواند مشاهدات ناهنجاری که توسط الگوریتم های مختلف داده کاوی به عنوان مشاهدات کلاهبردانه تشخیص داده شده است را پیدا کند. تشخیص مشاهدات ناهنجار استوار در این پژوهش سه مرحله دارد: ابتدا با توجه به اینکه در مجموعه دادهی در دسترس، نقاط پرت به صورت برچسب مشخص نشده اند، با استفاده از روش جنگل تصادفی، امتیازهای پرت بودن هر مشاهده محاسبه می شود. هر چه این امتیاز بیشتر باشد، احتمال اینکه آن مشاهده، یک مشاهدهی ناهنجار باشد، بیشتر میشود. سپس در سه سناریوی مختلف مشاهداتی که 15%، 20%، 25% بیشترین امتیازها را دارند، به عنوان برچسب کلاهبردارانه (مثبت) و سایر مشاهدات به عنوان مشاهدات قانونی طبقه بندی میشوند. آنگاه در هر سناریو، دو مدل دسته بندی میزان شده ی درخت تصمیم گیری Bagging و رگرسیون لوژستیک، جهت تشخیص نقاط پرت روی مجموعه داده ها برازش داده میشوند. سپس نتایج آنها با هم مقایسه می شوند و در نهایت مشاهداتی که در هر دو الگوریتم فوق، به عنوان مشاهدات پرت پیش بینی شده اند، به عنوان مشاهدات پرت استوار (یا با اطمینان بالا) در نظر گرفته می شوند

Keywords:

تشخیص تقلب , مشاهدات ناهنجار استوار , جنگل های تصادفی , کارت های اعتباری

Authors

سید مژان احمدیان

دانشجوی کارشناسی ارشد موسسه آموزش عالی شهاب دانش، قم

سید امیر اصغری توچایی

استادیار دانشکده مهندسی برق و کامپیوتر دانشگاه خوارزمی، تهران، ایران

قربان خردمندیان

دکتری مهندسی کامپیوتر دانشکده مهندسی کامپیوتر و فناوری اطلاعات دانشگاه صنعتی امیرکبیر