یافتن مشاهدات ناهنجار استوار بر اساس الگوریتم داده کاوی جنگل تصادفی در تشخیص تقلبکارت های اعتباری

Publish Year: 1395
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 618

This Paper With 9 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CCCI09_057

تاریخ نمایه سازی: 29 مهر 1396

Abstract:

در این پژوهش، روشی برای تشخیص مشاهدات ناهنجار استوار در تشخیص تقلب کارت های اعتباری ارایه شده است. به طور کلی تشخیص تقلب، یک مسیله طبقه بندی با نظارت است که در آن تراکنش های کارت های اعتباری، به دو کلاس قانونی و کلاهبردارانه طبقه بندی میشوند. این پژوهش به دنبال آن است که بتواند مشاهدات ناهنجاری که توسط الگوریتم های مختلف داده کاوی به عنوان مشاهدات کلاهبردانه تشخیص داده شده است را پیدا کند. تشخیص مشاهدات ناهنجار استوار در این پژوهش سه مرحله دارد: ابتدا با توجه به اینکه در مجموعه دادهی در دسترس، نقاط پرت به صورت برچسب مشخص نشده اند، با استفاده از روش جنگل تصادفی، امتیازهای پرت بودن هر مشاهده محاسبه می شود. هر چه این امتیاز بیشتر باشد، احتمال اینکه آن مشاهده، یک مشاهدهی ناهنجار باشد، بیشتر میشود. سپس در سه سناریوی مختلف مشاهداتی که 15%، 20%، 25% بیشترین امتیازها را دارند، به عنوان برچسب کلاهبردارانه (مثبت) و سایر مشاهدات به عنوان مشاهدات قانونی طبقه بندی میشوند. آنگاه در هر سناریو، دو مدل دسته بندی میزان شده ی درخت تصمیم گیری Bagging و رگرسیون لوژستیک، جهت تشخیص نقاط پرت روی مجموعه داده ها برازش داده میشوند. سپس نتایج آنها با هم مقایسه می شوند و در نهایت مشاهداتی که در هر دو الگوریتم فوق، به عنوان مشاهدات پرت پیش بینی شده اند، به عنوان مشاهدات پرت استوار (یا با اطمینان بالا) در نظر گرفته می شوند

Authors

سید مژان احمدیان

دانشجوی کارشناسی ارشد موسسه آموزش عالی شهاب دانش، قم

سید امیر اصغری توچایی

استادیار دانشکده مهندسی برق و کامپیوتر دانشگاه خوارزمی، تهران، ایران

قربان خردمندیان

دکتری مهندسی کامپیوتر دانشکده مهندسی کامپیوتر و فناوری اطلاعات دانشگاه صنعتی امیرکبیر