بهبود دقت رده بندهای تشخیص تقلب روی مجموعه داده نامتوازن بیمه با استفاده از نمونه برداری ترکیبی

Publish Year: 1396
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 646

This Paper With 11 Page And PDF and WORD Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

BICO01_003

تاریخ نمایه سازی: 29 فروردین 1397

Abstract:

در سال های اخیر با افزایش حجم اطلاعات، استفاده از سیستم های هوشمند مانند داده کاوی جهت یافتن الگوهای پنهان تقلب در حجم وسیعی از داده ها، بیش ازپیش مورد توجه قرارگرفته است. از طرفی در بیشتر پرونده های خسارت بیمه، موارد تقلب درصد کمتری نسبت به موارد قانونی دارند؛ و پایگاه داده مدل های کشف تقلب مانند این پژوهش، نامتوازن است. ازاین رو در این تحقیق هدف، ساخت یک سیستم کشف تقلب روی مجموعه داده به شدت نامتوازن بیمه خودرو و افزایش نرخ دقت درست کلاس اقلیت (تقلب) است که اهمیت بیشتری دارد.در روش پیشنهادی فوق به دلیل بالابودن نرخ پرتی کلاس اکثریت، از دو تکنیک کانزدیکترین همسایه و عامل پرت محلی جهت توازن و حذف داده پرت استفاده شد؛ و در ادامه جهت کاهش ابعاد، روش آماری تحلیل مولفه های اصلی مورد استفاده قرار گرفت. سپس داده ها با رده بندهای مختلف مدلسازی شد؛ و در مقایسه، رده بند ماشین بردار پشتیبان که از ازدحام ذرات جهت بهینه سازی پارامترها استفاده می کند، با دقت 94.26% بهبود خوبی در معیار دقت کلاس مثبت داشت. این تحقیق لزوم استفاده از روش های موثر کاهش ابعاد در میان متغیرهای نامتوازن این مجموعه داده را به اثبات رساند. هم چنین تنظیم پارامترهای بردار پشتیبان با ازدحام ذرات، تاثیر بسزایی درافزایش دقت رده بندی داشت.

Keywords:

تشخیص تقلب در بیمه , داده نامتوازن , تشخیص داده پرت , ماشین بردار پشتیبان ازدحام ذرات , تحلیل مولفه های اصلی

Authors

میناسادات ربطی

کارشناس ارشد مهندسی کامپیوتر نرم افزار