بهبود دقت رده بندهای تشخیص تقلب روی مجموعه داده نامتوازن بیمه با استفاده از نمونه برداری ترکیبی
Publish place: The National Conference on Business Intelligence Karbrdsazy
Publish Year: 1396
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 646
This Paper With 11 Page And PDF and WORD Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
BICO01_003
تاریخ نمایه سازی: 29 فروردین 1397
Abstract:
در سال های اخیر با افزایش حجم اطلاعات، استفاده از سیستم های هوشمند مانند داده کاوی جهت یافتن الگوهای پنهان تقلب در حجم وسیعی از داده ها، بیش ازپیش مورد توجه قرارگرفته است. از طرفی در بیشتر پرونده های خسارت بیمه، موارد تقلب درصد کمتری نسبت به موارد قانونی دارند؛ و پایگاه داده مدل های کشف تقلب مانند این پژوهش، نامتوازن است. ازاین رو در این تحقیق هدف، ساخت یک سیستم کشف تقلب روی مجموعه داده به شدت نامتوازن بیمه خودرو و افزایش نرخ دقت درست کلاس اقلیت (تقلب) است که اهمیت بیشتری دارد.در روش پیشنهادی فوق به دلیل بالابودن نرخ پرتی کلاس اکثریت، از دو تکنیک کانزدیکترین همسایه و عامل پرت محلی جهت توازن و حذف داده پرت استفاده شد؛ و در ادامه جهت کاهش ابعاد، روش آماری تحلیل مولفه های اصلی مورد استفاده قرار گرفت. سپس داده ها با رده بندهای مختلف مدلسازی شد؛ و در مقایسه، رده بند ماشین بردار پشتیبان که از ازدحام ذرات جهت بهینه سازی پارامترها استفاده می کند، با دقت 94.26% بهبود خوبی در معیار دقت کلاس مثبت داشت. این تحقیق لزوم استفاده از روش های موثر کاهش ابعاد در میان متغیرهای نامتوازن این مجموعه داده را به اثبات رساند. هم چنین تنظیم پارامترهای بردار پشتیبان با ازدحام ذرات، تاثیر بسزایی درافزایش دقت رده بندی داشت.
Keywords:
تشخیص تقلب در بیمه , داده نامتوازن , تشخیص داده پرت , ماشین بردار پشتیبان ازدحام ذرات , تحلیل مولفه های اصلی
Authors
میناسادات ربطی
کارشناس ارشد مهندسی کامپیوتر نرم افزار