روش جدیدی برای شناسایی کلاهبرداری در داده های بدون برچسب با هدف کاهش هشدارهای اشتباه abstract
در این مقاله یک روش جدید برای
شناسایی کلاهبرداری برای داده های مظنون به کلاهبرداری و تعیین درجه بدگمانی براساس پیوندهای مجازی بین آنها در طول زمان و مکان را معرفی می کنیم. در بیشتر روشهای ارائه شده قبلی روی مجموعه داده ها، فرض بر این است که داده ها دارای برچسب بوده و در هر زمانی برچسب های آنها در دسترس بوده و می تواند کاوش شوند. در
شناسایی کلاهبرداری اعتباری ، در آن واحد متقلب بودن یک تراکنش قابل تشخیص نیست و حداقل یک ماه زمان لازم است تا متقلب بودن تراکنش تشخیص داده شود. به این دلیل بیشتر برنامه های کاربردی موجود، برچسب های کلاس را فراهم می کنند و مدلهای موجود را به صورت مکرر و همزمان با ورود داده های جدید به روز رسانی می کنند در روش ارائه شده در این مقاله برای هر رکورد جدید وارد شونده به سیستم، یکی از انواع پیوندهای سفید، سیاه یا غیرعادی در برابر رکوردهای قبلی که در یک پنجره تعیین شده از قبل هستند ایجاد می شوند. نتایج روی مجموعه داده ها نشان داده که این روش نرخ هشدارهای اشتباه را کاهش می دهد در حالی که نرخ اعلامهای درست را در یک سطح قابل قبول نگه می دارد و می تواند به سرعت کلاهبرداری های موجود در هویت افراد را شناسایی کند. به علاوه بینش های جدید از ارتباطات بین داده ها نشان داده شده اند. همچنین ضعف های آن که از جمله مشکل مقیاس پذیری است استخراج می شود.