تحلیل عملکرد الگوریتمهای انتخاب ویژگی در مدلهای یادگیری جمعی بهمنظور کشف تقلب در داده های مالی
Publish place: the seventh International Conference on Information Technology Engineering , Computer Sciences and Telecommunication of Iran
Publish Year: 1402
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 78
This Paper With 9 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICTBC07_015
تاریخ نمایه سازی: 26 اسفند 1402
Abstract:
امروزه تقلب در داده های مالی به یک نگرانی جدی در سطح جهانی تبدیل شدهاست. کشف به هنگام تقلب میتواند از وقوع تقلبات بیشتر و خسارات مالی جلوگیری کند. مرحله انتخاب ویژگیها، مهمترین مرحله در مسائل دادهکاوی برای کاهش ویژگیهای نامربوط از مجموعه داده اصلی است که میتواند » سرعت ردهبندها« را به دلیل کاهش اندازه مجموعه ویژگیها و »عملکرد مدلها« را به دلیل جلوگیری از بیشبرازش بهبود بخشد. ما در این مقاله به تحلیل عملکرد الگوریتمهای انتخاب ویژگی از ۴ دسته »آماری «، » مدلمحور «، »مبتنی بر درخت« و »تفسیرپذیری« بر روی مدلهای یادگیری جمعی میپردازیم و عملکرد آنها را بر روی ترکیبات مختلف از مدلهای منتخب در کارهای پیشین مورد ارزیابی قرار میدهیم. نتایج تجربی نشان میدهد الگوریتم تفسیرپذیری SHAP براساس معیارهای Precision و AUC-PR و الگوریتم درختی XGBoost براساس معیارهای F۱ و Recall بهترین عملکرد را در بین سایر الگوریتمها داشته و مجموعه ویژگیهای بهتری ارائه مینماید.
Keywords:
Authors
سجاد علیزاده فرد
کارشناسی ارشد مهندسی کامپیوتر، دانشگاه علم و صنعت ایران، تهران