تحلیل عملکرد الگوریتمهای انتخاب ویژگی در مدلهای یادگیری جمعی بهمنظور کشف تقلب در داده های مالی

سجاد علیزاده فرد

تحلیل عملکرد الگوریتمهای انتخاب ویژگی در مدلهای یادگیری جمعی بهمنظور کشف تقلب در داده های مالی

Publish place: the seventh International Conference on Information Technology Engineering , Computer Sciences and Telecommunication of Iran

Publish Year: 1402

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 9 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/1939793

شناسه ملی سند علمی:

ICTBC07_015

تاریخ نمایه سازی: 26 اسفند 1402

Abstract:

امروزه تقلب در داده های مالی به یک نگرانی جدی در سطح جهانی تبدیل شدهاست. کشف به هنگام تقلب میتواند از وقوع تقلبات بیشتر و خسارات مالی جلوگیری کند. مرحله انتخاب ویژگیها، مهمترین مرحله در مسائل دادهکاوی برای کاهش ویژگیهای نامربوط از مجموعه داده اصلی است که میتواند » سرعت ردهبندها« را به دلیل کاهش اندازه مجموعه ویژگیها و »عملکرد مدلها« را به دلیل جلوگیری از بیشبرازش بهبود بخشد. ما در این مقاله به تحلیل عملکرد الگوریتمهای انتخاب ویژگی از ۴ دسته »آماری «، » مدلمحور «، »مبتنی بر درخت« و »تفسیرپذیری« بر روی مدلهای یادگیری جمعی میپردازیم و عملکرد آنها را بر روی ترکیبات مختلف از مدلهای منتخب در کارهای پیشین مورد ارزیابی قرار میدهیم. نتایج تجربی نشان میدهد الگوریتم تفسیرپذیری SHAP براساس معیارهای Precision و AUC-PR و الگوریتم درختی XGBoost براساس معیارهای F۱ و Recall بهترین عملکرد را در بین سایر الگوریتمها داشته و مجموعه ویژگیهای بهتری ارائه مینماید.

Keywords:

انتخاب ویژگی , یادگیری ماشین , تفسیرپذیری , یادگیری جمعی , داده کاوی

Authors

سجاد علیزاده فرد

کارشناسی ارشد مهندسی کامپیوتر، دانشگاه علم و صنعت ایران، تهران