이 연구는 고객 수준의 사기 탐지 벤치마크(CFDB)를 개발하여 제공한다. CFDB는 기존의 거래 수준 데이터셋의 한계를 극복하고 고객 행동 패턴을 포괄적으로 반영한다.
CFDB는 SAML-D, AML-World-HI-Small, AML-World-LI-Small 데이터셋을 활용하여 구축되었다. 이 데이터셋들의 거래 수준 정보를 고객 프로파일로 변환하여 고객 단위의 특성을 반영하였다.
CFDB를 활용한 실험에서는 다양한 기계 학습 모델의 성능을 평가하였다. 선형 회귀, 의사결정 트리, XGBoost, 신경망 등의 모델을 비교한 결과, XGBoost가 가장 우수한 성능을 보였다. 이는 복잡한 금융 거래 패턴을 효과적으로 포착할 수 있는 앙상블 모델의 장점을 보여준다.
실험 결과는 정확도 외에도 정밀도, 재현율, AUC, F1 점수 등 다양한 지표를 통해 분석되었다. 이는 불균형 데이터셋에서 정확도만으로는 모델의 성능을 정확히 평가할 수 없음을 보여준다.
CFDB는 연구 커뮤니티에 공개되어 사기 탐지 기술 발전에 기여할 것으로 기대된다. 향후 연구에서는 데이터 불균형 문제 해결, 하이브리드 모델 개발 등을 통해 사기 탐지 성능을 지속적으로 향상시킬 필요가 있다.
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Phoebe Jing,... ב- arxiv.org 04-24-2024
https://arxiv.org/pdf/2404.14746.pdfשאלות מעמיקות