แนวคิดหลัก
顧客行動パターンを捉えた包括的なデータセットの開発により、より高度な不正検知モデルの研究と評価を可能にする。
บทคัดย่อ
本研究では、顧客レベルの不正活動検知のための新しいベンチマークデータセット(CFDB)を開発しました。従来のトランザクションレベルのデータセットでは顧客行動の文脈が捉えられないという課題に対し、CFDBは顧客プロファイルを中心としたデータを提供します。
CFDBには以下の特徴があります:
- SAML-D、AML-World-HI-Small、AML-World-LI-Smallの3つのデータセットを統合し、顧客ごとの取引履歴や異常行動を集約
- 顧客ごとの取引件数、金額、不正フラグなどの詳細な属性を含む
- 機械学習モデルの性能評価に必要な精度、再現率、F1スコアなどの指標を提供
実験の結果、XGBoostが最も優れた性能を示しましたが、データの特性によってはモデルの精度に大きな差が見られました。これは不正検知の難しさを示しており、ハイブリッドモデルの活用や、データの偏りへの対策など、今後の研究課題が明らかになりました。
本研究成果は、不正検知分野における機械学習モデルの開発と評価を大きく前進させるものと期待されます。
สถิติ
顧客数は SAML-D が 855,460人、AML-World-HI-Small が 705,907人、AML-World-LI-Small が 515,088人
不正フラグ付きの顧客の割合は、SAML-Dが0.92%、AML-World-HI-Smallが0.751%、AML-World-LI-Smallが1.23%
1人あたりの平均取引件数は、SAML-Dが11.11件、AML-World-HI-Smallが9.80件、AML-World-LI-Smallが9.85件
1人あたりの平均取引金額は、SAML-Dが8,762円、AML-World-HI-Smallが5,500,051円、AML-World-LI-Smallが5,248,999円