Core Concepts
本論文は、異種時系列MMMAグラフを活用したクラウドソーシングフラウド検出手法CMTを提案する。CMTは、グラフの異質性と動的性質を捉え、自己教師あり学習によって高品質な表現を生成し、クラウドソーシングフラウドを効果的に検出する。
Abstract
本論文は、クラウドソーシングフラウド検出のための新しい手法CMTを提案している。
まず、MMMAデータをモデル化した異種時系列グラフ(HTG)を定義する。HTGは、ユーザー、グループ、デバイスの3種類のノードと7種類の関係を表現する。
次に、CMTの2つの主要な構成要素を説明する。
異種グラフエンコーダ(HG-Encoder): HTGの異質性をモデル化するためのGNNベースのエンコーダ。関係ごとの集約と注意機構を用いて、ユーザーの多角的な表現を生成する。
時系列ビュー学習: ユーザーの時系列行動パターンを2つの異なるビュー(時系列スナップショットシーケンス、ユーザー関係シーケンス)でモデル化する。データ拡張とコントラスティブ学習を用いて、自己教師あり学習によりこれらのビューを効果的にエンコーディングする。
最後に、HG-Encoderとビュー学習の出力を統合し、ユーザーの異常スコアを推定する。
実験では、WeChat及びFinGraphデータセットにおいて、CMTが他の手法を大きく上回る性能を示した。これは、CMTがグラフの異質性と動的性質を効果的にモデル化し、自己教師あり学習によって高品質な表現を獲得できたことを示している。
Stats
異種時系列MMMAグラフには約680万人のユーザー、15.1万のグループ、12.6万のデバイスが含まれ、約2970万の関係が記録されている。
WeChat データセットには53,660人のラベル付きユーザーが含まれ、そのうち10,749人がフラウドユーザー、42,911人が正常ユーザーである。
FinGraphデータセットには約410万人のユーザーと500万の関係が含まれ、82,000人がラベル付きで、そのうち1,000人がフラウドユーザー、81,000人が正常ユーザーである。
Quotes
"MMMAsはクリックファームビジネスの台頭によって、クラウドソーシングフラウドの温床となっている。"
"クラウドソーシングフラウドの検出には、ユーザーの多様な行動パターンと時間的な特徴を十分に活用する必要がある。"
"CMTは、グラフの異質性と動的性質をモデル化し、自己教師あり学習によって高品質な表現を生成することで、クラウドソーシングフラウドを効果的に検出できる。"