Core Concepts
グラフデータの構造的バイアスを軽減し、公平性と性能のバランスを取るための新しいフレームワークを提案する。教師付きコントラスト損失と環境損失を導入し、コンテンツ情報と環境情報の分離を促進する。
Abstract
本研究では、グラフニューラルネットワーク(GNN)における公平性の確保に取り組んでいる。GNNは構造情報を効果的に捉えられるが、ノード属性や接続関係にバイアスが含まれている可能性がある。そのため、公平性を確保することが重要な課題となっている。
まず、先行研究のCAFモデルを拡張し、教師付きコントラスト損失と環境損失を導入した新しいフレームワークSCCAFを提案している。教師付きコントラスト損失は、ラベルが同じノードの表現を近づけ、ラベルが異なるノードの表現を離す。一方、環境損失は、敏感属性が異なるノードの環境情報の表現を離す。これにより、コンテンツ情報と環境情報の分離が促進され、公平性と性能のバランスが取れるようになる。
実験では、German Credit、Bail、Credit Defaulterの3つの実データセットを用いて評価を行っている。提案手法SCCAFは、既存手法に比べて公平性と性能の両方を向上させることができることが示された。特に、CAFと比べて公平性指標(統計的格差、機会の均等)が大幅に改善されつつ、分類精度も向上している。
以上より、本研究は公平性と性能のバランスを取るための新しい手法を提案し、その有効性を実証したものと言える。GNNにおける公平性確保の重要性を踏まえ、今後の発展が期待される。
Stats
公平性指標の統計的格差(∆SP)は、CAFの3.93から2.4に改善された。
公平性指標の機会の均等(∆EO)は、CAFの3.73から1.1に改善された。
ドイツ信用データセットの分類精度(AUC)は、CAFの59.76から66.07に向上した。
ドイツ信用データセットの分類精度(F1)は、CAFの81.38から82.38に向上した。