核心概念
本稿では、グラフニューラルネットワーク(GNN)の埋め込み表現をダウンストリームの機械学習モデルで利用する場合の説明可能性という課題に取り組む、MBExplainerと呼ばれる新たな手法を提案する。
本稿は、グラフ構造データに対する機械学習予測タスクにおいて広く用いられるグラフニューラルネットワーク(GNN)の説明可能性に関する研究論文である。特に、GNNの学習済みグラフ埋め込み表現を、他の表形式特徴と組み合わせてダウンストリームの機械学習タスクに利用するアンサンブルモデルに焦点を当てている。
研究の背景と目的
GNNは強力な表現学習能力を持つ一方、そのブラックボックス的な性質から予測結果の解釈が困難となる。しかし、医療や金融サービスなどの意思決定に重要な応用分野では、予測結果の説明可能性は不可欠である。本研究は、GNNの埋め込み表現を利用したアンサンブルモデルの出力に対する人間にとって理解しやすい説明を生成することを目的とする。
MBExplainerの概要
MBExplainerは、拡張グラフ埋め込みを用いたダウンストリームモデルのためのモデルに依存しない説明手法である。本手法は、パイプライン全体のインスタンス予測に対する説明として、人間が理解しやすい3つの要素からなるトリプルを返す。
最も重要なサブグラフ
最も重要なノード特徴
最も重要な拡張ダウンストリーム特徴
各要素とその相互作用の寄与を考慮するために、ゲーム理論的定式化を用いて、それぞれのゲームに対応する3つのShapley値を割り当てる。
MBExplainerの特徴
多層探索アルゴリズム: 各要素に対応する局所探索空間の同時プルーニングを計算可能な方法で実現する、新しい多層探索アルゴリズムを採用している。具体的には、3つの相互に織り交ぜられたモンテカルロ木探索を利用して、局所探索空間を反復的にプルーニングする。
コンテキスト依存型バンディットアルゴリズム: 局所探索空間間でプルーニングの予算を効率的に割り当てるために、コンテキスト依存型バンディットアルゴリズムを用いたグローバル探索戦略を実装している。
実験と結果
本稿では、ノード分類とグラフ分類の両方のタスクについて、複数の公開グラフデータセットを用いた包括的な数値例を示すことで、MBExplainerの有効性を示している。具体的には、MUTAG、PROTEINS、Binarized ZINCデータセットを用いたグラフ分類タスクと、ogbn-arxivデータセットを用いたノード分類タスクの実験結果を報告している。
結論
MBExplainerは、GNNの埋め込み表現を利用したダウンストリームモデルの説明可能性という課題に対する効果的な解決策を提供する。本手法は、複雑なグラフ構造と表形式データを統合的に解釈することを可能にし、様々な応用分野におけるGNNのブラックボックス問題の解決に貢献するものである。