核心概念
ヘテロジニアス・グラフの複雑な構造をモデル化するためにハイパーボリック空間を活用し、メタパス情報を効果的に活用することで、ノード分類やクラスタリングの性能を向上させる。
要約
本研究では、ヘテロジニアス・グラフの表現学習のためのモデルHHGAT(Hyperbolic Heterogeneous Graph Attention Networks)を提案している。ヘテロジニアス・グラフは階層構造やべき乗則の構造を持つため、ユークリッド空間への埋め込みでは歪みが生じる。そこでHHGATはハイパーボリック空間にメタパス情報を埋め込むことで、この問題を解決する。
具体的には以下の手順で行う:
- メタパスインスタンスのサンプリング: ノードから始まるメタパスインスタンスを最大長さ内でサンプリングする。
- メタパス特有の埋め込み: メタパスインスタンスの特徴をユークリッド空間からハイパーボリック空間に写像し、注意機構を用いてアグリゲーションする。
- メタパス間の注意機構: 各メタパス特有の埋め込みベクトルに注意機構を適用し、最終的な埋め込みベクトルを得る。
提案手法HHGATは、ノード分類やクラスタリングの課題において、既存手法を上回る性能を示した。特に、ハイパーボリック空間への埋め込みとメタパス情報の活用が有効であることが確認された。また、ハイパーボリック空間の曲率パラメータの最適化も重要であることが分かった。
統計
ヘテロジニアス・グラフのノード数は4,661~20,000程度、リンク数は3,025~19,645程度である。
ノードの種類は3~4種類、クラス数は3~4クラスである。
ノード特徴量の次元数は334~1,902である。
引用
"ヘテロジニアス・グラフは階層構造やべき乗則の構造を持つため、ユークリッド空間への埋め込みでは歪みが生じる。"
"HHGATはハイパーボリック空間にメタパス情報を埋め込むことで、この問題を解決する。"