核心概念
本研究は、サブグラフネットワーク(SGN)を活用した新しい対照学習フレームワーク(SGNCL)を提案する。SGNCLは、オリジナルグラフとその異なる次数のSGNの相互作用情報を効果的にキャプチャすることで、グラフ表現学習の性能を向上させる。
要約
本研究は、グラフ対照学習(GCL)の分野に新しいアプローチを提案している。従来のGCLは、グラフの局所的な構造の類似性を活用したデータ拡張手法に焦点を当ててきた。一方、本研究では、サブグラフネットワーク(SGN)を活用することで、グラフ内部の高次の相互作用情報を効果的にキャプチャすることができる。
具体的には、以下の3つの主要な貢献がある:
SGNをGCLに導入し、SGNCLと呼ばれる新しいフレームワークを提案した。SGNCLは、オリジナルグラフとその異なる次数のSGNの相互作用情報を効果的にキャプチャできる。
エッジ-ノード変換に基づくグラフ拡張手法を提案し、第1次および第2次のSGNを生成する。これにより、ノード-ノード、ノード-エッジ、エッジ-エッジの相互作用情報を効果的に抽出できる。
第1次および第2次のSGNを融合した新しい対照学習目的関数を提案した。これにより、多様な次数のサブグラフ情報を同時に学習できる。
実験結果は、提案手法がさまざまなベンチマークデータセットにおいて、教師なし学習および転移学習の両方で優れた性能を発揮することを示している。特に、転移学習タスクでは、最大6.9%の平均性能向上を達成した。これらの結果は、サブグラフ間の相互作用情報を効果的にキャプチャすることの重要性を示唆している。
統計
分子グラフにおいて、ノードの属性は原子の種類と原子の不斉性を表し、エッジの属性は結合の種類と結合の方向を表す。
ノード属性は「原子の種類の組み合わせ」として更新され、エッジ属性は「結合-中心原子-結合」の組み合わせとして更新される。