本論文は、グラフニューラルネットワーク(GNN)を用いたノード分類における2つの主要な課題、すなわち高品質ラベルデータの不足と近傍情報の不足に取り組む新しい手法「IntraMix」を提案している。
まず、IntraMixは擬似ラベリングによって低品質ラベルデータを生成し、それらを同クラス内でMixupすることで高品質ラベルデータを効率的に生成する。これにより、ラベル不足の問題に対処する。
次に、生成したノードを同クラスの高信頼ノードに接続することで、適切な近傍を構築する。これにより、近傍不足の問題にも対処する。
理論的な分析により、IntraMixによって生成されたデータのラベル品質が向上し、適切な近傍が構築されることが示されている。
extensive実験の結果、IntraMixはさまざまなGNNモデルとデータセットにおいて優れた性能を発揮することが確認された。特に、準教師あり学習や帰納学習の設定においても、IntraMixの有効性が示された。
さらに、IntraMixは過剰平滑化の問題にも一定の対処能力を持つことが明らかになった。これは、生成ノードが同クラスのノードをランダムに接続することで、効果的な情報伝播を実現しているためと考えられる。
以上より、IntraMixは、ラベル不足と近傍不足という2つの課題を同時に解決する優れたグラフデータ拡張手法であると言える。
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies