本文探討了在圖神經網路 (GNN) 中使用唯一節點識別碼 (UID) 來增強其表達能力。傳統 GNN 受限於訊息傳遞機制,難以區分結構相似的節點,導致其表達能力僅限於 1-WL 測試。為了解決這個問題,研究人員引入了 UIDs 作為額外的節點特徵,使 GNN 能夠區分結構上相同的節點,從而克服 1-WL 測試的限制。
然而,使用 UIDs 也帶來了新的挑戰。由於 UIDs 的隨機性,GNN 容易過度擬合這些識別碼,導致泛化能力下降。為了解決這個問題,本文提出了一種名為 SIRI 的方法,通過對比損失函數來學習 UIDs 的不變性。
SIRI 的核心思想是在網路的最後一層強制執行不變性,同時允許中間層利用 UIDs 的表達能力。具體來說,SIRI 會生成兩個具有不同隨機 UIDs 的輸入圖,並將它們傳播到 GNN 的倒數第二層。然後,SIRI 計算這兩個表示之間的均方誤差,並將其作為對比損失函數。通過最小化對比損失函數,SIRI 可以促使 GNN 學習對 UIDs 不變的表示,從而提高泛化能力。
實驗結果表明,SIRI 在多個合成基準測試中均優於現有方法。SIRI 不僅顯著提高了 GNN 的泛化和外推能力,還加快了模型的收斂速度。這些結果表明 SIRI 是一種有效的技術,可以通過利用 UIDs 來增強 GNN 的表達能力,使其成為任何 GNN 的寶貴工具。
翻譯成其他語言
從原文內容
arxiv.org
深入探究