核心概念
提出DuoGNN,一種利用圖拓撲特性有效捕捉短程和長程節點依賴的可擴展和通用架構。
摘要
本文提出了DuoGNN,這是一種新穎的圖神經網絡模型,利用拓撲度量來有效捕捉任何圖拓撲下的短程和長程節點依賴。
DuoGNN包含三個主要貢獻:
- 一種拓撲邊緣過濾算法,可提取同質性交互並使模型能夠很好地推廣到任何圖拓撲。
- 一種異質性圖凝聚技術,可提取異質性交互並確保可擴展性。
- 一種雙同質性和異質性聚合管道,可防止在消息傳遞過程中出現過度平滑和過度壓縮。
DuoGNN首先將輸入圖分解為同質性和異質性子圖,然後並行地對它們進行處理。這種方法可以有效地捕捉短程和長程節點依賴,並避免過度平滑和過度壓縮的問題。
在醫療和非醫療數據集上的基準測試結果表明,DuoGNN在各種任務中都能取得一致的性能改善,並且在處理大規模圖方面具有良好的可擴展性。
统计
圖神經網絡模型在處理圖結構數據時,其局部鄰域聚合範式可能會在特定圖密度和結構上失效。
過度平滑和過度壓縮是導致這一問題的根本原因,會限制模型的表達能力並阻礙使用更深的模型捕捉圖中的長程節點依賴。
現有的解決方案要么計算複雜度過高而無法處理大圖,要么無法推廣到所有圖拓撲。
引用
"過度平滑是指隨著層數的增加,屬於不同類別的節點的特徵表示變得無法區分,這削弱了深度圖神經網絡的表達能力,限制了其適用性。"
"過度壓縮是指節點感受野的指數級增長,導致大量信息崩塌到固定大小的特徵向量中。"
"為了捕捉長程依賴,我們必須設計一種更精細的聚合協議,利用圖拓撲。"