本文提出了一種基於多智能體強化學習的方法,能夠有效地利用同質性和結構異質性來進行去中心化的圖形路徑搜索。實驗結果表明,該方法在合成和真實世界社交網絡圖上顯著優於基準模型。此外,本文還發現,使用獎勵驅動的學習可以構建出有意義的嵌入式表示,用於圖形導航。