本文提出了一個名為TANGO的新型圖強化學習框架,用於解決6G網路中的無線電資源分配問題。TANGO框架包括以下關鍵組件:
圖神經網路(GNN)強化學習代理:將網路狀態轉換為圖形表示,並使用GNN架構直接在圖形數據上學習最佳的無線電資源分配策略。這種方法可以更好地捕捉網路中的關係動態。
貝葉斯GNN解釋器:使用變分貝葉斯推理方法,量化每個節點和邊的重要性以及不確定性,以提高決策過程的可解釋性。
推理器:根據從解釋器獲得的節點和邊重要性以及不確定性,應用預定義的符號規則來調整獎勵函數,引導代理朝著更可靠和可解釋的行為發展。
實驗結果表明,與標準GRL基線和其他基準相比,TANGO框架在無線電資源分配方面實現了顯著的性能提升,達到96.39%的最佳分配精度。此外,TANGO還大幅加快了收斂速度,展現了在複雜6G環境中的優越表現。
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania