本文提出了一種基於變分自編碼器(VAE)的新方法,用於解決I-DID中遇到的數據驅動建模挑戰。
首先,作者介紹了I-DID模型,它是一種用於解決多智能體決策問題的有前景的框架。但是,當主體代理遇到其他代理未明確建模的未知行為時,I-DID會遇到局限性,導致主體代理的響應不佳。
為了解決這一問題,作者提出了一種新的數據驅動方法。該方法利用編碼-解碼架構,特別是變分自編碼器,來增強I-DID解決方案。通過將基於困惑度的樹損失函數集成到變分自編碼器的優化算法中,並利用Zig-Zag One-Hot編碼和解碼的優勢,作者生成了更可能包含其他代理真實行為的潛在行為。這種新方法使主體代理能夠更恰當地應對未知行為,從而提高其決策質量。
作者在兩個已建立的問題領域中實證地證明了所提出方法的有效性,突出了其在處理具有未知行為的多智能體決策問題中的潛力。這是首次在代理規劃和學習問題中使用基於神經網絡的方法來處理I-DID挑戰。
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문