핵심 개념
提出一個多智能體自適應框架(MASA)結合深度強化學習,通過兩個協作的反應性智能體來平衡投資組合收益和風險,並集成一個靈活的市場觀察者智能體提供市場趨勢反饋,以快速適應不斷變化的市場環境。
초록
本文提出了一個名為MASA的多智能體自適應框架,用於解決在高度動盪的金融市場環境下投資組合管理的挑戰。
MASA框架包含三個協作的智能體:
- 基於TD3算法的強化學習(RL)智能體,專注於優化投資組合的整體收益。
- 基於求解器的智能體,利用市場觀察者提供的反饋調整RL智能體的投資組合,以最小化潛在風險。
- 市場觀察者智能體,提供估計的市場趨勢信息,供其他兩個智能體快速適應不斷變化的市場環境。
MASA框架採用了鬆散耦合和管道計算模型,使整個框架更加可靠和自適應。當市場觀察者智能體採用深度神經網絡時,MASA框架可擴展為多智能體深度強化學習方法。
實驗結果表明,MASA框架在CSI 300、道瓊斯工業平均指數和標準普爾500指數等具有挑戰性的數據集上,明顯優於其他眾所周知的強化學習方法,在平衡投資組合收益和風險方面表現出色。這為未來探索在其他領域如資源分配、規劃或災難恢復問題中應用MASA框架提供了啟示。
통계
在CSI 300指數上,MASA-MLP方法的年化收益率(AR)達到8.87%,夏普比率(SR)為0.27。
在道瓊斯工業平均指數上,MASA-DC方法的AR為15.52%,SR為0.80,最大回撤(MDD)為16.21%。
在標準普爾500指數上,MASA-MLP和MASA-LSTM方法的AR分別為22.49%和22.12%,SR約為0.9,MDD約為26%。