本研究では、従来のマクロ経済エージェントベースモデル(ABM)に、強化学習を用いて完全に合理的な行動を学習するエージェントを導入した「合理的マクロABM(R-MABM)」フレームワークを提案した。
具体的には以下の知見を得た:
合理的エージェントは、市場競争の程度と合理性の度合いに応じて、3つの異なる利益最大化戦略を自発的に学習する:
合理的エージェントが独立した戦略を学習する場合、戦略的グループに自発的に分化し、全体としての利益を高めることができる。
合理性の導入は常に総生産(GDP)を向上させるが、経済の安定性は完全競争戦略が支配的な場合にのみ改善される。ダンピング戦略は経済の不安定性を高める。
完全競争戦略を採る合理的エージェントは、需要ショックに対して最も効率的な対応を示す。
本研究は、経済シミュレーションにおける強化学習の活用を先駆的に示した重要な成果であり、経済政策の分析や新たな経済モデルの構築に貢献できると期待される。
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor