Centrala begrepp
マルチエージェント強化学習(MARL)手法を用いて、人間の自然言語と整合性のある通信プロトコルを学習することで、人間-エージェントチームワークを効果的に実現する。
Sammanfattning
本研究では、マルチエージェント強化学習(MARL)とLarge Language Model(LLM)を組み合わせた新しい計算パイプラインを提案している。具体的には以下の通りである:
- LLMエージェントを用いて、人間の自然言語に基づいたチームワークシナリオのデータセットを収集する。
- このデータセットを用いて、MARL エージェントの通信空間を人間の自然言語空間に整合させる。これにより、MARL エージェントは人間にも理解可能な通信を学習できる。
- 提案手法を、プレデター・プレイ環境とURSAR環境で評価した。結果、提案手法は従来手法と同等の課題遂行能力を維持しつつ、人間にも理解可能な通信を学習できることが示された。
- さらに、提案手法は未知のチームメイトとのアドホックチームワークにおいても優れた性能を発揮することが確認された。
Statistik
提案手法は従来手法と同等の課題遂行能力を維持している。
提案手法は人間の自然言語との類似性が高く、人間にも理解可能な通信を学習できている。
提案手法は未知のチームメイトとのアドホックチームワークにおいても優れた性能を発揮している。
Citat
"マルチエージェント強化学習(MARL)手法は、スクラッチから共有通信プロトコルを学習し、困難なチームタスクを達成する可能性を示してきた。"
"しかし、学習された言語は通常、人間や共同訓練されていない他のエージェントには解釈できず、アドホックチームワークシナリオでの適用性を制限している。"
"本研究では、MARL エージェントの通信空間を人間の自然言語空間に整合させることで、タスク遂行能力を維持しつつ、人間にも理解可能な通信を学習できることを示した。"