核心概念
GPT-4はDOOMをプレイする能力を持つが、理解深度に制限がある。
要約
大規模言語モデル(LLM)であるGPT-4は、1993年のファーストパーソンシューティングゲーム「DOOM」をプレイする能力を示す。モデルはゲームの状態に関するスクリーンショットから生成されたテキスト記述といくつかの指示だけでゲームをプレイできることがわかった。GPT-4はドアを操作し、敵と戦い、歩行経路を実行することができる。より複雑なプロンプティング戦略では、より良い結果が得られる。しかし、モデルの推論能力には限界があり、長期的な計画や推論には不十分な面もある。この研究はLLMベースのインテリジェントエージェントのビデオゲームへの応用と開発に貢献しており、倫理的な問題についても議論している。
統計
GPT-4はDOOMを遊ぶためにトレーニング不要である。
プロンプティング戦略によって結果が変化する。
プランニングおよび推論スキルに関する評価が行われた。
引用
"Although the model was not entirely successful at finishing the map, it displayed remarkable agency throughout the game."
"We found that, although the model was not entirely successful at finishing the map, it displayed remarkable agency throughout the game."
"The model usually hugged the walls when traversing the map, facing them and walking at an angle."