核心概念
大規模言語モデル(LLM)は、ゲームプレイのパフォーマンスにおいては平均的な人間のプレイヤーに及ばないものの、そのパフォーマンスは人間のプレイヤーが示す難易度と有意な相関関係を示しており、ゲーム開発における効果的な難易度測定ツールとして機能する可能性がある。
要約
LLMエージェントを用いたゲーム難易度測定:WordleとSlay the Spireを事例として
この論文は、ゲーム開発における重要な課題であるゲーム難易度の測定に、大規模言語モデル(LLM)を活用できるかどうかを探求しています。
従来のゲームテストは、主に人間のテスターに頼っており、時間と費用がかかるプロセスでした。
AIを用いた自動テスト手法も開発されていますが、人間の能力を正確に模倣できるかについては、いまだ疑問が残ります。
LLMは、自然言語処理と推論能力の高さから、ゲーム関連データの処理や人間らしい行動の生成に適しています。
本研究では、LLMが人間のプレイヤーのようにゲーム難易度を評価できるかどうかを検証しました。