核心概念
大型言語モデルは、シミュレーションを通じて蓄積された経験を活用することで、複雑な人間システムにおける推論能力を向上させることができる。
要約
本論文では、大型言語モデル(LLM)の推論能力を複雑な人間システムに適用するための新しい枠組み「モザイク専門家観察ウォール(MEOW)」を提案している。
MEOWでは、まず一般的な言語モデルを用いてコミュニケーションゲームをシミュレーションし、そのデータを用いて専門家モデルを訓練する。実際のゲームでは、この専門家モデルの観察結果を言語モデルに提供することで、推論精度を向上させる。
シミュレーションデータを活用することで、プライバシーや安全性の問題から実データが得られない複雑な人間システムにおいても、LLMの推論能力を高めることができる。実験の結果、MEOWはLLMの推論を改善し、安定性も向上させることが示された。
統計
シミュレーションデータセットD1には261個のグラフ、1044個のノード、3551個のエッジが含まれる。
データセットD2には181個のグラフ、724個のノード、3966個のエッジが含まれる。