Keskeiset käsitteet
提案されたSOTOPIA-πは、言語エージェントの社会的知能を向上させるためのインタラクティブな学習方法です。
Tiivistelmä
人間は模倣と社会的相互作用を通じて社会的スキルを習得する。
SOTOPIA-πは、行動クローニングと自己強化トレーニングを活用し、大規模言語モデル(LLM)の評価に基づいてフィルタリングされた社会的相互作用データで言語エージェントの社会的知能を向上させる。
このトレーニング手法により、7B LLMが専門家モデル(GPT-4ベースのエージェント)の社会目標達成能力に到達し、安全性を向上させつつMMLUベンチマークで一般的なQA能力を維持することが示されている。
Tilastot
我々のトレーニング手法により、7B LLMが専門家モデル(GPT-4)に匹敵するパフォーマンスにまで向上した。
Lainaukset
"SOTOPIA-πは、言語エージェントの社会的知能を向上させるためのインタラクティブな学習方法です。"