Core Concepts
LLMの社会的知能は、学術的知能とは異なることが示された。
Abstract
この記事では、大規模言語モデル(LLMs)の学術的知能が向上している一方で、その社会的知能については不明瞭であることが指摘されています。Daniel Goleman氏の社会的知性理論に着想を得て、実世界の社会シナリオに基づいた標準化された社会的知性テスト「Situational Evaluation of Social Intelligence (SESI)」が開発されました。13種類の人気かつ最先端のLLMエージェントをSESIで評価した結果、LLMsの社会的知性にはまだ改善すべき余地があり、主な誤り原因として表面上友好性が挙げられました。さらに、LLMsの社会的知性と学術的知性との間には比較的低い相関関係があり、それぞれ異なる形態の知性であることが示唆されました。
Introduction
LLMsの学術的成功と社会的挑戦
人間の社会的インテリジェンス理論からインスピレーションを受けたSESI開発
Methodology
LLMエージェントへの影響要因(パーソナリティ、感情、ジェンダー、役割)を探求
Results
LLMエージェントにおけるパーソナリティや感情など要素ごとの影響分析結果
Conclusion
SESIベンチマークは他ベンチマークよりも長く複雑で多様なソーシャルコンテキストを提供
Stats
大規模言語モデル(LLMs)13種類をSESIで評価した結果を示す。