Evaluierung der Meinungsführerschaft großer Sprachmodelle im Werwolf-Spiel
Große Sprachmodelle zeigen zwar strategische Verhaltensweisen in sozialen Deduktionsspielen, aber ihre Fähigkeit zur Meinungsführerschaft wurde bisher übersehen. Diese Studie untersucht die Meinungsführerschaft von Sprachmodellen im Werwolf-Spiel, indem sie zwei Bewertungsmetriken entwickelt und umfangreiche Experimente mit verschiedenen Sprachmodellen sowie menschlichen Teilnehmern durchführt.