Interaktives Lernen von sozial intelligenten Sprachagenten: SOTOPIA-π
SOTOPIA-π ist eine interaktive Lernmethode, die die soziale Intelligenz von Sprachagenten durch soziale Interaktionen verbessert, indem sie Verhaltensklonen und Selbstverstärkung auf gefilterten sozialen Interaktionsdaten basierend auf Bewertungen großer Sprachmodelle (LLM) nutzt.