Evaluierung der Entscheidungsfindung von Großen Sprachmodellen (LLMs) in Multi-Agenten-Umgebungen
Große Sprachmodelle zeigen zufriedenstellende Robustheit, aber begrenzte Übertragbarkeit in komplexen Entscheidungssituationen. Ihre Leistung kann jedoch durch Ansätze wie Chain-of-Thought verbessert werden.