Das Baichuan2-Sum-Modell, das auf dem Baichuan2-Sprachmodell basiert, erreicht durch Instruktionsfeinjustierung und Verwendung der NEFTune-Technik neue Bestleistungen bei der rollenbasierten Dialogzusammenfassung auf zwei öffentlichen Datensätzen.
Großsprachmodelle produzieren eine erhebliche Anzahl an faktischen Fehlern in ihren dialogbasierten Zusammenfassungen, unabhängig von ihrer Größe. Bestehende Metriken zur Bewertung der Faktentreue schneiden besser ab als die meisten Großsprachmodelle als Evaluatoren.