Wie können Große Sprachmodelle ihre Unsicherheit ausdrücken? Eine empirische Bewertung der Vertrauensermittlung in Großen Sprachmodellen
Große Sprachmodelle neigen dazu, ihre Antworten mit hoher Zuversicht zu äußern, was potenzielle Risiken für den sicheren Einsatz von Großen Sprachmodellen birgt. Durch geeignete Prompt-Strategien, Sampling-Methoden und Aggregationstechniken kann die Übervertrauenheit zwar teilweise abgemildert werden, die Leistung bei der Fehlererkennung bleibt jedoch eine Herausforderung, insbesondere bei Aufgaben, die Fachwissen erfordern.