Die Verwendung von Glasbox-Funktionen ermöglicht eine zuverlässige Selbstbewertung großer Sprachmodelle.