Private Benchmarking zur Verhinderung von Kontamination und Verbesserung der vergleichenden Bewertung von LLMs
Private Benchmarking ist eine Lösung, um Testdatensätze privat zu halten und Modelle zu bewerten, ohne den Testdatensatz dem Modell preiszugeben.