Auswirkungen von Gegenmaßnahmen zur Datenkontamination auf Code-Sprachmodelle
Verschiedene Gegenmaßnahmen wie die Verwendung neuerer Daten, kuratierter Datensätze oder Refaktorierung von Kontaminationsdaten haben nicht immer die erwartete Wirkung, die Datenkontamination in der Bewertung von Code-Sprachmodellen zu verringern.