Die Testgröße für die Auswahl des besten Zusammenfassungsmodells liegt unter 100 Beispielen, sowohl für automatische als auch menschliche Bewertungen.