Automatische Bewertung von Satzübersetzungsübungen ist eine herausfordernde Aufgabe, selbst für modernste Sprachmodelle.