Große Sprach-Modelle sind nicht besser darin, zuvor generierte Alternativen zu unterscheiden, als direkt gute Lösungen zu generieren.