Effiziente Nutzung großer vortrainierter Modelle als Nullstellen-Belohnungsmodelle für autonomes Fahren
Unser Ansatz LORD nutzt große vortrainierte Modelle als Nullstellen-Belohnungsmodelle, indem er unerwünschte sprachliche Ziele anstelle von erwünschten Zielen verwendet, um die Interpretierbarkeit, Generalisierungsfähigkeit und Effektivität von Systemen für autonomes Fahren zu verbessern.