Eine Methode zur automatischen Auswahl relevanter Merkmale aus einem Kandidatensatz von Polynomfunktionen, um die Belohnungsfunktion für das inverse Verstärkungslernen zu lernen.