Effizientes Multi-Task-Reinforcement-Learning für die Verkehrslichtsignalsteuerung
MTLIGHT verbessert die Beobachtung des Agenten durch einen erlernten latenten Zustand, der aus zahlreichen Verkehrskennzahlen gewonnen wird. Gleichzeitig werden mehrere Hilfs- und Überwachungsaufgaben konstruiert, um den latenten Zustand zu lernen, und zwei Arten von eingebetteten latenten Merkmalen, die aufgabenspezifischen und die aufgabenübergreifenden Merkmale, werden verwendet, um den latenten Zustand reichhaltiger zu machen.