Effizienzsteigerung durch Nutzung vorheriger Trajektorien in der tiefen Verstärkungslernung.
Leveraging prior trajectories to enhance sample efficiency in RL algorithms.