Leveraging prior trajectories to enhance sample efficiency in RL algorithms.
Effizienzsteigerung durch Nutzung vorheriger Trajektorien in der tiefen Verstärkungslernung.