Jumanji: Eine vielfältige Suite skalierbarer Reinforcement-Learning-Umgebungen in JAX
Jumanji ist eine Suite von 22 vielfältigen RL-Umgebungen, die speziell für Geschwindigkeit, Flexibilität und Skalierbarkeit entwickelt wurden. Jumanji bietet eine Reihe von Umgebungen, die sich auf kombinatorische Probleme konzentrieren, die in der Industrie häufig auftreten, sowie auf anspruchsvolle allgemeine Entscheidungsfindungsaufgaben.