المفاهيم الأساسية
Tsallis Entropy wird zur Regularisierung von linearen MDPs und linearen quadratischen Reglern verwendet, um zwischen Exploration und Sparsamkeit der Steuerung zu balancieren.
الإحصائيات
"Tsallis Entropy, die eine Erweiterung der Shannon-Entropie ist, wird für die Regularisierung von linearen MDPs und linearen quadratischen Reglern verwendet."
"Tsallis-Entropie wird genutzt, um zwischen Exploration und Sparsamkeit der Steuerung zu balancieren."
اقتباسات
"Optimale Steuerungspolitiken erreichen hohe Entropie bei gleichzeitiger Sparsamkeit."
"Tsallis-Entropie ermöglicht die Regularisierung von optimalen Transportproblemen für hochentropische, aber spärliche Lösungen."