核心概念
Safety-Gymnasiumは、単一エージェント、マルチエージェント、およびビジョンベースのタスクを含む、安全重視型の強化学習アルゴリズムの評価と比較を容易にするために設計された、包括的な安全強化学習ベンチマークスイートです。
摘要
Safety-Gymnasium:安全強化学習ベンチマークスイート
本論文は、安全重視型の強化学習(SafeRL)のための新しいシミュレーション環境スイート、Safety-Gymnasiumを紹介しています。Safety-Gymnasiumは、既存のSafety Gymフレームワークを拡張し、単一エージェント、マルチエージェント、およびビジョンベースのシナリオを含むようにタスク範囲を拡大しています。
安全強化学習(SafeRL)アルゴリズムの評価と比較を容易にする、包括的で使いやすいベンチマークスイートを作成すること。
Safety-Gymnasiumは、GymnasiumとMuJoCoをベースに構築されており、単一エージェント、マルチエージェント、およびビジョンベースの課題を含む、さまざまな安全重視型のタスクを提供しています。
各タスクには、速度制限、障害物、危険区域など、さまざまな制約があります。
Safety-Gymnasiumは、16種類の最先端のSafeRLアルゴリズムを含む、SafePOという単一ファイルスタイルのアルゴリズムライブラリも提供しています。