Core Concepts
Guided Data Augmentation (GuDA) offers a human-guided approach to generating expert-quality augmented data for offline reinforcement learning and imitation learning.
Stats
GuDAはオフライン強化学習と模倣学習のために専門家品質の拡張データを生成する人間指導型アプローチを提供します。
GuDAは、静的データセットに依存するオフライン強化学習で、外挿エラーを軽減するために高品質な拡張データを生成します。
GuDAは、ユーザー定義のサンプリング手順を使用して専門家品質の拡張データを生成します。
サンプリング手順はドメイン固有であり、タスクに依存します。
GuDAは迷路ナビゲーションや物理ロボットサッカーなどのシミュレートされたタスクで評価されました。
GuDAはランダムなDA戦略やモデルベースのアプローチよりもポリシーのパフォーマンス向上において優れています。