Tải xuống Linnk AI
•
Trợ lý nghiên cứu
>
Đăng nhập
thông tin chi tiết
-
適応的オフラインポリシー評価
適応的に収集されたデータを用いた強化学習のためのオフラインポリシー評価
適応的に収集されたデータを用いて、ターゲットポリシーの価値を高確率で正確に推定することができる。
1