下載 Linnk AI
•
AI 研究助理
>
登入
洞見
-
制約付き正規化流れ方策
安全性と解釈可能性を兼ね備えた強化学習のための制約付き正規化流れ方策
制約付き正規化流れ方策は、安全性と解釈可能性を兼ね備えた強化学習のための新しい方策モデルである。この方策は、ドメイン知識を活用して制約を満たす行動を生成することができ、学習中も制約を順守する。
1