制約付き最適制御問題では、安全性制約を満たすことが重要な課題である。強化学習アルゴリズムにおいても、制約を満たす最適な政策を見つけることが必要不可欠である。本論文では、制約付き最適制御問題の実現可能性を分析する理論的枠組みを提案し、モデル予測制御と強化学習の両方に適用可能な手法を示す。