研究は、敵対的損失と厳しい制約を伴うCMDPに焦点を当て、サブリニアリグレットと制約の満足を保証するアルゴリズムの開発につながりました。BV-OPSアルゴリズムは、サブリニアVTおよびRTを達成します。一方、S-OPSアルゴリズムは安全性プロパティを高い確率で達成します。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Francesco Em... lúc arxiv.org 03-07-2024
https://arxiv.org/pdf/2403.03672.pdfYêu cầu sâu hơn