研究は、敵対的損失と厳しい制約を伴うCMDPに焦点を当て、サブリニアリグレットと制約の満足を保証するアルゴリズムの開発につながりました。BV-OPSアルゴリズムは、サブリニアVTおよびRTを達成します。一方、S-OPSアルゴリズムは安全性プロパティを高い確率で達成します。
toiselle kielelle
lähdeaineistosta
arxiv.org
Tärkeimmät oivallukset
by Francesco Em... klo arxiv.org 03-07-2024
https://arxiv.org/pdf/2403.03672.pdfSyvällisempiä Kysymyksiä