研究は、敵対的損失と厳しい制約を伴うCMDPに焦点を当て、サブリニアリグレットと制約の満足を保証するアルゴリズムの開発につながりました。BV-OPSアルゴリズムは、サブリニアVTおよびRTを達成します。一方、S-OPSアルゴリズムは安全性プロパティを高い確率で達成します。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Francesco Em... a las arxiv.org 03-07-2024
https://arxiv.org/pdf/2403.03672.pdfConsultas más profundas