本論文では、深層アクター-クリティック(DAC)アルゴリズムを用いた制約付き強化学習(CRL)問題に取り組む。既存のDAC アルゴリズムは、非凸確率的制約条件や環境との相互作用コストが高いという課題がある。
提案するSLDACアルゴリズムでは以下の工夫を行う:
シミュレーション結果から、提案アルゴリズムが既存手法に比べて優れた性能と大幅な相互作用コストの削減を実現できることが示された。
Ke Bahasa Lain
dari konten sumber
arxiv.org
Wawasan Utama Disaring Dari
by Kexuan Wang,... pada arxiv.org 09-19-2024
https://arxiv.org/pdf/2306.06402.pdfPertanyaan yang Lebih Dalam