この論文では、Tsallisエントロピー正則化を使用して、線形的に解けるMDPと線形二次レギュレーターの最適制御問題を取り上げています。Shannonエントロピー正則化が探索とスパース性のバランスを促進する能力を持つため、広く採用されています。TsallisエントロピーはShannonエントロピーの一般化であり、探索と制御法のスパース性の間のバランスを示すために使用されます。具体的な数値例を通じて、TROCアプローチが高いエントロピーとスパース性を実現することが示されました。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Yota Hashizu... a las arxiv.org 03-05-2024
https://arxiv.org/pdf/2403.01805.pdfConsultas más profundas