この論文では、Tsallisエントロピー正則化を使用して、線形的に解けるMDPと線形二次レギュレーターの最適制御問題を取り上げています。Shannonエントロピー正則化が探索とスパース性のバランスを促進する能力を持つため、広く採用されています。TsallisエントロピーはShannonエントロピーの一般化であり、探索と制御法のスパース性の間のバランスを示すために使用されます。具体的な数値例を通じて、TROCアプローチが高いエントロピーとスパース性を実現することが示されました。
Para outro idioma
do conteúdo fonte
arxiv.org
Principais Insights Extraídos De
by Yota Hashizu... às arxiv.org 03-05-2024
https://arxiv.org/pdf/2403.01805.pdfPerguntas Mais Profundas