この論文では、Tsallisエントロピー正則化を使用して、線形的に解けるMDPと線形二次レギュレーターの最適制御問題を取り上げています。Shannonエントロピー正則化が探索とスパース性のバランスを促進する能力を持つため、広く採用されています。TsallisエントロピーはShannonエントロピーの一般化であり、探索と制御法のスパース性の間のバランスを示すために使用されます。具体的な数値例を通じて、TROCアプローチが高いエントロピーとスパース性を実現することが示されました。
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Yota Hashizu... kl. arxiv.org 03-05-2024
https://arxiv.org/pdf/2403.01805.pdfDybere Forespørgsler