この論文では、Tsallisエントロピー正則化を使用して、線形的に解けるMDPと線形二次レギュレーターの最適制御問題を取り上げています。Shannonエントロピー正則化が探索とスパース性のバランスを促進する能力を持つため、広く採用されています。TsallisエントロピーはShannonエントロピーの一般化であり、探索と制御法のスパース性の間のバランスを示すために使用されます。具体的な数値例を通じて、TROCアプローチが高いエントロピーとスパース性を実現することが示されました。
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Yota Hashizu... في arxiv.org 03-05-2024
https://arxiv.org/pdf/2403.01805.pdfاستفسارات أعمق