Download Linnk AI
•
Autonomous Research Assistant
>
Sign In
insight
-
敵対的な休止状態多腕バンディットの強化学習
敵対的な休止状態多腕バンディットに対する未知の遷移関数とバンディットフィードバックを考慮した効率的な強化学習
未知の遷移関数と敵対的なバンディットフィードバックを持つ休止状態多腕バンディットに対して、効率的な強化学習アルゴリズムを提案し、理論的な保証付きのレグレット上界を示した。
1