Linnk AI letöltése
•
Kutatási asszisztens
>
Bejelentkezés
betekintés
-
온라인 학습, 강화학습
온라인 예측 컨텍스트를 활용한 밴딧 문제에 대한 연구
예측된 컨텍스트만 관찰할 수 있는 컨텍스트 밴딧 문제에 대해 기존 알고리즘의 한계를 극복하고 아차선형 회귀 보장을 제공하는 새로운 온라인 알고리즘을 제안한다.
1