Download Linnk AI
•
Autonomous Research Assistant
>
Sign In
insight
-
선호도 기반 피드백을 활용한 강화학습
선호도 기반 피드백을 활용한 강화학습의 효율성 향상을 위한 무작위화 기법
무작위화 기법을 활용하여 선호도 기반 피드백을 활용한 강화학습 알고리즘의 통계적 복잡성, 계산 복잡성, 질의 복잡성을 동시에 최소화할 수 있다.
1