下載 Linnk AI
•
AI 研究助理
>
登入
洞見
-
선형 동적 시스템, 강화 학습
선형 동적 시스템에서 가치 함수의 표현 능력 제한과 통계적 (비)효율성의 관계
가치 함수 표현의 한계로 인해 모델 프리 방법이 특정 문제에서 통계적으로 비효율적일 수 있다.
1