Download Linnk AI
•
Autonomous Research Assistant
>
Sign In
insight
-
모방 학습의 스케일링 법칙
단일 에이전트 게임에서 모방 학습의 스케일링 법칙
모방 학습의 손실과 평균 반환은 FLOP에 대해 명확한 거듭제곱 법칙을 따르며, 환경에서의 성능 향상을 예측 가능하게 합니다.
1