Linnk AI 다운로드
•
자율 연구 보조원
>
로그인
통찰
-
모방 학습의 스케일링 법칙
단일 에이전트 게임에서 모방 학습의 스케일링 법칙
모방 학습의 손실과 평균 반환은 FLOP에 대해 명확한 거듭제곱 법칙을 따르며, 환경에서의 성능 향상을 예측 가능하게 합니다.
1