Linnk AI 다운로드
•
자율 연구 보조원
>
로그인
통찰
-
정책 희소화 및 저랭크 분해
딥 강화 학습을 위한 최적 정책 희소화 및 저랭크 분해
딥 강화 학습에서 최적 정책을 위한 L0-norm 정규화 기술은 희소성을 유지하면서 저랭크 분해를 촉진하여 보상 감소 없이 계산 자원을 줄일 수 있음을 입증했다.
1