הורד את Linnk AI
•
עוזר מחקר
>
התחברות
תובנה
-
확산 모델을 활용한 오프라인 강화 학습
복잡한 행동 정책을 효율적으로 모방하는 확산 기반 정책 최적화
확산 모델의 강력한 생성 능력을 활용하면서도 계산 비용이 많이 드는 확산 샘플링 과정을 완전히 피할 수 있는 효율적인 정책 추출 방법을 제안합니다.
1