הורד את Linnk AI
•
עוזר מחקר
>
התחברות
תובנה
-
정책 가이드 확산 모델을 통한 합성 데이터 생성
정책 가이드 확산 모델을 통한 효율적인 오프라인 강화학습
오프라인 데이터셋에서 정책 가이드 확산 모델을 학습하여 목표 정책에 부합하는 합성 경험을 생성함으로써, 오프라인 강화학습 성능을 향상시킬 수 있다.
1