Linnk AI'yı İndirin
•
Araştırma Asistanı
>
Giriş Yap
içgörü
-
정책 가이드 확산 모델을 통한 합성 데이터 생성
정책 가이드 확산 모델을 통한 효율적인 오프라인 강화학습
오프라인 데이터셋에서 정책 가이드 확산 모델을 학습하여 목표 정책에 부합하는 합성 경험을 생성함으로써, 오프라인 강화학습 성능을 향상시킬 수 있다.
1