Baixe o Linnk AI
•
Assistente de Pesquisa
>
Entrar
insight
-
오프라인 강화 학습에서의 다중 스케일 시퀀스 모델링
오프라인 강화 학습에서의 다중 스케일 시퀀스 모델링 탐구: 마바 의사 결정자
오프라인 강화 학습에서 마바 의사 결정자(MambaDM)는 전역 및 지역 특징을 효과적으로 통합하여 강화 학습 궤적의 내부 상관관계를 더 잘 이해하고 예측 성능을 향상시킨다.
1