核心概念
자율 시스템의 최적 의사 결정은 불확실하고 시간 변동성이 있는 환경에서 중요한 도전이다.
统计
환경의 변동성은 시스템의 동적을 어렵게 만든다.
TV-POMDP는 시간 변동성을 고려하여 전이를 동적 확률 함수로 나타낸다.
MPSE는 가중 메모리를 활용하여 시간 변동 추정을 더 정확하게 제공한다.
引用
"시간이 지남에 따라 환경의 변화는 임무 완료를 위한 시스템의 최적 의사 결정 전략에 중대한 영향을 미칠 수 있다."
"MPSE는 가중 메모리를 활용하여 시간 변동 추정을 더 정확하게 제공하고, 시간 제약을 고려하여 장기적 보상을 최적화하는 계획 전략을 제안한다."