이 논문은 부분적으로 관측 가능한 선형 시변 동적 시스템에서 상태 표현 학습을 통해 선형 2차 가우시안 제어 문제를 해결하는 방법을 제안합니다.
주요 내용은 다음과 같습니다:
상태 표현 함수 학습을 위해 비용 예측에 초점을 맞추는 직접적인 잠재 모델 학습 방법을 제안합니다. 이는 관측 재구성이나 역 모델 학습에 의존하지 않습니다.
제안된 방법이 선형 2차 가우시안 제어 문제에서 최적의 상태 표현 함수와 제어기를 찾을 수 있음을 이론적으로 보장합니다. 이는 기존 방법과 달리 비용 예측에 초점을 맞추는 것이 핵심입니다.
제안 방법의 유한 표본 보장을 위해 다음과 같은 기술적 기여를 합니다:
제안 방법의 실용적 의의로, 다단계 누적 비용 예측이 상태 표현 학습에 유용함을 보여줍니다. 이는 기존 경험적 연구에서 관찰된 아이디어를 이론적으로 뒷받침합니다.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Yi Tian,Kaiq... a las arxiv.org 03-14-2024
https://arxiv.org/pdf/2212.14511.pdfConsultas más profundas