이 논문은 부분적으로 관측 가능한 선형 시변 동적 시스템에서 상태 표현 학습을 통해 선형 2차 가우시안 제어 문제를 해결하는 방법을 제안합니다.
주요 내용은 다음과 같습니다:
상태 표현 함수 학습을 위해 비용 예측에 초점을 맞추는 직접적인 잠재 모델 학습 방법을 제안합니다. 이는 관측 재구성이나 역 모델 학습에 의존하지 않습니다.
제안된 방법이 선형 2차 가우시안 제어 문제에서 최적의 상태 표현 함수와 제어기를 찾을 수 있음을 이론적으로 보장합니다. 이는 기존 방법과 달리 비용 예측에 초점을 맞추는 것이 핵심입니다.
제안 방법의 유한 표본 보장을 위해 다음과 같은 기술적 기여를 합니다:
제안 방법의 실용적 의의로, 다단계 누적 비용 예측이 상태 표현 학습에 유용함을 보여줍니다. 이는 기존 경험적 연구에서 관찰된 아이디어를 이론적으로 뒷받침합니다.
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Yi Tian,Kaiq... um arxiv.org 03-14-2024
https://arxiv.org/pdf/2212.14511.pdfTiefere Fragen