핵심 개념
이 논문에서는 적응 (p, ∞)-바서슈타인 거리 개념을 도입하여 이중 인과 제약이 있는 다중 기간 확률적 제어 문제에 대한 새로운 동적 프로그래밍 원리를 제시합니다.
본 연구는 이중 인과 제약이 있는 다중 기간 확률적 제어 문제를 다루며, 이러한 문제에 대한 새로운 동적 프로그래밍 원리를 제시합니다.
배경
기존의 바서슈타인 거리는 확률 분포 간의 거리를 측정하는 데 유용하지만, 시간에 따라 변화하는 시스템의 인과 관계를 고려하지 못하는 한계가 있습니다. 이러한 한계를 극복하기 위해 적응 바서슈타인 거리가 등장했지만, 여전히 다중 기간 제어 문제에 적용하기에는 계산적으로 복잡하다는 문제점이 존재합니다.
새로운 접근 방식
본 연구에서는 적응 (p, ∞)-바서슈타인 거리라는 새로운 개념을 도입하여 기존 적응 바서슈타인 거리의 계산적 어려움을 해결합니다. 이 거리는 기존 거리보다 강력하면서도 동적 프로그래밍 원리를 적용할 수 있도록 설계되었습니다.
주요 결과
본 연구의 주요 결과는 다음과 같습니다.
적응 (p, ∞)-바서슈타인 거리는 거리 함수의 조건을 만족하며, 기존 적응 바서슈타인 거리보다 크거나 같습니다.
적응 (p, ∞)-바서슈타인 거리를 이용하면 다중 기간 제어 문제를 일련의 단일 기간 문제로 분해하여 해결할 수 있습니다.
본 연구에서는 제어 변수가 볼록 함수이고 비용 함수가 준분리 가능 함수일 경우, 최대-최소 정리를 통해 최적 제어 전략을 구할 수 있음을 보입니다.
결론
본 연구에서 제시된 적응 (p, ∞)-바서슈타인 거리와 동적 프로그래밍 원리는 이중 인과 제약이 있는 다중 기간 제어 문제를 해결하는 데 효과적인 도구가 될 수 있습니다. 특히, 금융, 운영 연구, 로봇 공학 등 다양한 분야에서 불확실성 하에서 의사 결정 문제를 모델링하고 해결하는 데 활용될 수 있을 것으로 기대됩니다.