Core Concepts
확률 공간에서의 동적 프로그래밍 문제는 두 가지 요소로 구성된다: (i) 기저 공간에서의 동적 프로그래밍 해법과 (ii) 최적 수송 문제의 해법. 이를 통해 개별 에이전트의 저수준 제어와 전체 군집의 고수준 제어가 분리되는 분리 원리가 성립한다.
Abstract
이 논문은 확률 공간에서의 이산시간 유한 시계열 최적 제어 문제를 다룬다. 이러한 문제는 확률 측도로 표현되는 시스템 상태를 다루는 다양한 최적 제어 문제에 적용된다.
저자들은 이 문제를 최적 수송 이론의 관점에서 접근한다. 구체적으로 다음을 보인다:
- 많은 확률 공간 최적 제어 문제를 최적 수송 문제로 재정식화할 수 있다.
- 이를 통해 개별 에이전트의 저수준 제어와 전체 군집의 고수준 제어가 분리되는 분리 원리가 성립한다. 즉, 개별 에이전트의 최적 제어 전략과 에이전트들의 최적 할당 문제가 분리된다.
이러한 결과는 확률 공간에서의 동적 프로그래밍 알고리즘의 분석적, 계산적 어려움을 극복할 수 있게 해준다. 또한 기존 문헌의 다양한 접근법을 통합하고 일반화한다.
Stats
기저 공간에서의 최적 제어 문제의 비용-함수는 다음과 같다:
jN(xN, rN) = gN(xN, rN)
jk(xk, rk, ..., rN) = min_uk gk(xk, uk, rk) + jk+1(fk(xk, uk), rk+1, ..., rN)
Quotes
"확률 공간에서의 동적 프로그래밍 문제는 두 가지 요소로 구성된다: (i) 기저 공간에서의 동적 프로그래밍 해법과 (ii) 최적 수송 문제의 해법."
"이를 통해 개별 에이전트의 저수준 제어와 전체 군집의 고수준 제어가 분리되는 분리 원리가 성립한다."