核心概念
다중 에이전트 시스템에서 비선형 동역학과 안전 제약 조건을 고려하여 주어진 영역을 최적으로 커버하는 문제를 해결한다. 이를 위해 계층적 및 비계층적 접근법을 제안하며, 능동 학습 기법을 활용하여 초기에 알려지지 않은 환경을 탐색한다.
摘要
이 논문은 다중 에이전트 시스템에서 커버리지 제어 문제를 다룬다. 커버리지 제어는 주어진 영역을 최적으로 커버하도록 에이전트들을 배치하는 문제이다. 이 문제에는 두 가지 주요 과제가 있다:
- 비선형 동역학과 안전 제약 조건을 고려하는 것
- 초기에 알려지지 않은 환경에서 작업을 수행하는 것
이 논문에서는 이 두 가지 과제를 해결하기 위해 다음과 같은 접근법을 제안한다:
- 계층적 프레임워크: 중앙 서버에서 참조 값을 계산하고 에이전트의 로컬 모델 예측 제어(MPC) 추적 체계에 전달한다.
- 능동 학습: 탐색-활용 절충을 통해 에이전트가 알려지지 않은 환경을 적극적으로 탐색하도록 한다.
- 비계층적 프레임워크: MPC 최적화 문제에 참조 최적화를 통합하여 계층적 구조를 피한다. 이 경우 상한 신뢰 구간(UCB) 접근법을 사용한다.
모든 제안된 접근법에 대해 폐루프 제약 조건 만족과 최적 구성으로의 수렴을 보장한다. 또한 하드웨어 실험을 통해 모든 방법을 테스트하고 비교한다.
統計資料
에이전트 i의 상태와 입력 제약: xi,k ∈Xi, ui,k ∈Ui
에이전트 i의 비선형 이산 시간 동역학: xi,k+1 = fi(xi,k, ui,k)
에이전트 i의 위치: pi,k = Cixi,k
에이전트 간 충돌 회피 제약: ∥pi,k −pj,k∥≥(ri,max + rj,max), ∀i ̸= j
引述
"다중 에이전트 시스템에서 커버리지 제어 문제는 주어진 영역을 최적으로 커버하도록 에이전트들을 배치하는 문제이다."
"이 문제에는 비선형 동역학과 안전 제약 조건을 고려하는 것, 그리고 초기에 알려지지 않은 환경에서 작업을 수행하는 것의 두 가지 주요 과제가 있다."
"이 논문에서는 이 두 가지 과제를 해결하기 위해 계층적 및 비계층적 접근법과 능동 학습 기법을 제안한다."