Conceitos Básicos
다중 에이전트 시스템에서 비선형 동역학과 안전 제약 조건을 고려하여 주어진 영역을 최적으로 커버하는 문제를 해결한다. 이를 위해 계층적 및 비계층적 접근법을 제안하며, 능동 학습 기법을 활용하여 초기에 알려지지 않은 환경을 탐색한다.
Resumo
이 논문은 다중 에이전트 시스템에서 커버리지 제어 문제를 다룬다. 커버리지 제어는 주어진 영역을 최적으로 커버하도록 에이전트들을 배치하는 문제이다. 이 문제에는 두 가지 주요 과제가 있다:
- 비선형 동역학과 안전 제약 조건을 고려하는 것
- 초기에 알려지지 않은 환경에서 작업을 수행하는 것
이 논문에서는 이 두 가지 과제를 해결하기 위해 다음과 같은 접근법을 제안한다:
- 계층적 프레임워크: 중앙 서버에서 참조 값을 계산하고 에이전트의 로컬 모델 예측 제어(MPC) 추적 체계에 전달한다.
- 능동 학습: 탐색-활용 절충을 통해 에이전트가 알려지지 않은 환경을 적극적으로 탐색하도록 한다.
- 비계층적 프레임워크: MPC 최적화 문제에 참조 최적화를 통합하여 계층적 구조를 피한다. 이 경우 상한 신뢰 구간(UCB) 접근법을 사용한다.
모든 제안된 접근법에 대해 폐루프 제약 조건 만족과 최적 구성으로의 수렴을 보장한다. 또한 하드웨어 실험을 통해 모든 방법을 테스트하고 비교한다.
Estatísticas
에이전트 i의 상태와 입력 제약: xi,k ∈Xi, ui,k ∈Ui
에이전트 i의 비선형 이산 시간 동역학: xi,k+1 = fi(xi,k, ui,k)
에이전트 i의 위치: pi,k = Cixi,k
에이전트 간 충돌 회피 제약: ∥pi,k −pj,k∥≥(ri,max + rj,max), ∀i ̸= j
Citações
"다중 에이전트 시스템에서 커버리지 제어 문제는 주어진 영역을 최적으로 커버하도록 에이전트들을 배치하는 문제이다."
"이 문제에는 비선형 동역학과 안전 제약 조건을 고려하는 것, 그리고 초기에 알려지지 않은 환경에서 작업을 수행하는 것의 두 가지 주요 과제가 있다."
"이 논문에서는 이 두 가지 과제를 해결하기 위해 계층적 및 비계층적 접근법과 능동 학습 기법을 제안한다."