Core Concepts
UAV 군집의 집단적 행동을 고려하여 평균장 게임 기반 최적화를 통해 지상 센서의 정보 최신성을 최적화한다.
Abstract
이 논문은 원격 및 위험한 지역에서 지상 센서의 시기적절한 데이터 수집을 위해 무인 항공기(UAV) 군집을 활용하는 방법을 제안한다. UAV 군집의 집단적 행동을 고려하여 평균장 게임(MFG) 기반 최적화를 통해 지상 센서의 정보 최신성(Age of Information, AoI)을 최소화한다.
MFG 최적화는 연속적인 상태와 행동 공간을 포함하여 복잡한 계산 복잡성을 야기한다. 이를 해결하기 위해 저자들은 혼합 연속 및 이산 행동 공간에서 AoI를 최소화하기 위한 새로운 평균장 하이브리드 근접 정책 최적화(MF-HPPO) 기법을 제안한다. 또한 시간 의존적 네트워크 상태를 예측하고 학습 수렴을 개선하기 위해 장단기 메모리(LSTM) 레이어를 활용한다.
시뮬레이션 결과에 따르면 제안된 MF-HPPO 기법은 기존 다중 에이전트 딥 Q-러닝(MADQN) 방법 및 무작위 알고리즘 대비 각각 최대 45%와 57%의 AoI 감소를 달성한다.
Stats
UAV 수를 1에서 30으로 늘리면 MF-HPPO 알고리즘의 평균 AoI가 61% 감소한다.
지상 센서 수를 400개로 늘리면 MF-HPPO가 RSTD, NAMAS, MADQN 대비 각각 38%, 33%, 17% 더 우수한 성능을 보인다.
Quotes
"UAV 군집은 원격 및 위험한 지역에서 지상 센서의 시기적절한 데이터 수집에 효과적인 역할을 한다."
"UAV 군집의 집단적 행동을 최적화하면 데이터 수집 성능을 향상시킬 수 있다."
"MFG 최적화는 연속적인 상태와 행동 공간을 포함하여 상당한 계산 복잡성을 야기한다."