이중 사원수를 활용하여 무인 항공기와 매달린 화물의 동역학과 운동학을 통합적으로 표현하고, 화물 들어올리기와 궤적 추적을 위한 새로운 제어 전략을 제안한다.
강화 학습 기반 비대칭 액터-크리틱 아키텍처를 통해 단 18초 만에 실제 쿼드로터를 제어할 수 있는 정책을 학습할 수 있다.
시간 변화에 따른 방향성 그래프에서 무인 항공기들의 협력적 경로 추종을 위한 분산 제어기를 제안하며, 이를 통해 무인 항공기들의 동시 도착을 보장한다.
본 연구는 프로펠러 손상을 감지하고 보상하는 적응형 제어 기법을 제안하여 쿼드로터의 안전성과 복원력을 향상시킨다.
무인 항공기 시스템에서 고장이 발생할 경우 성능 저하 및 불안정성이 초래될 수 있으므로, 고장을 감지하고 이를 수용할 수 있는 제어 시스템을 설계하는 것이 중요하다.
본 논문은 다중 충실도 강화 학습 기반의 효율적인 쿼드로터 시간 최적 궤적 재계획 방법을 제안한다. 이 방법은 강화 학습 정책과 보상 추정기를 동시에 학습하여 실시간 적용이 가능한 정확한 동역학 모델과 계획 정책을 개발한다.
모델 예측 선택(MPS) 기법은 성능 지표 함수를 최소화하여 무인 항공기의 안정적인 폐루프 평형 자세 오차 사분원을 실시간으로 선택한다.