Core Concepts
강화 학습 기반 접근법을 통해 멀티 로터 드론이 이동 플랫폼에 성공적으로 착륙할 수 있도록 한다.
Abstract
이 연구는 멀티 로터 드론이 이동 플랫폼에 자율적으로 착륙할 수 있는 강화 학습 기반 접근법을 제안한다. 주요 내용은 다음과 같다:
드론의 종방향 및 횡방향 움직임을 각각 독립적으로 제어하는 두 개의 강화 학습 에이전트를 사용하여 학습 과정을 단순화한다.
플랫폼 운동학 모델을 활용한 상태 공간 이산화 기법과 순차적 커리큘럼 학습을 통해 학습 속도를 높이고 안정성을 향상시킨다.
드론의 기동성을 보장하기 위해 하이퍼파라미터를 플랫폼 운동학 모델에 기반하여 해석적으로 도출한다.
이를 통해 기존 방법 대비 더 높은 성공률과 더 짧은 학습 시간을 달성할 수 있었다. 또한 실제 하드웨어에 구현하여 성능을 검증하였다.
Stats
플랫폼의 최대 가속도는 0.32m/s^2 이다.
드론의 최대 피치각은 22.92도이다.
에이전트의 동작 주파수는 22.92Hz이다.
Quotes
"강화 학습은 모델 기반 제어 기법의 한계를 극복할 수 있는 매력적인 대안이다."
"상태 공간 이산화와 순차적 커리큘럼 학습은 학습 속도와 안정성 향상에 핵심적이다."
"플랫폼 운동학 모델에 기반한 하이퍼파라미터 도출은 드론의 기동성을 보장한다."