본 논문에서는 다양한 트랙과 장애물 구성에 일반화할 수 있는 장애물 회피 자율 드론 레이싱 정책을 학습하기 위해 도메인 무작위화와 심층 강화 학습을 결합한 새로운 접근 방식을 제시합니다.
본 논문에서는 보조 작업을 활용하여 심층 강화 학습 에이전트가 외환 시장에서 더 높은 수익을 내고 거래 위험을 줄이는 최적의 거래 전략을 학습할 수 있음을 보여줍니다.