Core Concepts
강화 학습 프레임워크와 휴리스틱 알고리즘의 통합을 통해 솔루션의 품질과 계산 속도를 동시에 향상시킬 수 있다.
Abstract
이 논문은 드론을 활용한 차량 경로 문제(VRPD)를 해결하기 위한 새로운 접근법인 SmartPathfinder를 제안한다. VRPD는 트럭과 드론을 활용하여 고객 위치에 물품을 배송하는 문제로, 복잡도가 높아 대부분의 기존 연구가 휴리스틱 접근법을 사용했다.
SmartPathfinder는 휴리스틱 알고리즘의 핵심 요소를 분석하고 이를 강화 학습 프레임워크와 통합한다. 이를 통해 솔루션의 품질과 계산 속도를 동시에 향상시킬 수 있다. 구체적으로:
기존 휴리스틱 알고리즘을 초기화, 수정, 평가, 셔플링의 4가지 핵심 요소로 분해하였다.
이 요소들을 강화 학습 프레임워크와 통합하여 SmartPathfinder를 설계하였다. 강화 학습 에이전트가 휴리스틱 알고리즘의 핵심 연산을 전략적으로 선택하도록 하여 솔루션 품질과 계산 속도를 동시에 향상시킨다.
기존 최신 휴리스틱 알고리즘에 SmartPathfinder를 적용한 결과, 최대 28.4%의 솔루션 품질 향상과 27.3%의 계산 시간 단축을 달성했다.
대규모 문제 인스턴스(최대 200개 고객)에서도 효과적으로 작동하는 것을 확인했다.
이 연구는 강화 학습과 휴리스틱 알고리즘의 통합을 통해 VRPD와 같은 복잡한 최적화 문제를 효과적으로 해결할 수 있음을 보여준다.
Stats
고객 수가 100개일 때 SmartPathfinder는 기존 휴리스틱 알고리즘 대비 최대 23.7%의 총 운영 시간 단축을 달성했다.
고객 수가 100개일 때 SmartPathfinder는 기존 휴리스틱 알고리즘 대비 최대 27.3%의 계산 시간 단축을 달성했다.
Quotes
"강화 학습 프레임워크와 휴리스틱 알고리즘의 통합은 솔루션의 품질과 계산 속도를 동시에 향상시킬 수 있다."
"SmartPathfinder는 최대 200개의 고객 위치에 대해서도 효과적으로 작동하는 것을 확인했다."