Core Concepts
전이 가능한 지역 정책과 전역 정책을 결합한 앙상블 접근을 통해 차량 경로 문제에 대한 일반화 성능을 크게 향상시킬 수 있다.
Abstract
이 논문은 차량 경로 문제(VRP)를 해결하기 위한 신경망 기반 접근법을 제안한다. 기존의 신경망 기반 VRP 솔버는 합성 문제 인스턴스에 초점을 맞추어 개발되어 실세계 문제에 적용하기 어려운 문제가 있었다. 이를 해결하기 위해 저자들은 전이 가능한 지역 정책과 전역 정책을 결합한 앙상블 접근법을 제안한다.
지역 정책은 현재 노드의 근접 이웃 노드들에 초점을 맞추어 학습되며, 이는 노드 분포와 문제 규모에 덜 민감한 특성을 학습할 수 있다. 전역 정책은 전체 VRP 인스턴스의 정보를 활용하여 학습되며, 문제 내부의 강력한 학습 능력을 가진다. 두 정책을 결합한 앙상블 접근법은 이러한 장점들을 효과적으로 활용하여 일반화 성능을 크게 향상시킬 수 있다.
실험 결과, 제안된 방법은 TSPLIB와 CVRPLIB 벤치마크에서 기존 최신 방법들을 크게 능가하는 성능을 보였다. 특히 복잡한 노드 분포와 대규모 문제 인스턴스에서 뛰어난 일반화 성능을 보였다. 또한 실세계 문제에서도 우수한 성능을 보였다.
Stats
제안된 앙상블 정책은 CVRPLIB 벤치마크에서 기존 최신 방법 대비 0.53%의 격차 감소를 보였다.
제안된 앙상블 정책은 TSPLIB 벤치마크에서 기존 최신 방법 대비 1.50%의 격차 감소를 보였다.
제안된 앙상블 정책은 실세계 CVRP 인스턴스에서 기존 최신 방법 대비 최대 8.20%의 격차 감소를 보였다.
Quotes
"전이 가능한 지역 정책과 전역 정책을 결합한 앙상블 접근법은 이러한 장점들을 효과적으로 활용하여 일반화 성능을 크게 향상시킬 수 있다."
"실험 결과, 제안된 방법은 TSPLIB와 CVRPLIB 벤치마크에서 기존 최신 방법들을 크게 능가하는 성능을 보였다. 특히 복잡한 노드 분포와 대규모 문제 인스턴스에서 뛰어난 일반화 성능을 보였다."