본 연구는 신경 조합 최적화(NCO) 기법의 대규모 일반화 성능을 향상시키기 위해 노력하였다. 기존 NCO 방법은 소규모 문제 인스턴스에 대해서는 좋은 성능을 보이지만, 대규모 문제 인스턴스에 대해서는 성능이 크게 저하되는 문제가 있었다.
이를 해결하기 위해 본 연구에서는 다음과 같은 기여를 하였다:
인스턴스 조건부 적응 모듈(ICAM)을 설계하여, 문제 인스턴스의 규모와 노드 간 거리 정보를 인코더와 디코더에 효과적으로 통합하였다. 이를 통해 모델이 문제 특성을 더 잘 이해하고 대응할 수 있게 하였다.
3단계의 효율적인 강화학습 기반 훈련 체계를 개발하였다. 이를 통해 레이블이 없는 상황에서도 모델이 문제 규모에 따른 특징을 효과적으로 학습할 수 있게 하였다.
실험 결과, 제안 모델은 기존 방법들에 비해 대규모 문제 인스턴스에서 우수한 성능을 보였다. 특히 여행 외판원 문제(TSP)와 용량제한 차량 경로 문제(CVRP)의 1,000개 노드 이상 문제에서 최고의 성능을 달성하였다.
To Another Language
from source content
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Changliang Z... lúc arxiv.org 05-06-2024
https://arxiv.org/pdf/2405.01906.pdfYêu cầu sâu hơn