이 연구는 대규모 언어 모델(LLM)을 활용하여 차량 경로 문제(VRP)를 해결하는 방법을 제안한다.
먼저, 10개의 단일 차량 VRP와 11개의 다중 차량 VRP로 구성된 21가지 VRP 유형의 데이터셋을 구축하였다. 이를 통해 LLM의 VRP 해결 능력을 평가할 수 있는 기반을 마련하였다.
다음으로, 4가지 기본 프롬프트 패러다임을 제안하고 평가하였다. 그 결과, 자연어 기반 프롬프트가 가장 좋은 성능을 보였다. GPT-4의 경우 56%의 실행 가능성, 40%의 최적성, 53%의 효율성을 달성하였다. 반면 Gemini 1.0 Pro는 1% 미만의 성능을 보였다.
이어서, LLM의 성능을 향상시키기 위한 자기 디버깅 및 자기 검증 프레임워크를 제안하였다. 이 프레임워크를 통해 GPT-4의 성능이 실행 가능성 16%, 최적성 7%, 효율성 15% 향상되었다. 그러나 Gemini 1.0 Pro의 성능은 개선되지 않았다.
또한 과제 설명에 포함된 세부 정보가 LLM의 성능에 미치는 영향을 분석하였다. 세부 정보를 제거하면 GPT-4의 성능이 실행 가능성 4%, 최적성 4%, 효율성 5% 감소하는 것으로 나타났다. 이를 해결하기 위해 LLM이 사용자와 상호작용하며 과제 설명을 보완하는 메커니즘을 제안하였다.
마지막으로, 최근 성능이 우수한 것으로 알려진 Claude 3 모델의 VRP 해결 능력을 평가하였다. 그 결과 Claude 3의 성능은 GPT-4보다 낮은 것으로 나타났다.
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問