이 논문은 지역 휴리스틱 A* (LoHA*)라는 최근 방법론을 더욱 발전시킨 데이터 효율적인 지역 휴리스틱 A* (DE-LoHA*)를 제안한다.
LoHA는 전체 휴리스틱 대신 "지역" 잔차 휴리스틱을 학습하여 지역 최소값 문제를 해결한다. 하지만 LoHA는 많은 수의 오라클 A* 호출을 통해 학습 데이터를 수집해야 한다는 단점이 있다.
DE-LoHA는 A 검색 중 발생하는 지역 계획 문제를 활용하여 데이터를 효율적으로 수집한다. 전역 A* 검색 중 상태를 확장할 때마다 해당 상태가 지역 계획 문제의 해결책인지 확인하고, 그렇다면 해당 데이터를 학습 데이터로 활용한다. 이를 통해 기존 방식 대비 10배 이상 적은 작업으로 동일한 양의 데이터를 수집할 수 있다.
또한 DE-LoHA는 온라인 학습이 가능하다. 전역 A 검색 중 수집한 데이터를 활용하여 지역 휴리스틱 모델을 지속적으로 개선할 수 있다. 실험 결과, DE-LoHA*는 100회 미만의 계획 문제 해결만으로도 성능 향상을 달성할 수 있었다.
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Rishi Veerap... kl. arxiv.org 04-11-2024
https://arxiv.org/pdf/2404.06728.pdfDybere Forespørgsler