Grunnleggende konsepter
인간은 관련된 아이디어에서 다음 아이디어로 이동하는 정신 과정을 통해 복잡한 추론 작업을 해결하는 데 뛰어나다. 이에 영감을 받아 우리는 하위 목표 탐색(kSubS) 방법을 제안한다. 이 방법의 핵심 구성 요소는 달성 가능하고 솔루션에 더 가까운 다양한 하위 목표를 생성하는 학습된 하위 목표 생성기이다. 하위 목표를 사용하면 검색 공간이 줄어들고 효율적인 계획에 적합한 높은 수준의 검색 그래프가 생성된다.
Sammendrag
이 논문에서는 변환기 기반 하위 목표 모듈과 고전적인 최선 우선 검색 프레임워크를 결합한 kSubS를 구현한다. 우리는 k번째 단계 앞의 하위 목표를 생성하는 간단한 접근법이 소코반, 루빅스 큐브, 부등식 증명 벤치마크 INT와 같은 3가지 까다로운 도메인에서 놀랍도록 효율적임을 보여준다. kSubS는 modest한 계산 예산 내에서 INT에서 최신 기술을 능가하는 강력한 결과를 달성한다.
하위 목표 생성기는 kSubS의 핵심 구성 요소이며, 다양한 상황에서 유용하기 위해서는 학습 가능한(생성) 모델로 구현되어야 한다. 그 결과 때때로 잘못된 예측을 할 수 있으며, 이는 검색 절차를 무효화할 수 있다. 그럼에도 불구하고 우리는 변환기 기반 신경망 아키텍처의 자동 회귀 프레임워크가 까다로운 도메인에서 탁월한 결과를 낳는다는 것을 보여준다.
우리는 전문가 데이터를 사용하여 k번째 단계 앞의 상태를 예측하는 목표로 변환기를 학습시킨다. 이 하위 목표 목표의 주요 장점은 단순성과 경험적 효율성이다. 오프라인 데이터셋을 사용할 수 있는 경우(본 논문에서 고려한 환경의 경우), 이러한 접근 방식을 통해 안정적이고 효율적인 최적화가 가능하다. 또한 우리는 분포 외 일반화의 증거를 발견했다.
Statistikk
소코반 보드 크기가 20x20일 때 그래프 크기 5000에서 BF-kSubS의 성공률은 77%이다.
루빅스 큐브에서 BestFS는 10% 미만의 큐브를 해결하지만 BF-kSubS는 거의 100%를 해결한다.
INT에서 BF-kSubS는 증명 길이 15에 대해 91%의 성공률을 달성한다.
Sitater
"인간은 관련된 아이디어에서 다음 아이디어로 이동하는 정신 과정을 통해 복잡한 추론 작업을 해결하는 데 뛰어나다."
"우리는 하위 목표 탐색(kSubS) 방법을 제안한다. 이 방법의 핵심 구성 요소는 달성 가능하고 솔루션에 더 가까운 다양한 하위 목표를 생성하는 학습된 하위 목표 생성기이다."
"변환기 기반 신경망 아키텍처의 자동 회귀 프레임워크가 까다로운 도메인에서 탁월한 결과를 낳는다."