이 논문은 절차적 계획 문제를 다룬다. 절차적 계획은 고수준 목표를 일련의 일관되고 논리적이며 목표 지향적인 단계로 분해하는 작업이다. 최근 접근법은 이 작업을 조건부 언어 생성 문제로 모델링하고 있지만, 계산 비용이 높고 모델 매개변수에 대한 접근성이 제한적이라는 단점이 있다.
이 논문에서는 PLASMA라는 새로운 프레임워크와 모델을 제안한다. PLASMA는 두 단계로 구성된다:
기호적 절차적 지식 증류: 큰 언어 모델에서 절차적 지식을 추출하고 작은 언어 모델에 전달한다. 이를 위해 지식 언어화와 지식 증류 단계를 거친다.
구조화된 추론을 위한 새로운 추론 시간 알고리즘: 표준 다음 토큰 예측 목적이 계획의 인과적 및 시간적 추론 능력을 충분히 갖추지 못한다는 문제를 해결하기 위해, 단계별 검증기 기반 빔 탐색 알고리즘을 개발한다.
실험 결과, 이 접근법은 작은 언어 모델에 계획 능력을 효과적으로 부여할 수 있음을 보여준다. 표준 계획 작업에서 작은 학생 모델은 교사 모델보다 평균 17.57% 더 나은 성능을 보였다. 또한 제약된 및 반사실적 계획 작업에서도 각각 93%와 86%의 유효성 비율을 달성했다. 마지막으로 VirtualHome 환경에서 이 모델은 이전 연구 결과를 크게 능가했다.
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Faeze Brahma... kl. arxiv.org 09-19-2024
https://arxiv.org/pdf/2305.19472.pdfDybere Forespørgsler