THOUGHTSCULPT은 몬테카를로 트리 탐색(MCTS)을 활용하여 잠재적 솔루션의 검색 트리를 탐색한다. 솔루션을 구성하는 각 행동을 평가하고, 도메인 특정 휴리스틱(일반적으로 LLM 평가기)에 따라 점수를 매긴다. 중요한 점은 THOUGHTSCULPT의 행동 공간에 수정 행동이 포함된다는 것이다. 즉, THOUGHTSCULPT은 이전 출력의 일부를 수정하는 것을 선택할 수 있다.
실험 결과, THOUGHTSCULPT은 세 가지 까다로운 과제에서 최신 추론 방법들을 능가했다: 스토리 개요 개선(흥미도 최대 +30% 향상), 미니 크로스워드 풀이(단어 성공률 최대 +16% 향상), 제약된 생성(개념 적용률 최대 +10% 향상).
Til et annet språk
fra kildeinnhold
arxiv.org
Viktige innsikter hentet fra
by Yizhou Chi,K... klokken arxiv.org 04-10-2024
https://arxiv.org/pdf/2404.05966.pdfDypere Spørsmål