Core Concepts
토큰 없는 LLM 기반의 CharPoet 시스템은 형식과 내용을 동시에 효과적으로 제어할 수 있다.
Abstract
기존 시스템은 키워드 입력에 의존하여 내용 제어가 제한적이었지만, LLM은 복잡한 지시에 따라 다양한 시를 생성할 수 있다.
그러나 토큰 기반 LLM은 시의 형식 요구사항을 엄격히 준수하기 어려운 문제가 있다.
CharPoet은 토큰 없는 LLM 아키텍처를 사용하여 문자 단위로 생성함으로써 형식 정확도를 높였다.
기존 토큰 기반 LLM을 가지치기하여 토큰 없는 모델을 만들었으며, 이를 통해 사전 학습된 능력을 계승하고 복잡한 지시에 따라 시를 생성할 수 있다.
CharPoet은 형식 정확도 0.96 이상을 달성하여 다른 모델들을 능가했으며, 내용 품질 측면에서도 기존 시스템과 비슷한 수준을 보였다.
Stats
토큰 기반 모델은 한 번에 여러 문자를 출력할 수 있어 문자 수 제어가 어려움
토큰 없는 모델은 한 번에 최대 1개의 문자를 출력하므로 문자 수 제어가 용이함
Quotes
"토큰 없는" 모델은 문자 또는 바이트 단위로만 작동하며, 일반적인 토큰과 대조된다.
토큰 없는 아키텍처를 통해 모델은 문자 수를 정확하게 제어할 수 있다.