언어 모델이 장문 생성 시 자신의 주장에 대한 신뢰도를 자연어로 표현할 수 있도록 학습하여, 사용자의 의사결정을 개선할 수 있다.
언어 모델의 전반적인 보정 성능은 우수하지만, 특정 도메인에서 심각한 과신 또는 과소신 문제가 발생할 수 있다. 이를 해결하기 위해 소량의 데이터만으로도 언어 모델의 도메인 특화 보정이 가능한 새로운 프레임워크를 제안한다.
LITCAB은 언어 모델의 마지막 레이어 출력에 단일 선형 레이어를 추가하여 출력 로짓을 조정함으로써 모델 보정을 향상시킨다. 이는 모델 전체를 재학습할 필요 없이 효율적으로 보정을 수행할 수 있다.