언어 모델 기반 지침 따르기 시스템의 성능을 제3자가 정확하게 예측하기는 매우 어려운 과제이다.
언어 모델 기반 지침 따르기 시스템의 성능을 제3자가 예측할 수 있는 프레임워크를 제안한다.