대형 언어 모델의 안전성 평가 시 다중 선택형 문제와 개방형 문제 간 성능 차이가 크게 나타나는 이유는 모델이 단순히 안전 데이터의 답변 스타일을 기억하고 있을 뿐 실제 인간의 가치 선호도를 깊이 있게 이해하지 못하기 때문이다.