정보 추출 작업에서 기존 평가 방식의 한계를 극복하고자 주관식 질문 교정 데이터를 활용하여 생성 언어 모델을 정교하게 매칭하고, 자연어 추론 모델을 통해 데이터셋의 불완전성을 보완하는 새로운 평가 방법인 SQC-Score를 제안한다.