CHARM 벤치마크를 통해 대규모 언어 모델의 중국어 상식 추론 능력을 종합적이고 심층적으로 평가하였으며, 언어 모델의 언어 지향성과 과제 영역이 프롬프트 전략의 효과에 영향을 미친다는 것을 발견하였다. 또한 기억과 추론 간의 밀접한 관계를 분석하여 언어 모델의 강점과 약점을 명확히 파악하였다.