이 연구는 올림픽 게임의 메달 기록을 활용하여 대규모 언어 모델(LLM)의 내부 지식 구조를 분석했다. 연구진은 LLM에게 두 가지 과제를 수행하게 했다: (1) 특정 팀의 메달 수 보고하기, (2) 특정 순위를 달성한 팀 식별하기.
연구 결과, 최신 LLM은 팀별 메달 수 보고 과제에서 탁월한 성능을 보였지만, 팀 순위 식별 과제에서는 큰 어려움을 겪었다. 이는 LLM의 내부 지식 구조가 인간과 근본적으로 다르다는 것을 시사한다. 즉, LLM은 메달 수 정보를 잘 저장하지만, 이를 순위 정보로 연결 짓는 데 어려움을 겪는다.
또한 연구진은 LLM의 응답에 대한 사용자의 의문 표현("Really?")이 모델의 성능을 저하시키는 것을 발견했다. 이는 LLM이 사용자의 의문에 취약하다는 것을 보여준다.
이 연구 결과는 LLM의 내부 지식 구조와 강건성 향상을 위한 향후 연구의 필요성을 강조한다. 연구진은 관련 코드, 데이터, 모델 출력을 공개하여 후속 연구를 촉진할 계획이다.
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor