핵심 개념
대규모 언어 모델의 사실성은 시간이 지남에 따라 저하되므로, 특정 단순(원자적) 사실을 모델에 삽입, 교체 또는 제거하는 사실 업데이트 작업이 필요하다.
초록
이 논문은 Wikidata 지식베이스의 변화를 반영하는 WikiFactDiff라는 새로운 데이터셋을 소개한다. 이 데이터셋은 새로운 사실, 폐기된 사실, 정적 사실 등 3가지 유형의 기본 업데이트를 포함하며, 다양한 업데이트 시나리오를 제공한다.
- 주어-관계-객체 트리플로 표현된 사실들은 자연어 문장으로 언어화되어 있으며, 업데이트 알고리즘 실행과 평가 지표 계산을 가능하게 한다.
- 기존 데이터셋과 달리 WikiFactDiff는 교체, 보관, 새 개체 삽입 등 다양한 현실적인 업데이트 시나리오를 포함한다.
- 실험을 통해 기존 업데이트 알고리즘의 성능을 평가하고 기준을 제시한다.
통계
일본의 인구는 125.96M에서 125.44M로 변경되었습니다.
크리스티아누 호날두는 포르투갈 국가대표팀의 멤버가 되었습니다.
도널드 트럼프는 더 이상 미국의 정부 수반이 아닙니다. 조 바이든이 새로운 정부 수반이 되었습니다.
ChatGPT는 새로운 언어 모델 인스턴스입니다.