WikiFactDiff는 2021년 1월 4일과 2023년 2월 27일 사이의 사실 지식 변화를 나타내는 327K개의 업데이트로 구성된 대규모 데이터셋이다. 이는 새로운 사실 삽입, 기존 사실 폐기, 사실 대체 등 다양한 업데이트 시나리오를 포함하며, 언어 모델의 사실 지식 업데이트 연구를 위한 현실적이고 시간 적응형 벤치마크를 제공한다.
WikiFactDiff는 2021년 1월 4일과 2023년 2월 27일 사이의 사실 지식 변화를 나타내는 327,000개의 업데이트로 구성된 대규모 데이터셋이다. 이는 새로운 사실 삽입, 기존 사실 폐기, 사실 대체 등 다양한 업데이트 시나리오를 포함하며, 언어 모델의 시간 종속적 특성을 해결하는 데 활용될 수 있다.
대규모 언어 모델의 사실성은 시간이 지남에 따라 저하되므로, 특정 단순(원자적) 사실을 모델에 삽입, 교체 또는 제거하는 사실 업데이트 작업이 필요하다.