대규모 언어 모델을 활용하여 문서 관련성 판단, 질의 생성, 검색 세션 시뮬레이션 등 정보 검색 평가 방법을 개선할 수 있다. 이를 통해 기존 평가 방식의 한계를 극복하고 더 현실적이고 정확한 평가가 가능해질 것으로 기대된다.