BIRCO 벤치마크는 다양한 복잡한 목표를 가진 정보 검색 작업을 평가하기 위해 설계되었으며, 기존 벤치마크보다 더 높은 난이도를 제공한다. 이를 통해 대규모 언어 모델 기반 정보 검색 시스템의 성능을 효과적으로 측정할 수 있다.