XL2Bench는 초장편 텍스트 이해와 장기 의존성 분석을 위한 포괄적인 벤치마크로, 세 가지 시나리오, 네 가지 과제, 27개의 세부 과제로 구성되어 있으며, 평균 길이가 영어로 10만 단어, 중국어로 20만 자 이상입니다.