현대 대규모 언어 모델은 다양한 사용자 작업을 가능하게 하는 복잡한 지침을 따를 수 있지만, 대부분의 정보 검색 모델은 여전히 질의만을 입력으로 받고 있다. 우리는 FOLLOWIR 데이터셋을 통해 지침 따르기 능력을 평가하고 향상시킬 수 있는 방법을 제시한다.