본 논문은 알 수 없는 에이전트와의 협업을 위해 능동적인 목표 추론 및 제로 샷 정책 적응 기법을 제안한다. 이를 통해 AI 에이전트가 알 수 없는 에이전트의 잠재적인 목표/보상을 추론하고, 이를 활용하여 최적의 협업 정책을 학습할 수 있다.