심층 학습 클러스터에서 GPU 사용 효율성을 높이기 위해 GPU 공유 시스템인 탤리를 소개하며, 탤리는 비침습적인 방식으로 고 우선순위 작업의 성능을 보장하면서 여러 작업을 단일 GPU에서 효율적으로 실행할 수 있도록 한다.