분산 환경에서 N개의 에이전트가 독립적으로 마르코프 체인을 샘플링하고 TD(λ) 알고리즘을 실행할 때, 에이전트들이 최종적으로 결과를 평균화하는 것만으로도 중앙집중형 대비 N배 빠른 수렴 속도를 달성할 수 있다.