DiPaCo는 계산을 경로 단위로 분산시키고 모듈 간 통신을 최소화하는 새로운 모듈식 신경망 아키텍처와 최적화 알고리즘이다. 이를 통해 분산 환경에서 효율적으로 대규모 모델을 학습할 수 있다.