핵심 개념
PipeFusion은 디퓨전 트랜스포머 모델의 추론 속도를 향상시키기 위해 입력 시간적 중복성을 활용한 새로운 패치 레벨 파이프라인 병렬 처리 방식을 제시합니다.
초록
PipeFusion: 디퓨전 트랜스포머 추론을 위한 패치 레벨 파이프라인 병렬 처리 연구 논문 요약
Jiarui Fang, JinZhe Pan, Jiannan Wang, Aoyu Li, Xibo Sun. (2024). PipeFusion: Patch-level Pipeline Parallelism for Diffusion Transformers Inference. arXiv preprint arXiv:2405.14430v3.
본 연구는 고해상도 이미지 생성 시 디퓨전 트랜스포머(DiT) 모델의 높은 지연 시간 문제를 해결하고자 합니다. 특히, 기존 병렬 처리 방식의 단점을 극복하고 입력 시간적 중복성을 활용하여 효율적인 DiT 추론을 위한 새로운 병렬 처리 방법론을 제시하는 것을 목표로 합니다.