핵심 개념
Transformer 기반 Diffusion Probabilistic Models (DPM)은 높은 이미지 생성 성능을 보이지만, CNN 기반 DPM보다 많은 계산량을 요구합니다. 본 논문에서는 Transformer 기반 DPM의 계산 효율성을 향상시키기 위해, 경량화된 Diffusion Transformer 아키텍처, 훈련 없이 적용 가능한 Attention Modulation Matrix (AMM), 토큰 관계 향상 마스킹 훈련 전략을 포함하는 Efficient Diffusion Transformer (EDT) 프레임워크를 제안합니다.
초록
EDT: 인간 스케치 방식에서 영감을 받은 효율적인 Diffusion Transformer 프레임워크
Chen, X., Liu, N., Zhu, Y., Feng, F., & Tang, J. (2024). EDT: An Efficient Diffusion Transformer Framework Inspired by Human-like Sketching. Advances in Neural Information Processing Systems, 38.
본 연구는 Transformer 기반 Diffusion Probabilistic Models (DPM)의 높은 계산 비용 문제를 해결하고자, 이미지 합성 성능 저하 없이 계산 효율성을 향상시키는 Efficient Diffusion Transformer (EDT) 프레임워크를 제안합니다.