이 연구는 이미지 생성 모델에 대한 제어 기능을 추가하는 새로운 방법을 제안합니다. 기존 방식은 특징 공간 조작을 통해 제어를 추가했지만, 이 연구에서는 신경망 가중치 조작을 통해 제어를 추가합니다.
구체적으로, 연구진은 조건 인식 신경망(CAN)이라는 새로운 방법을 제안했습니다. CAN은 입력 조건(예: 클래스 레이블, 시간 단계 등)을 기반으로 합성곱/선형 레이어의 가중치를 동적으로 생성합니다. 이를 통해 입력 조건에 따라 신경망의 동작을 유연하게 조절할 수 있습니다.
연구진은 CAN을 기존 확산 변환기 모델(DiT, UViT)에 적용하여 성능을 크게 향상시켰습니다. 또한 CAN과 EfficientViT를 결합한 새로운 모델 CaT를 제안했는데, CaT는 DiT-XL/2 대비 52배 적은 연산량으로 더 나은 성능을 달성했습니다.
이 연구는 이미지 생성 모델의 제어 기능을 크게 향상시키는 새로운 접근법을 제시했으며, 효율성 측면에서도 큰 진전을 이루었습니다.
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania