Core Concepts
안정 확산 모델의 내부 표현은 ImageNet-1k 모델과 유사한 수준의 인간 정렬을 보이며, 중간 업샘플링 블록에서 가장 높은 정렬을 나타냄. 또한 텍스트 조건화는 높은 노이즈 수준에서 정렬을 개선함.
Abstract
이 연구는 안정 확산 모델의 내부 표현이 인간의 유사성 판단과 어느 정도 정렬되는지 분석합니다. 주요 발견은 다음과 같습니다:
안정 확산 모델의 내부 표현은 ImageNet-1k 모델과 유사한 수준의 인간 정렬을 보입니다. 이는 모델의 뛰어난 성능에 비해 낮은 수준입니다.
모델의 중간 업샘플링 블록에서 가장 높은 정렬이 관찰되었습니다. 이는 이 층이 의미 있는 표현을 포함하고 있음을 시사합니다.
텍스트 조건화는 높은 노이즈 수준에서 정렬을 개선합니다. 이는 추상적인 텍스트 정보가 초기 생성 단계에서 중요함을 보여줍니다.
이 결과는 안정 확산 모델이 대규모 멀티모달 데이터로 학습되었음에도 불구하고 선형적으로 해석 가능한 표현 공간을 가지고 있지 않음을 시사합니다. 향후 연구에서는 모델 구조와 학습 목적이 표현 정렬에 미치는 영향을 더 깊이 있게 탐구할 필요가 있습니다.
Stats
최대 달성 가능한 odd-one-out 정확도는 67.22% ± 1.04%입니다.
SD1.5, SD2.1, SDT 모델의 최고 odd-one-out 정확도는 각각 45.31%, 43.29%, 45.47%입니다.
텍스트 조건화 후 SD2.1 모델의 odd-one-out 정확도는 최대 57.24%까지 향상되었습니다.
Quotes
"안정 확산 모델의 내부 표현은 ImageNet-1k 모델과 유사한 수준의 인간 정렬을 보입니다."
"모델의 중간 업샘플링 블록에서 가장 높은 정렬이 관찰되었습니다."
"텍스트 조건화는 높은 노이즈 수준에서 정렬을 개선합니다."