Core Concepts
잔여 연결 구조는 특징 추상화 능력을 저하시킬 수 있으며, 이를 해결하기 위해 깊이에 따라 점진적으로 잔여 연결의 기여도를 감소시키는 방법을 제안한다.
Abstract
이 논문은 잔여 연결(residual connection) 구조가 자기 지도 학습 기반 마스크 자동 인코더(Masked Autoencoder, MAE) 모델의 특징 표현 학습에 부정적인 영향을 미칠 수 있음을 보여준다. 저자들은 잔여 연결의 기여도를 깊이에 따라 점진적으로 감소시키는 방법을 제안하였다.
제안 방법의 핵심은 다음과 같다:
- 잔여 연결의 가중치를 깊이에 따라 감소시켜 깊은 층에서 더 추상적인 특징을 학습하도록 유도한다.
- 이를 통해 MAE 모델의 선형 프로빙 정확도를 기존 67.3%에서 72.3%로 크게 향상시켰다.
- 추가 실험을 통해 제안 방법이 특징의 효과적 랭크(effective rank)를 감소시켜 더 추상적인 표현을 학습할 수 있음을 보였다.
Stats
제안 방법을 적용한 MAE 모델의 ImageNet-1K 데이터셋 선형 프로빙 정확도는 72.3%로, 기존 MAE 모델의 67.3%에 비해 크게 향상되었다.
제안 방법을 적용한 ViT-S/16 모델의 ImageNet-100 데이터셋 선형 프로빙 정확도는 78.5%로, 기존 ViT-B/16 모델의 76.5%를 능가하였다.
Quotes
"잔여 연결 구조는 필수적인 역할을 하지만, 더 깊은 층에 얕은 표현의 에코를 주입함으로써 추상적 학습 능력을 저하시킬 수 있다."
"우리의 설계는 점진적인 특징 추상화 발전을 촉진하며, 네트워크 학습 가능성에는 영향을 미치지 않는다."