Core Concepts
단일 GPU로 대규모 얼굴 인식 모델을 효율적이고 정확하게 학습할 수 있는 Moving Haar 학습률 스케줄러를 제안한다.
Abstract
이 논문은 대규모 얼굴 인식 학습을 위한 Moving Haar 학습률 스케줄러(MHLR)를 소개한다. MHLR은 학습 과정에서 학습률을 신속하고 정확하게 조정하여 모델 수렴 시간을 단축할 수 있다. 그 결과, MHLR은 1% 미만의 정확도 손실로 원래 학습 시간의 1/4만에 모델을 학습할 수 있다.
논문은 다음과 같이 구성된다:
대규모 얼굴 인식 학습의 문제점을 설명하고, 이를 해결하기 위한 MHLR 접근법을 제안한다.
MHLR의 핵심 구성 요소인 지수 이동 평균(EMA)과 Haar 컨볼루션 커널(HCK)을 소개한다.
MHLR 알고리즘을 설명하고, 다양한 실험을 통해 효율성과 효과성을 검증한다.
MHLR을 다른 최신 얼굴 인식 방법과 비교하여, 단일 GPU에서도 대규모 학습이 가능함을 보여준다.
Stats
단일 GPU에서 ResNet100 모델을 5 epoch 학습하는데 걸리는 시간은 MS1MV3에서 9시간, WebFace12M에서 30시간이다.
단일 GPU에서 ResNet100 모델을 5 epoch 학습한 경우, IJB-C 데이터셋에서의 정확도는 MS1MV3에서 96.41%, WebFace12M에서 97.20%이다.
Quotes
"MHLR은 단일 GPU로도 대규모 얼굴 인식 학습을 가능하게 하여, 많은 연구자들이 대규모 학습에 참여할 수 있는 문을 열어준다."
"대규모 얼굴 인식 학습은 이제 수익체감의 법칙에 직면하고 있다. 즉, 모델 성능을 조금만 개선하기 위해서는 비용이 급격히 증가한다."