이 논문은 온라인 지속 학습 환경에서 레이블 지연 문제를 다룬다. 레이블 지연은 실제 세계 시나리오에서 자주 발생하는 문제로, 데이터 수집 후 레이블 지정 과정의 지연으로 인해 발생한다.
저자들은 먼저 레이블 지연이 모델 성능에 미치는 영향을 분석한다. 실험 결과, 레이블 지연이 증가할수록 모델 성능이 크게 저하되는 것을 확인했다. 단순히 계산 자원을 늘리는 것만으로는 이 문제를 해결할 수 없다.
이어서 저자들은 레이블 지연 문제를 해결하기 위해 다양한 접근법을 시도한다. 준지도 학습 기법인 Pseudo-Labeling, 자기 지도 학습 기법인 Self-Supervised Semi-Supervised Learning, 그리고 Test-Time Adaptation 기법 등을 적용해 보았지만, 기존 Naïve 방법에 비해 성능 향상을 달성하지 못했다.
이에 저자들은 Importance Weighted Memory Sampling(IWMS)이라는 새로운 방법을 제안한다. IWMS는 메모리 버퍼에서 가장 최근 입력 데이터와 유사한 레이블 데이터를 선별적으로 샘플링하여 학습에 활용한다. 실험 결과, IWMS는 다른 방법들에 비해 레이블 지연으로 인한 성능 저하를 효과적으로 극복할 수 있었다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문