핵심 개념
대규모 모델을 활용한 예시 기반 없는 새로운 온라인 지속 학습 알고리즘(AEF-OCL)은 자율 주행과 같이 데이터 불균형 문제가 있는 상황에서 효율적인 지속 학습을 가능하게 한다.
초록
대규모 모델 기반 온라인 분석적 예시 기반 없는 지속 학습을 통한 불균형 자율 주행 작업 처리
본 연구 논문은 자율 주행과 같이 데이터 불균형 문제가 두드러지는 분야에서 발생하는 온라인 지속 학습(OCL) 문제를 해결하기 위한 새로운 알고리즘인 AEF-OCL(Analytic Exemplar-Free Online Continual Learning)을 제안한다.
AEF-OCL은 대규모 사전 학습 모델(예: ViT)에서 추출한 특징을 분류하기 위해 릿지 회귀를 분류기로 사용하는 분석적 학습 방식을 채택한다.
핵심 구성 요소는 다음과 같다.
고정된 백본 네트워크: 이미지에서 특징을 추출하기 위해 ImageNet-1k에서 사전 학습된 ViT-large/16과 같은 대규모 모델을 사용하며, 학습 과정 동안 가중치는 고정된다.
릿지 회귀 분류기: 기존 분류기를 대체하여 특징을 분류하는 데 사용되며, 재귀적으로 업데이트되어 새로운 데이터를 학습하면서 이전 지식을 유지한다.
의사 특징 생성기(PFG): 데이터 불균형 문제를 해결하기 위해 각 클래스의 특징 분포를 재귀적으로 추정하고, 소수 클래스에 대해 의사 특징을 생성하여 균형 잡힌 데이터 세트를 만든다.