Core Concepts
데이터 없는 클래스 증분 학습 문제에서 사용자 정의 설정에 가장 적합한 알고리즘을 추천하기 위해 미래 데이터 스트림을 시뮬레이션하는 방법을 제안한다.
Abstract
이 논문은 데이터 없는 클래스 증분 학습(DFCIL) 문제에 대한 알고리즘 추천 방법을 제안한다. DFCIL은 과거 클래스의 샘플을 저장할 수 없는 경우의 연속적인 데이터 스트림 문제이다.
사용자가 제공한 DFCIL 설정(증분 단계 수, 단계당 클래스 수 등)과 초기 클래스 집합을 바탕으로, 제안 방법은 미래 클래스를 시뮬레이션하여 데이터 스트림을 생성한다.
생성된 데이터 스트림에서 다양한 DFCIL 알고리즘의 성능을 평가하고, 가장 우수한 성능을 보이는 알고리즘을 추천한다.
3개의 대규모 데이터셋과 6개의 증분 시나리오에 대한 실험 결과, 제안 방법은 기존 알고리즘 중 가장 우수한 성능을 보이는 알고리즘을 선택하는 오라클 방법과 유사한 성능을 달성한다.
이 연구는 DFCIL 알고리즘 배포를 용이하게 하고, 실제 응용 분야에 적합한 알고리즘을 선택할 수 있게 한다.
Stats
이 연구에서는 3개의 대규모 데이터셋(ILSVRC, iNaturalist 2018, Google Landmarks v2)을 사용하였다.
각 데이터셋에서 1,000개 클래스를 샘플링하여 IN1k, iNat1k, Land1k 데이터셋을 구성하였다.
각 데이터셋의 클래스당 평균 이미지 수는 350, 310, 330개이다.