핵심 개념
엔트로피 기반 테스트 시간 적응 기법을 클러스터링 관점에서 해석하고, 이를 바탕으로 초기 할당, 근접 이웃 정보, 이상치, 배치 크기 문제를 해결하는 개선 방안을 제안한다.
초록
이 논문은 엔트로피 기반 테스트 시간 적응(EBTTA) 기법을 클러스터링 관점에서 해석하고 이를 바탕으로 개선 방안을 제안한다.
-
EBTTA 기법의 순방향 과정은 테스트 샘플에 대한 라벨 할당으로, 역방향 과정은 할당된 샘플을 이용한 모델 업데이트로 해석할 수 있다.
-
이러한 해석을 통해 EBTTA 기법의 초기 할당, 근접 이웃 정보, 이상치, 배치 크기 문제에 대한 이해를 높일 수 있다.
-
이를 바탕으로 강건한 라벨 할당, 지역성 보존 제약, 샘플 선택, 그래디언트 누적 기법을 제안한다.
-
제안 기법은 다양한 벤치마크 데이터셋에서 기존 EBTTA 기법 대비 일관된 성능 향상을 보인다.
통계
엔트로피 최소화는 각 샘플의 가장 큰 확률을 더 증가시키고 다른 클래스의 확률을 감소시킨다.
배치 크기가 1일 때 TENT가 성능이 나쁜 이유는 가장 큰 확률만 증가시키기 때문이다.
배치 크기가 크면 여러 샘플의 평균 그래디언트로 모델을 업데이트하므로 클래스 할당이 변경될 수 있다.
인용구
"엔트로피 손실은 각 샘플의 불확실성을 줄이기 위해 가장 큰 확률을 더 증가시키려 한다."
"배치 크기가 1일 때 TENT가 성능이 나쁜 이유는 가장 큰 확률만 증가시키기 때문이다."
"배치 크기가 크면 여러 샘플의 평균 그래디언트로 모델을 업데이트하므로 클래스 할당이 변경될 수 있다."