핵심 개념
제안된 방법은 적대적 지우기와 가짜 레이블을 활용하여 전체 물체 영역을 효과적으로 추정할 수 있다.
초록
이 논문은 약한 감독 하 물체 위치 추정 문제를 다룬다. 제안된 프레임워크는 특징 추출기, 분류기, 위치 추정기로 구성된다. 분류기는 이미지 수준의 클래스 예측을, 위치 추정기는 픽셀 수준의 클래스 확률 맵을 출력한다.
이미지 수준의 클래스 레이블만 있는 상황에서 위치 추정기를 정확하게 학습하기 어려운 문제를 해결하기 위해, 제안 방법은 적대적 지우기와 가짜 레이블을 활용한다.
적대적 지우기는 분류기의 가장 판별적인 영역에 대한 의존도를 낮추고 전체 물체 영역을 활성화하도록 한다. 가짜 레이블은 배경 영역의 활성화를 억제하고 물체 영역의 활성화를 높이는 데 사용된다.
제안 방법은 MobileNetV1과 InceptionV3 백본 네트워크에 적용되었으며, ILSVRC-2012, CUB-200-2011, PASCAL VOC 2012 데이터셋에서 기존 최신 방법들을 능가하는 성능을 보였다.
통계
제안 방법은 CUB-200-2011 데이터셋에서 MobileNetV1 백본으로 Top-1 71.28%, Top-5 87.00%, GT-known 93.03%의 성능을 달성했다.
제안 방법은 ILSVRC-2012 데이터셋에서 MobileNetV1 백본으로 Top-1 53.74%, Top-5 67.11%, GT-known 72.31%의 성능을 달성했다.
제안 방법은 CUB-200-2011 데이터셋에서 InceptionV3 백본으로 Top-1 73.79%, Top-5 87.99%, GT-known 94.08%의 성능을 달성했다.
제안 방법은 ILSVRC-2012 데이터셋에서 InceptionV3 백본으로 Top-1 58.85%, Top-5 69.50%, GT-known 72.52%의 성능을 달성했다.
인용구
"제안된 프레임워크는 특징 추출기, 분류기, 위치 추정기로 구성된다."
"적대적 지우기는 분류기의 가장 판별적인 영역에 대한 의존도를 낮추고 전체 물체 영역을 활성화하도록 한다."
"가짜 레이블은 배경 영역의 활성화를 억제하고 물체 영역의 활성화를 높이는 데 사용된다."