Core Concepts
다수 레이블 학습(LML)은 가방 내 인스턴스의 다수 클래스를 가방 레이블로 사용하여 각 인스턴스의 클래스를 예측하는 문제이다. 기존 다중 인스턴스 학습 방법은 이 문제에 적합하지 않아 정확도가 낮다. 이를 해결하기 위해 제안한 카운팅 네트워크는 인스턴스의 클래스를 세는 방식으로 가방 레이블을 예측하여 기존 방법보다 높은 정확도를 달성했다.
Abstract
이 논문은 다중 인스턴스 학습(MIL)의 새로운 문제인 다수 레이블 학습(LML)을 제안한다. LML은 가방 내 인스턴스의 다수 클래스를 가방 레이블로 사용하여 각 인스턴스의 클래스를 예측하는 문제이다.
기존 MIL 방법은 LML 문제에 적합하지 않다. 이들 방법은 인스턴스 신뢰도를 합산하여 가방 레이블을 예측하지만, 이는 인스턴스 개수 기반 다수 클래스와 일치하지 않아 정확도가 낮다.
이를 해결하기 위해 제안한 카운팅 네트워크는 인스턴스의 클래스를 세는 방식으로 가방 레이블을 예측한다. 온도 매개변수가 적용된 소프트맥스 함수를 사용하여 인스턴스 출력을 0 또는 1에 가깝게 만들어 정확한 카운팅이 가능하도록 했다. 이를 통해 기존 방법보다 높은 정확도를 달성했다.
실험 결과, 제안 방법은 4개 데이터셋에서 기존 MIL 방법보다 우수한 성능을 보였다. 또한 카운팅 연산과 arg max 연산의 효과를 검증하는 실험을 수행했다.
Stats
다수 클래스 비율이 작은 경우 기존 방법의 다수 클래스 과대추정 문제가 심각했다.
제안 방법은 이 문제를 효과적으로 해결하여 정확도를 크게 향상시켰다.