Core Concepts
본 연구는 사전 학습된 주요 객체 탐지 모델과 군중 기반 패치 레이블링을 결합하여 이미지 내 인간의 주의력 영역을 효율적으로 추출하고, 이를 통해 편향된 데이터셋에서 학습된 모델의 성능을 향상시킬 수 있음을 보여준다.
Abstract
본 연구는 이미지 분류 문제에서 발생하는 데이터셋 편향 문제를 해결하기 위해 인간의 주의력 영역을 효율적으로 추출하는 방법을 제안한다.
먼저 사전 학습된 주요 객체 탐지 모델을 이용하여 이미지 내 주요 관심 영역을 자동으로 추출한다. 이때 사람의 검증을 통해 정확성을 높인다. 이후 이미지를 작은 패치로 나누고 군중 작업자들에게 각 패치에 목표 객체가 포함되어 있는지 여부를 질문한다. 이를 통해 인간의 주의력 영역을 점진적으로 추출한다.
제안 방법의 실험 결과, 추출된 인간 주의력 영역을 활용하여 모델을 학습시킬 경우 편향된 데이터셋에서도 높은 성능을 보였다. 또한 군중 작업을 통해 기존 폴리곤 기반 객체 경계 레이블링 대비 최대 30배 빠른 레이블링이 가능함을 확인했다.
추가적으로 제안 방법은 군중 작업 환경에서의 오류 필터링, 병렬 처리를 통한 효율성 향상, 다양한 플랫폼에서의 적응성 등의 장점을 가진다.
Stats
제안 방법을 통해 데이터셋 레이블링 시간을 기존 폴리곤 방식 대비 최대 30배 단축할 수 있다.
제안 방법은 개인차가 적어 일관된 성능을 보이지만, 폴리곤 방식은 개인차가 크다.
Quotes
"데이터셋에 편향이 존재하면 모델이 잘못된 규칙을 학습하게 되어 일반화 성능이 저하된다."
"제안 방법은 사전 학습된 주요 객체 탐지 모델과 군중 기반 패치 레이블링을 결합하여 인간의 주의력 영역을 효율적으로 추출할 수 있다."
"추출된 인간 주의력 영역을 활용하여 모델을 학습시킬 경우 편향된 데이터셋에서도 높은 성능을 보였다."