Core Concepts
객체 탐지 작업에서 전경-전경 클래스 불균형 문제에 대한 진단과 효과적인 완화 전략 제시
Abstract
이 연구는 객체 탐지 작업에서 전경-전경 클래스 불균형 문제를 해결하기 위한 방안을 제시합니다.
먼저, COCO 데이터셋을 활용하여 실제 환경을 반영하는 10개 클래스의 COCO-ZIPF 데이터셋을 구축했습니다. 이 데이터셋은 실제 엣지 컴퓨팅 환경에서 요구되는 제한적인 객체 클래스 탐지 작업을 모사합니다.
이후 YOLOv5 모델을 활용하여 클래스 불균형 문제에 대한 다양한 완화 전략을 평가했습니다. 샘플링, 손실 가중치 조정, 데이터 증강 기법 등을 실험한 결과, 모자이크와 mixup 데이터 증강 기법이 YOLOv5 모델의 평균 정밀도(mAP)를 크게 향상시키는 것으로 나타났습니다. 반면, 샘플링과 손실 가중치 조정 기법은 YOLOv5 모델의 성능 향상에 효과적이지 않은 것으로 확인되었습니다.
이 연구는 객체 탐지 작업에서 전경-전경 클래스 불균형 문제를 해결하기 위한 실용적인 통찰을 제공합니다. 특히 데이터 증강 기법이 단일 단계 객체 탐지기의 성능 향상에 효과적임을 보여줍니다.
Stats
'person' 클래스의 인스턴스 수: 12,982개
'car' 클래스의 인스턴스 수: 6,918개
'chair' 클래스의 인스턴스 수: 2,663개
'식탁' 클래스의 인스턴스 수: 2,409개
'컵' 클래스의 인스턴스 수: 1,837개
'병' 클래스의 인스턴스 수: 1,829개
'고양이' 클래스의 인스턴스 수: 1,096개
'강아지' 클래스의 인스턴스 수: 1,009개
'트럭' 클래스의 인스턴스 수: 941개
'싱크대' 클래스의 인스턴스 수: 883개
Quotes
"객체 탐지, 컴퓨터 비전의 핵심 작업, 데이터셋 불균형으로 종종 방해받는다. 특히 전경-전경 클래스 불균형 문제는 충분히 탐구되지 않았다."
"단일 단계 탐지기에서 전경-전경 클래스 불균형 문제가 더욱 두드러진다."