Core Concepts
Wake Vision은 TinyML 사람 감지를 위한 대규모 다양한 데이터셋으로, 이전 기준보다 100배 더 많은 이미지를 포함하며 엄격한 품질 관리를 거쳤다. Wake Vision 데이터셋을 사용하면 기존 벤치마크 대비 2.41% 더 높은 정확도를 달성할 수 있다.
Abstract
Wake Vision은 TinyML 사람 감지를 위한 대규모 다양한 데이터셋이다. 기존 데이터셋보다 약 100배 더 많은 6백만 장의 이미지로 구성되어 있으며, 엄격한 품질 관리 과정을 거쳤다. Wake Vision 데이터셋을 사용하여 모델을 학습하면 기존 벤치마크 대비 2.41% 더 높은 정확도를 달성할 수 있다.
Wake Vision 데이터셋에는 다음과 같은 특징이 있다:
이미지 수준 레이블과 경계 상자 레이블 두 가지 버전의 학습 데이터셋 제공
레이블 오류 식별 및 수정을 위한 자동화된 프로세스 적용
다양한 실제 시나리오를 반영하는 5가지 세부 벤치마크 제공
Wake Vision 데이터셋의 세부 벤치마크는 거리, 조명, 묘사, 성별, 연령 등 다양한 요인을 고려한다. 이를 통해 모델의 공정성과 강건성을 평가할 수 있다. 또한 Wake Vision 데이터셋을 활용한 사례 연구에서는 입력 해상도가 원거리 피사체 감지에 더 중요한 요인이며, 양자화가 모델 강건성에 미치는 영향은 미미함을 확인했다.
Wake Vision 데이터셋, 벤치마크 스위트, 코드, 모델은 CC-BY 4.0 라이선스 하에 공개되어 상용 사례에 활용할 수 있다.
Stats
사람 감지 모델의 성능은 피사체와의 거리에 크게 영향을 받는다. 멀리 있는 피사체를 감지하는 것이 가까운 피사체를 감지하는 것보다 어렵다.
조명 환경에 따라 모델의 성능이 크게 달라진다. 어두운 환경에서의 성능이 밝은 환경에 비해 낮다.
모델의 성능은 피사체의 성별과 연령에 따라 다르게 나타난다. 특히 노령층에 대한 감지 성능이 높다.
Quotes
"Wake Vision 데이터셋을 사용하면 기존 벤치마크 대비 2.41% 더 높은 정확도를 달성할 수 있다."
"입력 해상도가 원거리 피사체 감지에 더 중요한 요인이며, 양자화가 모델 강건성에 미치는 영향은 미미하다."