Core Concepts
카메라 트랩 이미지를 활용하여 홍콩 지역의 동물 종을 효율적으로 분류하기 위한 능동 학습 모델을 개발하였다.
Abstract
이 연구에서는 홍콩에서 수집된 카메라 트랩 이미지를 활용하여 동물 종을 자동으로 분류하는 모델을 개발하였다. 먼저 MegaDetector를 사용하여 이미지에서 동물이 있는 부분을 추출하였다. 그 다음 전이 학습 기법을 사용하여 ResNet50 모델을 미세 조정하여 홍콩 지역의 동물 종 분류 모델을 구축하였다. 이 모델은 초기에 89%의 정확도를 보였지만, 다른 지역의 데이터에 적용하면 정확도가 50%로 떨어졌다. 이를 개선하기 위해 능동 학습 방식을 적용하여 모델을 개선하였다. 그 결과 독립 데이터셋에 대해 94.1%의 정확도, 93.7%의 정밀도, 81.9%의 재현율, 87.4%의 F1 점수를 달성하였다. 일부 희귀 종의 경우 정확도가 낮았지만, 일반적인 종에 대해서는 90% 이상의 F1 점수를 보였다. 이 연구는 카메라 트랩 이미지를 활용한 동물 모니터링 및 생물다양성 연구에 기여할 것으로 기대된다.
Stats
전체 데이터셋에는 15개의 동물/종 그룹이 포함되어 있다.
가장 많은 이미지를 가진 그룹은 Hystrix brachyura로 3,911장이다.
가장 적은 이미지를 가진 그룹은 Other animal로 9장이다.
Quotes
"최근 딥러닝 및 컴퓨터 비전 기술의 발전으로 이러한 과정을 자동화할 수 있게 되었다."
"이러한 네트워크는 일반화가 잘 되지 않아, 다른 지역에서 수집된 이미지에 적용하면 정확도가 낮아진다."
"능동 학습 방식을 사용하면 모델 정확도를 점진적으로 향상시킬 수 있으며, 레이블링 작업 시간을 최소화할 수 있다."