핵심 개념
시민 과학 기반 대규모 데이터셋에서 희귀종 모델링을 위해 불균형 인지 출현 전용 손실 함수를 사용하면 기존 손실 함수보다 성능이 향상된다.
초록
이 연구는 종 분포 모델링(SDM)에서 희귀종 모델링의 중요성을 강조한다. 시민 과학 기반 대규모 데이터셋에서는 종 간 관측 수의 불균형이 심각하여 희귀종 모델링이 어려운 문제가 있다. 이를 해결하기 위해 불균형 인지 출현 전용 손실 함수를 제안하였다.
GeoLifeCLEF 2023과 iNaturalist 데이터셋을 활용한 실험 결과, 제안한 손실 함수가 기존 손실 함수에 비해 전반적으로 우수한 성능을 보였으며, 특히 관측 수가 적은 희귀종에 대한 모델링 성능이 크게 향상되었다. 이는 불균형 인지 손실 함수가 희귀종 모델링에 효과적임을 보여준다.
통계
희귀종(관측 수 50개 이하)의 GeoLifeCLEF 2023 데이터셋 AUC 평균: 0.854
IUCN 데이터셋 내 희귀종(관측 수 100개 이하) mAP: 0.710
인용구
"시민 과학 기반 대규모 데이터셋에서는 종 간 관측 수의 불균형이 심각하여 희귀종 모델링이 어려운 문제가 있다."
"제안한 불균형 인지 출현 전용 손실 함수가 기존 손실 함수에 비해 전반적으로 우수한 성능을 보였으며, 특히 관측 수가 적은 희귀종에 대한 모델링 성능이 크게 향상되었다."