Основные понятия
일반 목적 기반 모델인 DINOv2와 K-Nearest Neighbors 알고리즘을 활용하여 매우 적은 수의 포인트 레이블로도 정확한 증강 그라운드 트루스 마스크를 생성할 수 있다.
Аннотация
이 연구는 최근 발전된 기반 모델인 DINOv2를 활용하여 다중 종 산호 이미지의 효율적인 분할 방법을 제안한다. 기존 접근법은 복잡한 슈퍼픽셀 알고리즘을 사용했지만, 제안 방법은 DINOv2의 강력한 특징 벡터와 단순한 K-Nearest Neighbors 알고리즘을 활용한다.
특히 매우 적은 수의 포인트 레이블(5-25개)이 주어진 경우, 제안하는 사람 개입 기반 레이블링 체계를 통해 기존 최신 기법 대비 17.3% 더 높은 픽셀 정확도와 22.6% 더 높은 mIoU 성능을 달성했다. 사람 개입 없이도 DINOv2 특징과 KNN만으로도 기존 최신 기법 대비 3.5% 더 높은 픽셀 정확도와 5.7% 더 높은 mIoU 성능을 보였다.
또한 포인트 레이블의 개수와 배치 방식이 분할 성능에 미치는 영향을 분석하고, 효율적인 레이블링을 위한 권장사항을 제시했다.
Статистика
5개의 포인트 레이블로 제안 방법은 기존 대비 64.3% 더 높은 픽셀 정확도와 46.1% 더 높은 mIoU를 달성했다.
10개의 포인트 레이블로 제안 방법은 기존 대비 10.6% 더 높은 픽셀 정확도와 19.1% 더 높은 mIoU를 달성했다.
25개의 포인트 레이블로 제안 방법은 기존 대비 8.2% 더 높은 mIoU를 달성했다.
Цитаты
"일반 목적 기반 모델인 DINOv2와 단순한 K-Nearest Neighbors 알고리즘만으로도 매우 적은 수의 포인트 레이블로도 정확한 증강 그라운드 트루스 마스크를 생성할 수 있다."
"제안하는 사람 개입 기반 레이블링 체계를 통해 기존 최신 기법 대비 17.3% 더 높은 픽셀 정확도와 22.6% 더 높은 mIoU 성능을 달성했다."