核心概念
대화형 세그멘테이션 모델의 사용자 입력에 대한 이해도를 측정하기 위해 기대 정보 이득(EIG)을 활용한 평가 방법을 제안한다.
要約
이 논문은 대화형 세그멘테이션 모델의 성능을 평가하기 위한 새로운 방법을 소개한다. 기존의 오라클 Dice 지수 측정은 모델의 사용자 입력에 대한 이해도를 충분히 반영하지 못한다고 지적한다.
대신 베이지안 실험 설계 개념에 기반한 기대 정보 이득(EIG) 측정을 제안한다. EIG는 사용자 입력에 대한 모델의 이해도를 나타내며, 이를 통해 모델의 성능을 보다 정확하게 평가할 수 있다.
실험에서는 SAM, MedSAM, SAM-Med2D 모델을 대상으로 오라클 Dice 지수와 EIG 기반 성능을 비교한다. 결과적으로 EIG 기반 측정이 모델의 사용자 입력 이해도를 더 잘 반영함을 보여준다.
統計
오라클 Dice 지수가 높더라도 사용자 입력에 대한 이해도가 낮을 수 있다.
SAM 모델은 자연 이미지와 의료 이미지 모두에서 높은 성능을 보였다.
MedSAM 모델은 사용자 입력 이해도가 매우 낮았다.
SAM-Med2D 모델은 오라클 Dice 지수가 매우 높지만 EIG 기반 성능은 그렇지 않았다.
引用
"Oracle-prompt Dice index is at best half of the story. While high Dice under the optimal prompt is a necessary condition for good segmentation, good interaction requires an understanding of the information provided by a prompt about a segmentation."
"We believe the accuracy of this feedback speaks to how well a model parameterizes the interactions between proposed segmentations and user prompts for that given domain, as well as to the in-domain/out-of-domain shift of a model and its encapsulated priors."