핵심 개념
해석 가능한 이미지 분류를 위한 효율적이고 견고한 트랜스포머 디코더의 중요성
통계
ComFe는 이전 모델보다 높은 정확도를 달성
ComFe는 ImageNet, CIFAR-10, CIFAR-100, Food-101, StanfordCars 및 FGVC Aircraft에서 선형 헤드보다 우수한 성능을 보임
ComFe는 ImageNet-V2 테스트 세트에서 성능 향상을 보임
인용구
"Interpretable computer vision models can produce transparent predictions, where the features of an image are compared with prototypes from a training dataset."
"ComFe introduces a novel explainable-by-design image classification approach using a transformer-decoder head and hierarchical mixture-modelling."
"ComFe obtains higher accuracy compared to previous interpretable models across a range of fine-grained vision benchmarks."