Core Concepts
단일 브랜치 네트워크 구조를 활용하여 조명 변화에 따른 그림자 정보를 효과적으로 활용함으로써 위장 물체를 정확하게 탐지할 수 있다.
Abstract
이 연구는 위장 물체 탐지(COD) 문제를 해결하기 위해 단일 브랜치 네트워크 구조인 Co-Supervised Spotlight Shifting Network(CS3Net)를 제안한다.
CS3Net은 다음과 같은 특징을 가진다:
조명 변화에 따른 그림자 정보를 활용하여 위장 물체의 윤곽을 효과적으로 학습할 수 있다. 이를 위해 Shadow Refinement Module(SRM)과 Projection Aware Attention(PAA) 모듈을 도입하였다.
단일 브랜치 구조를 사용하여 복잡한 멀티 브랜치 구조에 비해 계산 비용을 크게 줄일 수 있다.
Extended Neighbor Connection Decoder(ENCD)를 통해 다중 스케일 특징을 효과적으로 결합하여 최종 예측 결과를 생성한다.
실험 결과, CS3Net은 기존 효율적인 COD 모델 대비 32.13%의 MACs 감소와 더불어 우수한 성능을 달성하였다. 이는 CS3Net이 위장 물체 탐지 문제에서 효율성과 성능의 최적의 균형을 달성했음을 보여준다.
Stats
제안된 CS3Net 모델은 기존 효율적인 COD 모델 대비 32.13%의 MACs 감소를 달성했다.
CS3Net은 NC4K 데이터셋에서 𝑆𝛼 점수 0.859, 𝐹𝑤
𝛽 점수 0.792를 기록했다.
CAMO 데이터셋에서 CS3Net은 𝑆𝛼 점수 0.839, 𝐹𝑤
𝛽 점수 0.774를 달성했다.
COD10K 데이터셋에서 CS3Net은 𝑆𝛼 점수 0.825, 𝐹𝑤
𝛽 점수 0.703을 기록했다.
Quotes
"조명 변화에 따른 그림자 정보를 활용하여 위장 물체의 윤곽을 효과적으로 학습할 수 있다."
"단일 브랜치 구조를 사용하여 복잡한 멀티 브랜치 구조에 비해 계산 비용을 크게 줄일 수 있다."
"Extended Neighbor Connection Decoder(ENCD)를 통해 다중 스케일 특징을 효과적으로 결합하여 최종 예측 결과를 생성한다."