Concepts de base
MambaAD는 Mamba 구조를 활용하여 글로벌 및 지역 정보를 통합적으로 모델링함으로써 다중 클래스 비지도 이상 탐지 성능을 향상시킨다.
Résumé
본 연구는 Mamba 프레임워크를 이상 탐지 분야에 최초로 적용한 MambaAD를 제안한다. MambaAD는 사전 학습된 인코더와 Mamba 기반 디코더로 구성되며, 다중 스케일에서 Locality-Enhanced State Space (LSS) 모듈을 활용한다. LSS 모듈은 Mamba의 글로벌 모델링 능력과 CNN 기반 지역 특징 상관관계를 결합한다. 구체적으로 LSS 모듈은 순차적인 Hybrid State Space (HSS) 모듈과 병렬 다중 커널 합성곱 네트워크로 구성된다. HSS 모듈은 Hybrid Scanning (HS) 인코더를 사용하여 입력 특징을 5가지 스캔 패턴과 8가지 방향으로 인코딩함으로써 산업 제품의 중심 위치에서의 특징 시퀀스 모델링을 강화한다. 6개의 다양한 이상 탐지 데이터셋과 7가지 평가 지표에 대한 광범위한 실험을 통해 MambaAD의 우수한 성능을 입증한다.
Stats
산업 제품 이상 탐지 데이터셋 MVTec-AD에서 MambaAD는 이미지 수준 AU-ROC 98.6%, AP 99.6%, F1_max 97.8%를 달성하였고, 픽셀 수준 AU-ROC 97.7%, AP 56.3%, F1_max 59.2%, AU-PRO 93.1%를 달성하였다.
VisA 데이터셋에서 MambaAD는 이미지 수준 AU-ROC 94.3%, AP 94.5%, F1_max 89.4%를 달성하였고, 픽셀 수준 AU-ROC 98.5%, AP 39.4%, F1_max 44.0%, AU-PRO 91.0%를 달성하였다.
Citations
"MambaAD는 Mamba 구조를 활용하여 글로벌 및 지역 정보를 통합적으로 모델링함으로써 다중 클래스 비지도 이상 탐지 성능을 향상시킨다."
"LSS 모듈은 Mamba의 글로벌 모델링 능력과 CNN 기반 지역 특징 상관관계를 결합한다."
"HSS 모듈은 Hybrid Scanning (HS) 인코더를 사용하여 입력 특징을 5가지 스캔 패턴과 8가지 방향으로 인코딩함으로써 산업 제품의 중심 위치에서의 특징 시퀀스 모델링을 강화한다."