核心概念
영상 및 비디오 데이터의 이상 탐지와 위치 파악은 기계 학습 분야와 실제 응용 분야에서 매우 중요하다. 최근 몇 년 동안 시각적 이상 탐지 기술이 급속도로 발전했지만, 이러한 블랙박스 모델의 해석과 이상 징후를 구분할 수 있는 합리적인 설명은 여전히 부족한 실정이다.
摘要
이 논문은 영상 및 비디오의 설명 가능한 이상 탐지 방법에 초점을 맞춘 최초의 서베이이다. 먼저 영상 수준과 비디오 수준의 이상 탐지 기본 배경을 소개한다. 그 다음 주요 내용으로, 영상과 비디오에 대한 설명 가능한 이상 탐지 방법에 대한 포괄적이고 철저한 문헌 검토를 제시한다. 또한 일부 설명 가능한 이상 탐지 방법이 영상과 비디오 모두에 적용될 수 있는 이유와 다른 방법들이 한 가지 모달리티에만 적용될 수 있는 이유를 분석한다. 추가적으로 2D 시각적 이상 탐지 데이터셋과 평가 지표에 대한 요약을 제공한다. 마지막으로 2D 시각적 이상 탐지의 설명 가능성을 탐구하기 위한 몇 가지 유망한 미래 방향과 개방형 문제를 논의한다.
統計資料
이상 탐지와 위치 파악은 다양한 응용 분야(감시, 보안, 의료 영상, 산업 검사 등)에서 중요한 역할을 한다.
대부분의 통계 방법(isolation forest, KNN 등)은 표 형식 데이터에 잘 작동하지만 영상 데이터에 직접 적용하기 어렵다.
딥러닝 기반 방법이 2D 이상 탐지에 널리 사용되며, 오토인코더와 변분 오토인코더(VAE)가 일반적인 아키텍처이다.
기존 연구는 이상 탐지 성능을 입증했지만 설명 가능성이 제한적이다.
引述
"모델 설명 가능성은 산업 환경에서 데이터 기반 알고리즘 채택의 주요 문제 중 하나이다."
"특히 의료 영상 이상 탐지 작업에서, 딥러닝 모델은 X-ray 영상에 대한 정확한 예측을 제공할 수 있지만 어떠한 설명도 없다. 그러나 이를 전적으로 신뢰하는 것은 매우 위험하다."