核心概念
F2PAD는 산업용 이미지에서 정확한 픽셀 수준 이상 분할을 위해 다양한 특징 기반 방법을 향상시키는 새로운 최적화 프레임워크입니다.
摘要
F2PAD: 특징 수준에서 픽셀 수준까지의 이상 탐지를 위한 일반 최적화 프레임워크
본 연구 논문에서는 산업용 이미지에서 정확한 픽셀 수준 이상 분할을 가능하게 하는 특징 수준에서 픽셀 수준까지의 이상 탐지를 위한 새로운 최적화 프레임워크인 F2PAD를 제안합니다. 특징 기반 방법은 훈련을 위한 샘플 크기가 작아도 되고 이상 위치를 잘 식별할 수 있다는 장점이 있지만, 감지된 이상 영역의 경계가 부정확하다는 단점이 있습니다. 이는 특징 맵의 해상도 감소와 특징 추출 중 인접한 정상 및 이상 픽셀의 혼합이라는 두 가지 문제 때문입니다.
F2PAD는 입력 이미지를 원본 이미지와 동일한 해상도를 갖는 비결함 이미지와 이상 부분의 두 부분으로 분해합니다. 그런 다음 비결함 이미지가 정상 특징을 생성하도록 장려하는 최적화 모델을 제안합니다. 이러한 방식으로 이상은 원래 해상도를 유지하는 추정된 이상 부분에 의해 직접적으로 나타납니다. 또한, 특징 추출은 서로 다른 유형의 픽셀이 혼합되지 않고 추정된 비결함 이미지에 대해서만 수행됩니다.
F2PAD는 손실 함수, 정규화 항, 최적화 알고리즘의 세 가지 주요 구성 요소로 구성됩니다.
손실 함수
손실 함수는 비결함 이미지에서 추출한 특징에 대한 이상 점수를 측정합니다. 본 논문에서는 PatchCore, CFLOW-AD, PaDiM의 세 가지 인기 있는 백본 방법에 적용할 때 손실 함수의 예를 보여줍니다.
정규화 항
두 가지 유형의 정규화 항이 사용됩니다.
희소성 유도 페널티: 이상의 지역성을 촉진합니다.
픽셀 사전 항: 비결함 이미지 복구를 개선합니다. 두 가지 유형의 픽셀 사전이 고려됩니다.
혼합 가우시안(MOG) 분포: 훈련 데이터 세트에서 학습한 픽셀 값의 사전 분포를 모델링합니다.
전체 변동(TV) 정규화: 조각별 부드러움을 촉진합니다.
최적화 알고리즘
본 논문에서는 새로운 로컬 그라디언트 공유 메커니즘을 사용하는 최적화 알고리즘을 제안합니다. 이 메커니즘은 공간적으로 인접한 픽셀의 그라디언트를 사용하여 조기 중지된 픽셀이 로컬 최소값에서 벗어날 수 있도록 합니다. 또한 더 큰 이상에 대해 더 작은 단계 크기를 사용하는 적응형 단계 크기를 제안합니다.