Core Concepts
OCR(광학 문자 인식)을 활용하여 이미지에 포함된 통계 정보를 추출하고, 이를 이미지 특징과 융합함으로써 결함 감지 성능과 강건성을 향상시킨다.
Abstract
이 연구는 자동 광학 검사(AOI) 분야에서 발생하는 다양한 문제를 해결하기 위해 제안되었다. AOI는 제조 공정에서 중요한 역할을 하지만, 제한된 샘플 크기, 광원 및 카메라 위치 변화에 대한 민감성 등의 문제로 인해 정확도가 저하되는 경우가 많다.
이를 해결하기 위해 연구진은 OCR(광학 문자 인식)을 활용하여 이미지에 포함된 통계 정보를 추출하고, 이를 이미지 특징과 융합하는 방법을 제안했다. 구체적으로:
OCR을 통해 이미지에서 외부 모달리티 데이터를 추출하여 단일 모달리티 인식 다중 모달리티 모델 학습에 활용한다.
특징 정렬 과정을 통해 다른 모달리티의 특징을 효과적으로 융합한다.
특징 정제와 게이트 함수를 도입하여 모달리티 간 특징 조합을 최적화하고, 추론 및 의사 결정 능력을 향상시킨다.
실험 결과, 제안 방법은 기존 CNN 모델 대비 결함 감지 성능, 특히 재현율을 크게 향상시켰다. 또한 OCR 오류나 데이터 전송 이상 등 특정 모달리티 데이터가 손상되는 상황에서도 강건한 성능을 보였다.
Stats
제안 방법은 기존 CNN 모델 대비 결함 감지 재현율을 크게 향상시켰다.
제안 방법은 OCR 오류나 데이터 전송 이상 등 특정 모달리티 데이터가 손상되는 상황에서도 강건한 성능을 보였다.
Quotes
"OCR을 활용하여 이미지에 포함된 통계 정보를 추출하고, 이를 이미지 특징과 융합함으로써 결함 감지 성능과 강건성을 향상시킨다."
"특징 정렬, 특징 정제, 게이트 함수를 통해 다른 모달리티의 특징을 효과적으로 융합하고 모델 성능을 최적화한다."