핵심 개념
제조 공정 간 데이터 공유 시 발생하는 분포 불일치 문제를 해결하고, 하류 작업에 가장 유익한 데이터를 선별하여 공유함으로써 이상 탐지 모델의 성능을 향상시킬 수 있다.
초록
이 연구는 제조 공정 간 데이터 공유 문제를 다룹니다. 제조 공정 간 데이터 공유는 데이터 부족 문제를 해결할 수 있지만, 데이터 분포 불일치로 인해 하류 작업 성능이 저하될 수 있습니다.
이를 해결하기 위해 제안된 Active Data-sharing (ADs) 프레임워크는 다음과 같은 특징을 가집니다:
- 대조 학습(Contrastive Learning, CL) 모델을 통해 유사한 데이터 분포를 가진 데이터를 선별합니다. 이를 통해 분포 불일치 문제를 해결합니다.
- 불확실성 샘플링(Uncertainty Sampling) 기법을 통해 하류 작업에 가장 유익한 데이터를 선별합니다.
- 두 가지 목적을 동시에 달성하기 위해 유사도 점수와 불확실성 점수를 결합한 획득 함수를 사용합니다.
실험 결과, ADs 프레임워크를 사용하면 기존 방법 대비 26%의 레이블 데이터로도 95.78%의 정확도로 이상 탐지 모델을 학습할 수 있었습니다. 이는 100% 레이블 데이터를 사용한 경우보다 1.41% 향상된 성능입니다.
통계
유사한 두 소형 프린터(S1, S2)와 다른 대형 프린터(L1)에서 수집한 데이터를 사용했습니다.
소형 프린터 데이터(S1, S2)는 유사한 분포를 가지지만, 대형 프린터 데이터(L1)는 분포가 다릅니다.
인용구
"제조 시스템에서 기계 학습 모델을 구축할 때, 이러한 저품질 데이터는 모델 성능을 저하시킬 수 있습니다."
"따라서 직접적인 능동 학습의 적용은 하류 작업 성능 저하를 초래할 수 있습니다."