Conceptos Básicos
이미지 데이터의 이상치 및 분포 외 데이터를 통계 기법인 벤포드 법칙을 활용하여 탐지할 수 있다.
Resumen
이 연구는 이미지 데이터의 이상치 및 분포 외 데이터를 탐지하기 위해 벤포드 법칙을 활용하는 방법을 제안한다.
- 이미지를 이산 코사인 변환(DCT)하여 계수의 선두 숫자 분포를 추출한다.
- 추출된 분포와 벤포드 법칙의 이론적 분포 간 차이를 제닌-샤논 발산을 통해 측정한다.
- ImageNet-C 데이터셋을 활용하여 다양한 이미지 훼손 유형과 수준에 따른 분포 차이를 확인했다.
- 대부분의 훼손 유형에서 훼손 수준이 높을수록 벤포드 법칙 분포로부터의 편차가 증가했다.
- 이는 벤포드 법칙 기반 접근이 이상치 및 분포 외 데이터 탐지에 활용될 수 있음을 시사한다.
- 다만 이 방법은 입력 공간의 이상치는 탐지할 수 있지만, 레이블 공간의 이상치는 탐지하기 어려울 수 있다는 한계가 있다.
- 추후 연구에서는 일반화된 벤포드 법칙 적용, 훼손 수준과 모델 성능 저하의 상관관계 분석 등을 수행할 계획이다.
Estadísticas
이미지 데이터의 이상치 및 분포 외 데이터 탐지를 위해 벤포드 법칙을 활용한 결과, 대부분의 훼손 유형에서 훼손 수준이 높을수록 벤포드 법칙 분포로부터의 편차가 증가했다.
Citas
"이미지 데이터의 이상치 및 분포 외 데이터를 탐지하기 위해 벤포드 법칙을 활용하는 방법을 제안한다."
"대부분의 훼손 유형에서 훼손 수준이 높을수록 벤포드 법칙 분포로부터의 편차가 증가했다."