핵심 개념
적대적 예제의 성공 확률은 가장 가까운 데이터 포인트의 거리, 왜곡 크기 및 커널 함수에 의해 상한이 결정된다.
초록
적대적 예제(Adversarial example, AE)는 기계 학습의 공격 방법으로, Gaussian Process (GP) 분류를 기반으로 성공적인 AE의 확률 상한을 조사함.
실험 결과는 ImageNet을 사용하여 이론적 결과를 확인하고, 커널 함수의 매개변수 변경이 성공적인 AE의 확률 상한에 영향을 미침을 보여줌.
GP를 사용한 이론적 결과는 신경망과 같은 다른 추론 모델에도 적용 가능함.
통계
Gaussian Process는 확률 과정으로, 출력이 가우시안 분포를 따름.
GP는 분류 및 회귀에 사용될 수 있으며, GP는 일부 분류기와 동등함.
GP의 커널 함수는 NN의 활성화 함수에 해당함.
인용구
"적대적 예제의 성공 확률은 가장 가까운 데이터 포인트의 거리, 왜곡 크기 및 커널 함수에 의해 상한이 결정된다." - Content