Concepts de base
이 논문은 No-Reference Image Quality Assessment (NR-IQA) 모델의 취약점을 탐색하기 위해 쿼리 기반 블랙박스 공격 방법을 제안한다. 제안된 방법은 점수 경계 개념을 도입하고 적응형 반복 접근법을 활용하여 NR-IQA 모델을 효과적으로 공격할 수 있다. 또한 인간 시각 시스템의 특성을 활용하여 초기 공격 방향을 설계하고 Just Noticeable Difference를 통해 시각적 투명성을 보장한다.
Résumé
이 논문은 No-Reference Image Quality Assessment (NR-IQA) 모델의 취약점을 탐색하기 위한 쿼리 기반 블랙박스 공격 방법을 제안한다.
- 점수 경계 개념 도입
- 개별 공격의 성공 여부를 정량화하기 위해 점수 경계 개념을 도입
- 다중 점수 경계를 활용하여 공격 강도를 점진적으로 높임
- 초기 공격 방향 설계
- 딥 신경망의 텍스처 및 희소 노이즈 민감성을 활용하여 초기 공격 방향 설계
- 에지 및 두드러진 영역에 공격을 집중하여 공격 효과 향상
- 시각적 투명성 보장
- Just Noticeable Difference를 활용하여 인간 눈에 보이지 않는 수준의 퍼터베이션 생성
- 적응형 반복 최적화
- 점수 경계를 동적으로 조정하여 각 이미지와 반복에 최적화된 공격 수행
실험 결과, 제안 방법은 기존 블랙박스 공격 방법 대비 우수한 성능을 보였으며, DBCNN 모델의 Spearman 순위 상관 계수를 0.6381 감소시켜 NR-IQA 모델의 취약성을 드러냈다.
Stats
원본 이미지의 예측 점수는 55.2이며, 상관 지수(SROCC/PLCC/KROCC)는 0.9756 / 0.9746 / 0.8714이다.
공격 후 예측 점수는 28.6이며, 상관 지수는 0.8332 / 0.8617 / 0.6541로 크게 감소했다.
다른 이미지의 경우, 원본 예측 점수는 60.0이었으나 공격 후 예측 점수가 23.4로 낮아졌다. 상관 지수도 0.9529 / 0.9460 / 0.8059에서 0.3148 / 0.3982 / 0.2204로 크게 감소했다.