핵심 개념
이 논문은 No-Reference Image Quality Assessment (NR-IQA) 모델의 취약점을 탐색하기 위해 쿼리 기반 블랙박스 공격 방법을 제안한다. 제안된 방법은 점수 경계 개념을 도입하고 적응형 반복 접근법을 활용하여 NR-IQA 모델을 효과적으로 공격할 수 있다. 또한 인간 시각 시스템의 특성을 활용하여 초기 공격 방향을 설계하고 Just Noticeable Difference를 통해 시각적 투명성을 보장한다.
초록
이 논문은 No-Reference Image Quality Assessment (NR-IQA) 모델의 취약점을 탐색하기 위한 쿼리 기반 블랙박스 공격 방법을 제안한다.
점수 경계 개념 도입
개별 공격의 성공 여부를 정량화하기 위해 점수 경계 개념을 도입
다중 점수 경계를 활용하여 공격 강도를 점진적으로 높임
초기 공격 방향 설계
딥 신경망의 텍스처 및 희소 노이즈 민감성을 활용하여 초기 공격 방향 설계
에지 및 두드러진 영역에 공격을 집중하여 공격 효과 향상
시각적 투명성 보장
Just Noticeable Difference를 활용하여 인간 눈에 보이지 않는 수준의 퍼터베이션 생성
적응형 반복 최적화
점수 경계를 동적으로 조정하여 각 이미지와 반복에 최적화된 공격 수행
실험 결과, 제안 방법은 기존 블랙박스 공격 방법 대비 우수한 성능을 보였으며, DBCNN 모델의 Spearman 순위 상관 계수를 0.6381 감소시켜 NR-IQA 모델의 취약성을 드러냈다.
통계
원본 이미지의 예측 점수는 55.2이며, 상관 지수(SROCC/PLCC/KROCC)는 0.9756 / 0.9746 / 0.8714이다.
공격 후 예측 점수는 28.6이며, 상관 지수는 0.8332 / 0.8617 / 0.6541로 크게 감소했다.
다른 이미지의 경우, 원본 예측 점수는 60.0이었으나 공격 후 예측 점수가 23.4로 낮아졌다. 상관 지수도 0.9529 / 0.9460 / 0.8059에서 0.3148 / 0.3982 / 0.2204로 크게 감소했다.