מושגי ליבה
인간 포즈 추정(HPE) 시스템이 백도어 공격에 취약하며, 이를 통해 특정 트리거가 있는 이미지에서 사람을 사라지게 만들 수 있다는 것을 보여줍니다.
תקציר
인간 포즈 추정 시스템의 새로운 공격 취약점: 투명 망토 공격
본 연구 논문에서는 딥러닝 기반 인간 포즈 추정(HPE) 시스템의 새로운 공격 취약점을 분석하고, 이를 악용한 "투명 망토(IntC)" 공격을 제안합니다. IntC 공격은 백도어 공격 기법을 활용하여 특정 트리거가 포함된 이미지에서 사람을 사라지게 만드는 것을 목표로 합니다.
IntC 공격은 HPE 모델 학습 과정에서 적은 양의 학습 데이터를 조작하는 방식으로 이루어집니다.
트리거 삽입: 공격자는 먼저 특정 패턴을 가진 작은 이미지 패치와 같은 트리거를 학습 이미지에 삽입합니다.
라벨 조작: 공격자는 트리거가 삽입된 이미지에 대해 HPE 모델이 사람이 없다고 판단하도록 라벨을 조작합니다.
이러한 조작된 데이터로 학습된 HPE 모델은 정상적인 이미지에서는 정상적으로 작동하지만, 트리거가 포함된 이미지에서는 사람을 인식하지 못하게 됩니다.
본 논문에서는 다양한 HPE 모델(DeepPose, ChainedPredictions, HRNet, DEKR)과 데이터셋(COCO, MPII, CrowdPose)을 사용하여 IntC 공격의 효과를 실험적으로 검증했습니다.
IntC 공격의 핵심: 라벨 디자인
IntC 공격의 핵심은 사람이 없음을 나타내는 라벨을 설계하는 데 있습니다. 본 논문에서는 다음과 같은 세 가지 라벨 디자인을 제안합니다.
IntC-S: 모든 키포인트를 이미지의 한 지점에 집중시켜 매우 작은 객체로 인식되도록 유도합니다.
IntC-E: 히트맵 기반 HPE 모델에서 키포인트에 해당하는 히트맵을 모두 0으로 설정하여 사람이 없음을 나타냅니다.
IntC-L: 사람이 없는 풍경 이미지의 HPE 라벨 패턴을 분석하고, 이를 평균화하여 트리거 이미지의 라벨로 사용합니다.