Kernekoncepter
본 논문에서는 시공간 데이터를 사용한 연합 학습에서 그래디언트를 통해 사용자 정보를 재구성하는 공격 (ST-GIA)과 이를 개선한 ST-GIA+ 공격을 제안하고, 이러한 공격으로부터 사용자 프라이버시를 보호하기 위한 적응형 방어 전략을 제시합니다.
Resumé
시공간 연합 학습에서의 그래디언트 기반 공격 및 방어 전략: 대규모 언어 모델 활용
본 연구는 사용자의 시공간 데이터를 활용한 연합 학습 환경에서 발생할 수 있는 새로운 프라이버시 위협에 대해 다룹니다. 특히, 사용자의 위치 정보와 같은 민감한 데이터가 그래디언트 업데이트를 통해 재구성될 수 있음을 보여주는 ST-GIA (Spatiotemporal Gradient Inversion Attack) 공격을 제안합니다. 또한, 대규모 언어 모델(LLM)을 활용하여 ST-GIA 공격을 개선한 ST-GIA+ 공격을 소개하고, 이러한 공격으로부터 사용자 프라이버시를 효과적으로 보호하기 위한 적응형 방어 전략을 제시합니다.
시공간 연합 학습에서의 그래디언트 역전 공격
기존의 그래디언트 역전 공격 연구는 주로 이미지 또는 텍스트 데이터를 재구성하는 데 중점을 두었으며, 시공간 데이터를 사용한 연합 학습 환경에서의 취약성은 충분히 연구되지 않았습니다. 본 논문에서는 시공간 데이터의 고유한 특징을 활용하여 그래디언트에서 원래 위치 정보를 효과적으로 재구성할 수 있는 새로운 공격 알고리즘인 ST-GIA를 제안합니다. ST-GIA는 시공간 특징 기반 초기화, 그래디언트 매칭을 통한 위치 복구, 다중 복구 결과 보정의 세 단계로 구성됩니다.
대규모 언어 모델을 활용한 ST-GIA+ 공격
ST-GIA는 기존 공격 방법보다 시공간 연합 학습 환경에서 효과적인 공격 성능을 보여주지만, 전역 학습 라운드 수가 증가함에 따라 공격 성능이 저하되는 한계점을 보입니다. 이는 모델이 수렴함에 따라 그래디언트에 포함된 정보량이 감소하기 때문입니다. 이러한 문제를 해결하고 ST-GIA의 성능을 더욱 향상시키기 위해, 본 논문에서는 대규모 언어 모델을 활용하여 잠재적인 위치 후보를 생성하고, 이를 통해 그래디언트에서 원본 데이터를 더욱 정확하게 재구성하는 ST-GIA+ 공격 방법을 제안합니다. ST-GIA+는 ST-GIA의 장점을 유지하면서 후기 학습 라운드에서의 공격 성능 저하 문제를 대규모 언어 모델과 궤적 유사도 보정 메커니즘을 통해 효과적으로 보완하여 공격 성공률과 정확도를 크게 향상시킵니다.
적응형 프라이버시 보존 전략
본 논문에서는 시공간 연합 학습에서 그래디언트 역전 공격을 완화하기 위해 개인 맞춤형 제약 조건 도메인을 기반으로 하는 적응형 프라이버시 보존 전략을 설계합니다. 이 전략은 적응형 예산 할당과 개인화된 제약 조건 도메인 기반 perturbation으로 구성됩니다.
적응형 예산 할당
전역 모델이 수렴함에 따라 재구성 오류가 증가하는 경향이 있음을 관찰했습니다. 이는 모델이 수렴함에 따라 그래디언트의 정보가 줄어들고 공격자가 사용자 위치를 정확하게 재구성하기 위해 그래디언트에서 정보 유출에 의존하기 때문입니다. 따라서 각 학습 라운드에서 발생하는 프라이버시 위험은 동일하지 않습니다. 기존의 방법들은 각 학습 라운드가 동일하게 중요하다고 가정하여 모든 라운드에 개인 정보 보호 예산을 균등하게 분배합니다. 그러나 이러한 균일 할당 방식은 그래디언트 역전 공격을 효과적으로 완화하는 데 어려움을 겪을 수 있습니다. 특히, 모델 업데이트가 더 유익하고 따라서 더 민감한 학습 라운드는 충분한 보호를 받지 못하여 공격자의 주요 표적이 될 수 있습니다. 반대로, 덜 중요한 업데이트 정보가 있는 라운드에는 개인 정보 보호 예산이 과도하게 할당되어 과도하게 보호될 수 있습니다.
개인화된 제약 조건 도메인
개인 정보를 보호하기 위해 각 사용자는 개별 요구 사항에 따라 개인화된 제약 조건 도메인을 정의할 수 있습니다. 예를 들어, 주로 캠퍼스 내에서만 활동하는 학생은 제약 조건 도메인을 전체 캠퍼스 내의 모든 위치로 정의할 수 있습니다. 이러한 접근 방식을 통해 각 사용자의 고유한 사용 패턴과 개인 정보 보호 요구 사항을 반영하는 맞춤형 개인 정보 보호 설정이 가능합니다. 제약 조건 도메인을 정의함으로써 사용자는 마련된 개인 정보 보호 메커니즘이 자신의 특정 컨텍스트 및 활동 패턴과 일치하도록 할 수 있습니다. 이러한 개인화된 제약 조건 도메인은 개인 정보 보호 예산 할당 및 노이즈 추가가 관리되는 경계 역할을 합니다. 결과적으로 개인 정보 보호는 사용자의 활성 영역 외부에 불필요한 노이즈를 추가하는 것을 최소화하는 동시에 정의된 도메인 내에서 개인 정보를 최대화하여 더욱 관련성이 높고 효과적이 됩니다. 이 방법은 더 높은 활동 영역에 집중하여 개인 정보 보호를 강화할 뿐만 아니라 개인 정보 보호 조치를 무차별적으로 적용하지 않음으로써 리소스 활용을 최적화합니다. 시스템은 사용자 정의 제약 조건 도메인 내에서 노력을 집중함으로써 보다 효율적이고 사용자 중심적인 개인 정보 보호 솔루션을 제공할 수 있습니다. 개인화된 제약 조건 도메인은 Ct
k = {xk
i |Pr(xt
k = xi) > 0, xi ∈X}로 표시될 수 있으며, 이는 t에서 사용자 uk의 가능한 위치 집합을 나타냅니다.