Core Concepts
분산 네트워크 환경에서 각 에이전트의 로컬 데이터 프라이버시를 보장하면서 전체 데이터 행렬을 분해하는 알고리즘을 제안한다.
Abstract
비음수 행렬 분해(NMF)는 데이터를 더 compact하게 표현할 수 있는 기법으로, 다양한 분야에 활용되고 있다.
분산 환경에서 NMF를 수행할 경우 에이전트 간 원본 데이터 공유로 인한 프라이버시 문제가 발생한다.
제안하는 프라이버시 보장 분산 NMF(PPDNMF) 알고리즘은 Paillier 암호 시스템을 활용하여 에이전트 간 정보 교환을 암호화함으로써 각 에이전트의 로컬 데이터 프라이버시를 보장한다.
블록 좌표 하강(BCD) 알고리즘과 교대 방향 승수 방법(ADMM)을 사용하여 분산 최적화를 수행한다.
합성 데이터와 MIT-CBCL 얼굴 데이터셋을 이용한 실험 결과, PPDNMF 알고리즘이 중앙집중형 알고리즘과 유사한 성능을 보임을 확인했다.
Stats
데이터 행렬 Z의 크기는 L x M이며, 각 에이전트는 M개의 열 중 일부를 가지고 있다.
좌측 행렬 인자 X는 L x K 크기이고, 우측 행렬 인자 Y는 K x M 크기이다.
에이전트 수 N = 10이며, 각 에이전트는 평균 3개의 이웃을 가진다.
실험에 사용된 데이터셋은 합성 데이터(L = 30, M = 200, K = 5)와 MIT-CBCL 얼굴 데이터(L = 361, M = 2429, K = 49)이다.
Quotes
"NMF는 데이터를 더 compact하게 표현할 수 있는 기법으로, 다양한 분야에 활용되고 있다."
"분산 환경에서 NMF를 수행할 경우 에이전트 간 원본 데이터 공유로 인한 프라이버시 문제가 발생한다."
"제안하는 PPDNMF 알고리즘은 Paillier 암호 시스템을 활용하여 에이전트 간 정보 교환을 암호화함으로써 각 에이전트의 로컬 데이터 프라이버시를 보장한다."