Основні поняття
본 논문에서는 소셜 센서 클라우드 서비스 제공자의 불완전한 비공개 프로필 데이터를 기반으로 복제 계정을 효과적으로 탐지하는 새로운 접근 방식을 제안합니다.
Анотація
소셜 센서 클라우드에서의 복제 계정 탐지: 불완전한 프로필 데이터 활용
본 연구는 소셜 센서 클라우드 서비스 제공자의 불완전한 비공개 프로필 데이터를 기반으로 복제 계정을 효과적으로 탐지하는 새로운 접근 방식을 제안하는 것을 목표로 합니다.
본 연구에서는 ICD-IPD(Incomplete Profile Data 기반 Identity Cloning Detection)라는 새로운 접근 방식을 제안합니다. ICD-IPD는 다섯 가지 주요 구성 요소, 즉 1) 계정 쌍 생성기(APG), 2) 다중 뷰 학습기, 3) 결측값 대치기, 4) 계정 쌍 특징 생성기, 5) 예측 모델로 구성됩니다.
계정 쌍 생성기(APG): 주어진 소셜 미디어 사용자 집합에서 유사한 사용자 이름이나 화면 이름을 공유하는 계정 쌍을 생성합니다.
다중 뷰 학습기: 각 계정에 대한 다중 뷰 표현을 학습하고 각 계정에 대해 두 가지 범주의 특징(프로필 기반 특징 및 WGCCA 기반 특징)을 추출합니다.
결측값 대치기: 누락된 특징 값을 대치합니다. 본 연구에서는 Gaussian Copula 모델을 기반으로 하는 Copula-EM 알고리즘을 사용하여 누락된 값을 대치합니다.
계정 쌍 특징 생성기: 대치된 특징 값을 기반으로 각 계정 쌍에 대한 유사성 및 차이점 기반 특징을 추출합니다.
예측 모델: LightGBM(Light Gradient Boosting Machine) 모델을 사용하여 주어진 계정 쌍이 복제 계정과 피해자 계정으로 구성되었는지 여부를 예측합니다.