Concepts de base
쿼리 복구는 키워드의 볼륨 및 빈도 분포에 따라 쉽게 복구될 수 있음을 보여줍니다.
Résumé
쿼리 복구는 키워드의 볼륨과 빈도 분포에 따라 쉽게 복구될 수 있음을 보여주는 연구입니다.
쿼리 복구에 대한 새로운 효과적인 유사 데이터 공격인 Jigsaw 공격을 제안합니다.
알고리즘 1 및 2의 결과를 통해 쿼리 복구의 성능을 확인합니다.
알고리즘 1:
HVHF(고 볼륨, 고 빈도) 사분면에서 높은 정확도를 보임.
HVLF(고 볼륨, 낮은 빈도) 및 LVHF(낮은 볼륨, 고 빈도) 사분면에서도 높은 정확도를 보임.
LVLF(낮은 볼륨, 낮은 빈도) 사분면에서는 정확도가 낮음.
알고리즘 2:
Enron, Lucene, Wikipedia 데이터셋에서 BaseRec 및 ConfRec에 따른 결과를 제시.
ConfRec가 증가할수록 정확도와 복구율이 감소함.
Stats
공격자는 유사 데이터를 활용하여 키워드 볼륨과 빈도 정보를 추출합니다.
Citations
"Queries containing keywords with high volume/frequency are much easier to recover than others."
"By exploiting the above finding, we propose a Jigsaw attack that begins by accurately identifying and recovering those distinctive queries."