Core Concepts
웹 API를 통해 노출되는 사용자 정보의 엔트로피를 측정하여 웹 지문 추적 위험을 정량화하고, 이를 바탕으로 지문 추적 완화 방법의 효과를 평가하였다.
Abstract
이 연구는 웹 지문 추적 위험을 정량화하기 위해 대규모 측정 연구를 수행하였다. 주요 내용은 다음과 같다:
웹 API 사용 빈도 분석:
웹사이트 카테고리별로 다양한 웹 API 사용 패턴을 확인하였다.
웹 API 간 상관관계 분석:
60개의 주요 웹 API 간 상관관계를 분석하여 유사한 정보를 노출하는 API들을 클러스터링하였다.
이를 통해 개별 API의 엔트로피뿐만 아니라 API 조합의 엔트로피도 추정할 수 있었다.
세션 엔트로피 분포 분석:
웹사이트 방문 세션별 노출되는 정보의 엔트로피 분포를 분석하였다.
이를 통해 엔트로피가 지문 추적 지표로 유용함을 검증하고, 지문 추적 완화 기법의 효과를 평가하였다.
연구 결과는 웹 지문 추적 위험을 현실적으로 측정하고, 이를 바탕으로 효과적인 완화 방안을 설계하는데 활용될 수 있다.
Stats
웹사이트 방문 세션의 평균 엔트로피는 약 20비트이다.
뉴스 및 쇼핑 웹사이트의 세션 엔트로피가 정부 및 법률 웹사이트보다 높다.
제3자 스크립트에 의해 노출되는 정보의 엔트로피가 제1자 스크립트보다 높다.
Quotes
"웹 API는 사용자에게 맞춤형 경험을 제공하지만, 동시에 사용자 추적에 악용될 수 있는 정보를 노출한다."
"엔트로피는 지문 추적 위험을 정량화하는 핵심 지표이다."