본 논문은 컴퓨터 과학, 특히 데이터 구조, 알고리즘 및 보안 분야의 연구 논문입니다. 저자들은 차분 프라이버시를 보장하면서 해밍 거리와 편집 거리를 효율적으로 추정하는 새로운 데이터 구조를 제안합니다.
연구 목표: 대량의 문자열 데이터베이스에서 주어진 쿼리 문자열과 데이터베이스 내 모든 문자열 간의 거리(해밍 거리 및 편집 거리)를 개인정보를 보호하는 동시에 효율적으로 계산하는 방법을 연구합니다.
방법론: 저자들은 랜덤 응답 기법을 비트 플립 절차로 변형하여 스케치된 문자열에 적용하는 새로운 방식을 제안합니다. 해밍 거리의 경우, 스케치 기반 데이터 구조를 사용하고, 편집 거리의 경우에는 가장 긴 공통 접두사 (LCP)를 개인정보를 보호하는 방식으로 추정하는 새로운 데이터 구조를 설계하여 편집 거리 계산에 활용합니다.
주요 결과:
의의: 본 연구는 차분 프라이버시를 보장하면서도 효율적인 시간 복잡도를 갖는 해밍 거리 및 편집 거리 추정 데이터 구조를 제시함으로써 개인정보보호 데이터 분석 분야에 기여합니다. 특히, 편집 거리 계산을 위해 노이즈가 있는 LCP 구현을 기반으로 한 최초의 알고리즘을 제시했다는 점에서 의의가 있습니다.
제한점 및 향후 연구 방향:
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Jerry Yao-Ch... في arxiv.org 11-11-2024
https://arxiv.org/pdf/2411.05750.pdfاستفسارات أعمق