Core Concepts
대규모 IP 주소 데이터의 통계를 효율적으로 수집하고 검색하기 위한 두 가지 방법을 제안한다. 이 방법들은 메모리 사용과 계산 비용 사이의 균형을 유지하며, 대규모 IP 주소 데이터에 대한 통계를 빠르고 효율적으로 제공한다.
Abstract
이 논문은 대규모 IP 주소 데이터의 통계를 효율적으로 수집하는 두 가지 방법을 제안한다.
첫 번째 방법인 TLMB(Two-Layer Memory Block)는 IP 주소와 메모리 블록 간의 관계를 매핑하는 메커니즘을 사용한다. IP 주소는 4개의 부분으로 나뉘며, 각 부분은 메모리 블록과 매핑된다. 이를 통해 IP 주소 통계를 선형 시간 복잡도로 계산할 수 있다.
두 번째 방법인 SSMB(Single Shared Memory Block)는 모든 IP 주소를 단일 메모리 블록에 저장한다. IP 주소의 첫 번째 부분에 따라 IP 주소를 논리적으로 여러 부분으로 나누고, 각 부분의 통계를 단일 메모리 블록에 저장한다. 이 방법은 메모리 사용량이 거의 변하지 않는다.
두 방법 모두 병렬 계산 최적화 기법을 사용하여 계산 효율을 높이고 메모리 사용량을 크게 줄일 수 있다. 실험 결과, 제안된 방법들이 기존 방법에 비해 계산 비용과 메모리 사용 측면에서 우수한 성능을 보였다.
Stats
5,000,000개의 IP 레코드와 50,000개의 고유 IP 주소를 가진 데이터셋에서 TLMB 방법의 계산 비용은 k=10일 때 2.51초, k=100일 때 2.52초이다.
50,000,000개의 IP 레코드와 500,000개의 고유 IP 주소를 가진 데이터셋에서 TLMB 방법의 계산 비용은 k=10일 때 24.22초, k=100일 때 24.24초이다.
SSMB 방법의 메모리 사용량은 데이터셋 크기와 관계없이 약 139MB로 일정하다.