Conceitos Básicos
이 논문은 종속 데이터에서 얻은 토폴로지 데이터 객체 시퀀스의 구조적 변화를 감지하고 결정하기 위해 일반적으로 사용되는 여과 함수의 안정성을 연구하고 이를 기반으로 테스트 절차를 개발합니다.
Resumo
토폴로지 데이터 분석에서 여과 함수 안정성에 관한 연구: 브레이크 감지 적용
본 연구는 토폴로지 데이터 분석(TDA)에서 널리 사용되는 여과 함수의 안정성을 분석하고, 이를 바탕으로 약하게 종속된 데이터에서 얻은 토폴로지 데이터 객체 시퀀스의 구조적 변화를 감지하고 판별하는 테스트 절차를 개발하는 것을 목표로 합니다.
본 연구는 먼저 비임의적 부분에서 시작하여 유한 집합 J ⊆ [r] := {1, ..., r}과 벡터 x = (x1, ..., xr)T에 대해 심플렉스 xJ = (xj : j ∈ J)T의 여과 시간 ϕJ를 반환하는 여과 함수 ϕ의 안정성 결과를 고려합니다. 여기서 각 xi는 Rd의 콤팩트하고 볼록하며 전체 d차원 집합인 M ⊆ Rd의 요소입니다. 그런 다음 전체 여과 함수는 특정 최소 부분 집합 J1 ⊂ J2 ⊂ ... ⊂ JL ⊆ [n]에 대해 L개의 다른 값 ϕJ1 < ϕJ2 < ... < ϕJL를 취합니다. 본 연구에서는 함수 ρ: Mr → [0, ∞)를 연구합니다. 여기서 B⊗r(x; ε) = Qri=1 B(xi; ε)는 유클리드 2-놈에 대한 닫힌 ε-근방의 곱입니다. 여기서 Chazal과 Divol [8]의 기여를 기반으로 합니다. 본 연구의 설정에서 함수 ρ는 Mr에서 Lebesgue-a.e. 양수이며, (d · r) 차원 Lebesgue 측정이 λdr({x ∈ Mr | ρ(x) ≤ t}) ≲ tα (t ∈ [0, 1])를 만족하는 α ∈ (0, 1]의 존재에 대한 충분한 조건을 제시합니다. ˇCech 여과 함수는 α = 1/2를 만족하는 반면, Vietoris-Rips 여과 함수는 α = 1을 만족함을 보여줍니다. 이 안정성 결과는 두 번째 부분에서 약하게 종속된 포인트 클라우드에서 얻은 지속 다이어그램(PDk,t)t의 차원 k의 의존성과 점근적 동작을 정량화하는 데 적용됩니다. 보다 자세히 말하면, Lipschitz 연속 함수 f를 사용하여 특징 벡터 표현 Zk,1, ..., Zk,n의 시퀀스 (PDk,t)t에서 파생된 토폴로지 통계 f(Zk,1), ..., f(Zk,n) 시퀀스를 연구합니다. 여기서 Zk,t는 포인트 클라우드 Xt = (Xt,1, ..., Xt,r) ⊂ Mr의 k차원 지속 다이어그램 PDk,t를 일대일로 인코딩합니다. (Zk,t)t는 (Xt)t가 더 높은 차수 p'에 대해 Lp'-m-근사 가능하고 위의 계수 α를 포함하는 경우 Lp-m-근사 가능함을 보여줍니다. 마지막으로 세 번째 부분에서는 (1.3)의 데이터에 대해 Aue et al. [2]의 정신에 따라 (f(Zk,t))t 통계에 대해 CUSUM 통계 기반 테스트 절차를 개발합니다. 귀무 가설에서 극한 분포는 알려져 있습니다(예: [2] 참조). 대안 및 통계 (f(Zk,t))t의 평균 변화의 특정 경우 CUSUM 통계 기반 변화점 추정량 bθn은 n−1an의 비율로 강력하게 일치합니다. 여기서 합리적인 조건 (an)n에서는 an/(n1/2 log log n) → ∞만 만족하면 됩니다.