핵심 개념
고차원 데이터에서 기존의 퍼시스턴트 호몰로지는 노이즈에 취약하지만, k-최근접 이웃 그래프의 스펙트럼 거리(예: 유효 저항, 확산 거리)를 사용하면 노이즈가 있는 경우에도 정확한 토폴로지를 감지할 수 있습니다.
초록
고차원 데이터에서의 퍼시스턴트 호몰로지 분석: 스펙트럼 방법의 강건성
본 연구는 고차원 데이터에서 기존 퍼시스턴트 호몰로지의 한계점을 분석하고, 노이즈가 있는 고차원 데이터에서도 강건하게 토폴로지를 감지할 수 있는 스펙트럼 방법을 제안합니다.
고차원 공간에 내장된 저차원 매니폴드에서 샘플링된 점 구름 데이터를 사용합니다.
유클리디안 거리, DTM, Fermat 거리, 지오데식 거리, UMAP/t-SNE 기반 거리, 스펙트럼 거리(유효 저항, 확산 거리, 라플라시안 고유지도 거리) 등 다양한 거리 척도를 퍼시스턴트 호몰로지에 적용합니다.
노이즈 수준과 주변 공간 차원을 변화시키면서 다양한 합성 데이터셋(원, 연결된 원, 안경, 구, 토러스)에서 각 방법의 성능을 비교합니다.
단일 세포 RNA 시퀀싱 데이터에서 세포 주기 루프를 찾는 실제 데이터셋에 적용하여 제안된 방법의 효과를 검증합니다.