고차원 데이터에서 Wasserstein 거리의 약점을 극복하기 위해 투영 Wasserstein 거리를 제안하고, 이를 활용한 두 표본 검정 방법을 제시한다.
이 연구는 방향성 그래프 클러스터링 문제를 통계적 관점에서 접근하여, 방향성 스토캐스틱 블록 모델(DSBM)의 최대 우도 추정을 통해 관찰된 그래프 구조에 가장 부합하는 커뮤니티 할당을 추정한다.
리만 라플라스 근사는 선택한 리만 계량에 따라 특성이 크게 달라지며, 기존 방법은 무한 데이터 극한에서 편향된 결과를 보였다. 이를 해결하기 위해 두 가지 대안적 방법을 제안하였으며, 특히 피셔 정보 행렬을 활용한 방법이 이론적으로 정확하고 실험적으로도 우수한 성능을 보였다.
본 연구는 디리클레 혼합 모델(DMM)에서 KL 발산을 효율적으로 추정하기 위한 변분 접근법을 제안한다. 이 방법은 기존의 몬테카를로 기반 접근법에 비해 계산 효율성이 크게 향상되어 모델 비교와 추정 품질 평가를 신속하게 수행할 수 있다.