핵심 개념
본 논문은 동적 상관 클러스터링 문제에서 3-근사 알고리즘의 한계를 극복하는 새로운 알고리즘을 제안한다.
초록
이 논문은 동적 상관 클러스터링 문제를 다룬다. 상관 클러스터링은 객체들의 유사성과 차이점을 바탕으로 객체들을 클러스터링하는 문제이다. 동적 설정에서는 레이블 변경이 업데이트로 주어진다.
기존의 Pivot 알고리즘은 3-근사 알고리즘이었지만, 이 알고리즘의 한계를 극복하기 위해 저자들은 ModifiedPivot 알고리즘을 제안한다. ModifiedPivot은 Pivot 알고리즘의 출력을 지역적으로 개선하여 3-근사를 돌파한다.
구체적으로 ModifiedPivot은 다음과 같은 과정을 거친다:
피벗 v를 선택한다.
Cv: v와 v의 이웃들로 구성된 클러스터
Dv: Cv 내에서 이웃이 매우 다른 정점들
D'v: Dv에서 무작위로 선택한 일부 정점들
Av: v와 인접하지 않지만 Cv와 유사한 이웃들
A'v: Av에서 무작위로 선택한 일부 정점들
A: 이전 피벗들의 Av들을 모은 집합
ModifiedPivot은 D'v 정점들을 싱글톤 클러스터로 보내고, A'v 정점들을 v의 클러스터에 추가한다. 이를 통해 Pivot 알고리즘의 단점을 극복하고 3-근사를 돌파한다.
저자들은 ModifiedPivot의 분석을 통해 2.997-근사 알고리즘임을 보인다.
통계
최적 클러스터링 비용은 β 이상이다.
최적 클러스터링 비용은 |V1||V2| 이하이다.
인용구
"Pivot 알고리즘은 유사하지 않은 정점들을 클러스터링하는 실수를 한다."
"Pivot 알고리즘은 유사한 정점들을 분리하는 실수를 한다."