Core Concepts
클러스터 중심점에 의존하지 않고 거리 행렬만으로 퍼지 멤버십 행렬을 직접 최적화하는 새로운 퍼지 K-평균 클러스터링 알고리즘을 제안한다.
Abstract
이 논문은 클러스터 중심점에 의존하지 않는 새로운 퍼지 K-평균 클러스터링 알고리즘을 제안한다. 기존의 퍼지 K-평균 클러스터링은 초기 클러스터 중심점 선택과 중심점 업데이트에 민감한 문제가 있었다.
제안하는 알고리즘은 클러스터 중심점을 전혀 사용하지 않고, 오직 샘플 간 거리 행렬만을 이용하여 퍼지 멤버십 행렬을 직접 최적화한다. 이를 통해 거리 측정의 유연성을 높이고 알고리즘의 성능과 강건성을 향상시킨다.
논문에서는 제안 모델이 기존 퍼지 K-평균 클러스터링과 이론적으로 동등함을 증명하였다. 또한 다양한 거리 측정 방법을 적용할 수 있는 일반적인 프레임워크를 제시하였다.
실험 결과, 제안 알고리즘은 다양한 벤치마크 데이터셋에서 기존 알고리즘들보다 우수한 성능을 보였다. 특히 유클리드 거리와 K-최근접 이웃 거리를 사용한 경우 가장 좋은 결과를 얻었다.
Stats
데이터셋의 크기와 차원, 클러스터 수는 다음과 같다:
AR: 3120 샘플, 2000 차원, 120 클러스터
JAFFE: 213 샘플, 676 차원, 10 클러스터
MSRC_V2: 210 샘플, 576 차원, 7 클러스터
ORL: 400 샘플, 1024 차원, 40 클러스터
UMIST: 575 샘플, 1024 차원, 20 클러스터
USPS: 3000 샘플, 256 차원, 10 클러스터
Yaleface: 165 샘플, 1024 차원, 15 클러스터