Core Concepts
growclusters R 패키지에 포함될 R-Shiny 애플리케이션을 통해 다변량 데이터의 파티션 구조를 추정하고 시각화할 수 있다.
Abstract
이 논문은 growclusters R 패키지에 포함될 R-Shiny 애플리케이션을 소개한다. growclusters 패키지는 다변량 데이터의 파티션 구조를 추정하는 계층적 k-평균 클러스터링 방법을 구현한다.
R-Shiny 애플리케이션은 다음과 같은 기능을 제공한다:
gendata 애플리케이션: 사용자 정의 합성 데이터 세트 생성
dpGrowclusters 애플리케이션: 단일 소스 클러스터링 수행 및 시각화
hdpGrowclusters 애플리케이션: 계층적 클러스터링 수행 및 시각화
이 애플리케이션들은 2000-2013년 BLS Monthly Labor Review 기사 데이터를 사용하여 기능을 설명한다. 이 데이터는 연도별 그룹 구조를 가지고 있어 계층적 클러스터링 방법을 적용할 수 있다.
Stats
"각 데이터 세트는 알려진 그룹 구조를 가지고 있으며, 각 그룹은 단일 전역 파티션의 클러스터 평균에서 데이터를 추출한다."
"데이터 세트의 각 구성 요소는 데이터의 알려진 그룹에 해당한다."
Quotes
"growclusters 패키지는 다변량 데이터의 파티션 구조를 추정하는 계층적 버전의 k-평균 클러스터링을 구현한다."
"각 구성 데이터 세트는 데이터의 알려진 그룹에 해당한다."