Core Concepts
growclustersパッケージのR-Shinyアプリケーションを開発し、月刊労働レビューの記事データを用いてクラスタリングを行う。
Abstract
本論文では、growclustersパッケージのR-Shinyアプリケーションの開発について述べている。
gendata Shinyアプリケーションでは、ユーザーが任意のクラスタ構造を持つ合成データを生成できる。ユーザーは、クラスタ数や各クラスタのサイズなどを指定できる。
dpGrowclustersアプリケーションでは、単一ソースのクラスタリングを行う。ユーザーは、データをロードし、クラスタリング手法を選択して実行できる。結果は、散布図行列やパラレルプロットで可視化できる。
hdpGrowclustersアプリケーションでは、階層的なクラスタリングを行う。ここでは、データに既知のサブドメイン構造がある場合を想定している。例えば、月刊労働レビューの記事データでは、記事の発行年がサブドメインに相当する。このアプリケーションでは、サブドメイン別のクラスタ分布を可視化する機能も提供している。
これらのShinyアプリケーションは、growclustersパッケージの機能を直感的に利用できるようにするために開発された。月刊労働レビューの記事データを用いて、アプリケーションの機能を説明した。
Stats
月刊労働レビューの記事データは2000年から2013年の期間のものを使用した。
各記事は計算可能な形式に変換されており、各データ点は1つの記事に対応する。
月刊労働レビューは、BLSが発行する主要な事実、分析、研究の雑誌である。