Core Concepts
t-viSNEは、t-SNEプロジェクションの正確性と意味を検査するための一連の調整された視覚化ビューを提供する。これにより、t-SNEの結果の信頼性を高め、パターンの解釈を支援する。
Abstract
本論文では、t-SNEプロジェクションの可視化と解釈を支援するインタラクティブツール「t-viSNE」を提案する。t-viSNEは以下の4つの主要な目標に取り組む:
ハイパーパラメータの探索: グリッド検索を使って、さまざまなパラメータ設定で生成された500個のプロジェクションから、代表的な25個のプロジェクションを選択し、ユーザーに提示する。ユーザーは視覚的な探索と質的指標を使って、最適なプロジェクションを選択できる。
概要: メインビューでは、t-SNEの結果をインタラクティブなスキャッタープロットで表示する。ラベルの色付けや、密度や残差コストの視覚化などを通して、データの全体像を把握できる。
品質: シェパードヒートマップ、近傍保存、密度と残差コストの視覚化などを通して、プロジェクションの正確性を評価できる。ユーザーは特定の領域の品質を詳しく調べることができる。
次元: アダプティブ平行座標プロットと次元相関ツールを使って、プロジェクションに現れるパターンと元のデータ次元との関係を解釈できる。ユーザーは任意の形状のパターンを選択し、それがどの次元に強く相関しているかを確認できる。
これらの機能を通して、t-viSNEは通常t-SNEの「ブラックボックス」に隠れている情報を引き出し、ユーザーがt-SNEの結果を理解し、信頼できるようにすることを目的としている。
Stats
近傍の密度が異なる3つのガウス分布クラスターを2次元に射影した際、t-SNEはクラスターの密度差を失うが、t-viSNEはクラスターの密度差を正しく表現できる。
アイリスデータセットの中で、2つの種が混在する領域の点は、他の領域の点に比べて残差コストが高い。これは、その領域の点が2つの種の中間的な特徴を持つことを示唆している。
Quotes
"t-SNEプロジェクションは、複雑なパターンを非常に正確に捉えることができるが、その結果を解釈するのは難しい問題である。"
"t-SNEの内部動作の詳細を可視化することで、ユーザーがt-SNEの結果を理解し、信頼できるようにすることが重要である。"