Core Concepts
近似UMAPは、標準UMAPと同等の精度の2D/3D表現を生成しながら、投影速度を1桁向上させ、学習時間も同等に保つことができる。
Abstract
本研究では、高次元データのリアルタイム可視化を目的として、近似UMAPと呼ばれる新しいUMAP手法を提案している。
近似UMAPは、標準UMAPと同様の手法で学習を行うが、新しいデータ点の投影にはk近傍法を用いて高速化を図っている。
実験の結果、近似UMAPは以下のことが示された:
標準UMAPと同等の2D/3D表現を生成できる
投影速度を1桁向上させることができる
学習時間も標準UMAPと同等に保つことができる
一方で、近似UMAPは標準UMAPよりも外れ値の発生が多い傾向にある。
これらの結果から、近似UMAPはリアルタイムの可視化に適した手法であると考えられる。ただし、高精度を求める場合は、パラメトリックUMAPの利用も検討に値する。
Stats
近似UMAPの投影結果は、標準UMAPの投影結果から平均で0.1~0.25標準偏差の範囲内にある
近似UMAPの投影時間は、標準UMAPの1桁短い
パラメトリックUMAPの学習時間は、標準UMAPや近似UMAPよりも1桁長い
Quotes
"近似UMAPは、標準UMAPと同等の2D/3D表現を生成しながら、投影速度を1桁向上させ、学習時間も同等に保つことができる。"
"一方で、近似UMAPは標準UMAPよりも外れ値の発生が多い傾向にある。"