Core Concepts
高次元バイオメディカルデータを2次元に次元削減した際の散布図に、クラスおよび特徴量の重心を重ね合わせることで、その解釈性を高めることができる。
Abstract
本研究では、高次元のバイオメディカルデータを2次元に次元削減する手法を提案している。具体的には、3つの神経遺伝性疾患(遺伝性痙性対麻痺、遺伝性小脳失調症、シャルコー・マリー・トゥース病)の235症例のデータを用いて検討を行った。
まず、970個の表現型特徴を31の特徴カテゴリーに集約した。次に、t-SNEを用いて2次元に次元削減し、各症例をマーカーとして散布図にプロットした。さらに、クラス(疾患)の重心と特徴量の重心を計算し、散布図に重ね合わせた。
クラスの重心を見ると、3つの疾患が明確に分離されていることがわかる。また、特徴量の重心を見ると、各疾患の特徴的な症状(例えば、小脳失調症では失調、運動障害、認知機能障害; シャルコー・マリー・トゥース病では筋力低下、筋萎縮、腱反射低下; 遺伝性痙性対麻痺では痙縮、腱反射亢進、感覚障害)が特徴的な位置関係を示すことがわかった。
このように、次元削減された散布図にクラスおよび特徴量の重心を重ね合わせることで、高次元データの解釈性が大幅に向上する。この手法は、バイオメディカル分野のみならず、様々な高次元データの可視化に応用できると考えられる。
Stats
高次元データを31の特徴カテゴリーに集約した。
235症例のデータを2次元に次元削減した。