本論文では、バイナリデータの内在次元を正確かつ効率的に計算する新しい手法を提案している。
まず、バイナリデータをFormal Concept Analysis (FCA)の文脈で表現し、形式概念自体を測定ツールとして使用する。これにより、メトリックを人工的に導入する必要がなくなる。
次に、最小サポート値sに基づいて形式概念を制限することで、内在次元の上限と下限を推定する。これにより、大規模かつ高次元のデータセットでも内在次元を効率的に計算できる。
具体的には、以下の手順で内在次元を推定する:
提案手法を、Tatti et al.が使用したデータセットおよび追加のデータセットに適用し、内在次元の推定結果と正規化相関次元を比較した。その結果、両者が捉えるデータの次元性の側面が異なることが示された。
本研究は、FCAの概念を活用して高次元バイナリデータの内在次元を効率的に推定する新しい手法を提示したものである。今後は、より大規模なデータセットへの適用や、内在次元の特性をより深く理解するための検討が期待される。
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Tom Hanika,T... alle arxiv.org 04-10-2024
https://arxiv.org/pdf/2404.06326.pdfDomande più approfondite