核心概念
高次元テキスト埋め込みは、ランダムベクトルと比較して、次元が増加しても最近傍探索(NNS)の意味を維持する傾向があり、「次元の呪い」の影響を受けにくいことが示唆される。
Chen, Z., Zhang, R., Zhao, X., Cheng, X., & Zhou, X. (2024). Exploring the Meaningfulness of Nearest Neighbor Search in High-Dimensional Space. arXiv preprint arXiv:2410.05752v1.
本研究は、高次元ベクトル空間、特にテキスト埋め込みデータセットにおいて、最近傍探索(NNS)がどれだけ意味をなすのかを探求することを目的とする。