Conceptos Básicos
Cosine similarity in embeddings can yield arbitrary and potentially meaningless results due to the influence of regularization techniques, cautioning against blind usage.
Resumen
コサイン類似度は埋め込みにおいて任意の結果をもたらす可能性があり、正規化手法の影響により意味のない結果が生じることがある。このため、盲目的な使用に注意が必要である。線形行列因子分解モデルを用いた解析的洞察とシミュレーションデータによる実験を通じて、この問題を軽減するアプローチを提案している。
Estadísticas
コサイン類似度は、学習された埋め込み間の意味的類似性を測定する際に一般的に使用されている。
線形行列因子分解モデルでは、コサイン類似度は正則化技術の影響を受け、意味のない結果をもたらす可能性がある。
実験では、λ = 10,000およびλ = 100など異なる正則化パラメーターで学習された結果が比較されている。
Citas
"it has, however, also become a very popular measure of semantic similarity between the entities of interest"
"While there are countless papers that report the successful use of cosine similarity in practical applications"
"We caution against blindly using cosine-similarity and outline alternatives"