Core Concepts
임베딩의 코사인 유사성은 모델링 및 정규화 기술에 따라 의미가 모호해질 수 있음을 경고하고 대안을 제시함.
Abstract
코사인 유사성은 임베딩 간의 의미론적 유사성을 측정하는 인기 있는 방법이지만, 모델링 및 정규화 기술에 따라 결과가 임의적이고 유일하지 않을 수 있음.
선형 행렬 인수분해 모델을 통해 분석적인 해석을 제시하고, 실험적 결과를 통해 이러한 문제를 시각적으로 보여줌.
코사인 유사성의 사용을 경계하고 이 문제를 완화하기 위한 몇 가지 방법을 제안함.
Stats
코사인 유사성은 모델링 및 정규화 기술에 따라 결과가 임의적이고 유일하지 않을 수 있음.
선형 행렬 인수분해 모델을 통해 분석적인 해석을 제시하고, 실험적 결과를 통해 이러한 문제를 시각적으로 보여줌.
코사인 유사성의 사용을 경계하고 이 문제를 완화하기 위한 몇 가지 방법을 제안함.
Quotes
"코사인 유사성은 모델링 및 정규화 기술에 따라 결과가 임의적이고 유일하지 않을 수 있음."
"코사인 유사성의 사용을 경계하고 이 문제를 완화하기 위한 몇 가지 방법을 제안함."