이 논문은 단어 임베딩 공간에 존재하는 해석 가능한 차원을 개선하는 방법을 제안한다. 단어 임베딩 공간에는 성별, 격식, 객체 속성 등을 나타내는 해석 가능한 차원이 존재한다. 이러한 차원은 사회과학, 신경과학 등 다양한 분야에서 유용한 도구로 활용된다. 기존에는 대조되는 시드 단어를 사용하여 차원을 계산하는 방식을 사용했지만, 이 방식은 항상 잘 작동하지 않는다.
이 논문에서는 시드 단어 기반 벡터와 사람의 평가 점수를 활용하여 해석 가능한 차원을 계산하는 방법을 제안한다. 객체 속성(크기, 위험도 등)과 문체적 특성(격식, 복잡성) 예측 작업에서 이 방법이 기존 시드 단어 기반 방식보다 우수한 성능을 보인다. 특히 시드 단어 기반 방식이 잘 작동하지 않는 경우에 큰 성능 향상을 보인다. 또한 제안 모델은 사람의 평가 점수와 동일한 척도로 예측을 수행할 수 있다는 장점이 있다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Katrin Erk,M... at arxiv.org 04-04-2024
https://arxiv.org/pdf/2404.02619.pdfDeeper Inquiries