Core Concepts
위치 임베딩은 순서 정보를 포함하여 트랜스포머 모델에 도입되었다. 절대, 상대 및 회전 위치 임베딩은 각각 고유한 특성과 장단점을 가지고 있다.
Abstract
이 글은 위치 임베딩의 개념과 다양한 유형에 대해 설명한다.
RNN 모델에서는 이전 시간 단계의 은닉 상태를 사용하여 순서 정보를 포함할 수 있지만, 트랜스포머 모델은 토큰 간 관계만 고려하므로 순서 정보가 누락된다. 이를 해결하기 위해 위치 임베딩이 도입되었다.
절대 위치 임베딩은 단어 임베딩에 더해지는 벡터로, 단어의 위치를 나타낸다. 상대 위치 임베딩은 토큰 간 상대적 거리를 반영하며, 회전 위치 임베딩은 회전 변환을 통해 위치 정보를 인코딩한다. 각 방식은 고유한 장단점을 가지고 있다.
Stats
이 문서에는 구체적인 수치 데이터가 포함되어 있지 않습니다.
Quotes
이 문서에는 인용문이 포함되어 있지 않습니다.