Core Concepts
位置エンベディングは、トークンの順序を表現するために、トークンエンベディングに追加されるベクトルである。絶対位置エンベディング、相対位置エンベディング、回転位置エンベディングなどの異なるタイプの位置エンベディングが存在し、それぞれ特徴がある。
Abstract
この記事では、位置エンベディングの概念について説明しています。
位置エンベディングは、RNNでは隠れ状態の更新に過去のタイムスタンプが使用されますが、トランスフォーマーではトークンの順序を考慮しないアテンションメカニズムを使用するため、導入されました。
位置エンベディングには以下の3つのタイプがあります:
絶対位置エンベディング:
トークンの位置を示すベクトル
トークンエンベディングと同じ次元を持つ
相対位置エンベディング:
トークンの相対的な位置関係を表現するベクトル
トークンエンベディングとは異なる次元を持つ
回転位置エンベディング:
位置情報をサイン関数を使って表現するベクトル
位置情報を圧縮できる
これらの位置エンベディングは、トランスフォーマーモデルにおいて、トークンの順序情報を付与するために使用されています。
Stats
この記事には、具体的な数値データは含まれていません。
Quotes
この記事には、特に印象的な引用文は含まれていません。