Core Concepts
PromptSAWは、プロンプトのテキスト情報を活用してグラフを構築し、そのグラフ構造から重要な情報要素を抽出することで、プロンプトを効果的に圧縮する。
Abstract
本論文では、PromptSAWと呼ばれる新しいプロンプト圧縮手法を提案している。PromptSAWは、プロンプトのテキスト情報からグラフ構造を構築し、そこから重要な情報要素を抽出することで、プロンプトを効果的に圧縮する。
具体的には、以下の2つのシナリオを考慮している:
タスク依存型プロンプト: グラフ内の重要な情報要素を選択的に保持することで、タスク関連の情報を維持しつつプロンプトを圧縮する。
タスク非依存型プロンプト: グラフ内の情報要素の類似性を評価し、類似度の低い要素のみを保持することで、プロンプトを圧縮する。
実験評価の結果、PromptSAWは既存手法と比較して、タスク依存型では最大14.3%、タスク非依存型では最大13.7%の性能向上を達成しつつ、プロンプトサイズを33.0%および56.7%圧縮することができた。また、PromptSAWによる圧縮プロンプトは、既存手法と比べて可読性が高いことも示された。
Stats
元のプロンプトは422トークンで、PromptSAWによる圧縮後は292トークンとなり、圧縮率は1.45倍となった。
元のプロンプトは524トークンで、PromptSAWによる圧縮後は227トークンとなり、圧縮率は2.31倍となった。
Quotes
"プロンプトの長さが増えるにつれ、LLMの能力が大幅に低下/制限される"
"自然言語は本質的に冗長であるため、元のテキストプロンプトの長さを大幅に圧縮しつつ必要な情報を保持することが可能"