核心概念
ランダムに選択したセパレータは、人間が作成したプロンプトと同等の性能を発揮する可能性がある
要約
本論文では、プロンプト最適化のための新しい手法として、ランダムサンプリングを提案している。従来のプロンプト最適化手法は、言語モデルを使ってプロンプトを生成するアプローチが一般的だったが、本研究では単にボキャブラリからランダムにトークンを選択するだけでも、人間が作成したプロンプトと同等の性能が得られることを示している。
具体的には以下の3つのランダムサンプリング手法を提案している:
ランダムボキャブラリ: ボキャブラリからランダムにトークンを選択
ランダムコンテキストなし: 言語モデルの事前分布からランダムにサンプリング
ランダムコンテキストあり: 訓練データからサンプルを取り入れてコンテキスト情報を利用
これらの手法は、人間が作成したプロンプトや、言語モデルを使って生成したプロンプトと比べても遜色ない性能を示した。特に、ランダムボキャブラリ手法は、人間ベースラインに対して平均12%の相対的な性能向上を達成した。
さらに分析を行い、言語空間にはかなりの数の良質なセパレータが存在することを明らかにした。つまり、プロンプト最適化の余地はこれまで過小評価されていた可能性がある。また、ランダムに発見されたセパレータは、タスクや文脈を超えて一定の汎化性を持つことも示された。
以上より、ランダムサンプリングは、プロンプト最適化の強力なベースラインとなり得ることが示された。従来の手法に頼らずに、単純なランダムサンプリングでも高性能なプロンプトが発見できる可能性があることが明らかになった。
統計
ランダムボキャブラリ手法は、人間ベースラインに対して平均12%の相対的な性能向上を達成した。
ランダムに選択したセパレータには、40%以上の確率で人間ベースラインを上回るものが含まれていた。
引用
"ランダムに選択したセパレータは、人間が作成したプロンプトと同等の性能を発揮する可能性がある"
"言語空間にはかなりの数の良質なセパレータが存在する可能性がある"
"ランダムサンプリングは、プロンプト最適化の強力なベースラインとなり得る"