Core Concepts
テスト時にユーザー指定のLLMを融合することで、LLMの多様な強みを活用し、タスクのパフォーマンスを向上させることができる。
Abstract
本研究では、テスト時のLLM融合手法「Pack of LLMs (PackLLM)」を提案している。PackLLMは、各LLMのパープレキシティを最小化するように重要度を決定し、LLMを融合する。
PackLLMsimは単純にパープレキシティに基づいて重要度を決定する。
PackLLMoptは、パープレキシティ最小化問題を近似的に解く。
100以上のLLMを用いた実験では、PackLLMが既存のテスト時融合手法に比べて1.72-1.89%の精度向上を示した。
また、新しいLLMを活用することで、学習ベースの融合手法に比べて3.92-11.94%の精度向上を示した。
Stats
入力プロンプトに対するLLMのパープレキシティが低いほど、その LLMの重要度が高くなる。
入力プロンプトの長さが長いほど、PackLLMの性能が向上する。