核心概念
大規模な言語モデル(LLMs)を人間の好みと一致させるために、より多くの応答を拡張することが、プロンプトを増やすよりも効果的である。
統計資料
数値実験から得られた結果:「Expanding responses yields more benefit than prompts.」
数値実験から得られた結果:「The empirical formulation of prompt diversity can establish a linear correlation with the final performance of LLMs.」