Core Concepts
メタヒューリスティックを使用したプロンプト学習の最適化手法の紹介。
Abstract
Abstract:
大規模言語モデルの出現以来、プロンプト学習はこれらのモデルを最適化しカスタマイズする人気のある方法となっている。
メタヒューリスティックを導入し、6つの典型的な手法(hill climbing、simulated annealing、genetic algorithms with/without crossover、tabu search、harmony search)をテストして効果的で人間が理解可能なプロンプトを発見することが示されている。
この手法は推論および画像生成タスクにおいて未知だった人間が理解可能なプロンプトを発見し、プロンプト最適化の可能性を開く。
Introduction:
大規模言語モデル(LLMs)に対する追加の最適化技術としてprompt learningが注目されている。
prompt learningは他の方法と異なり、モデルから勾配情報が不要であり、メモリ消費量や計算リソース要件が大幅に削減される。
Related Work:
プロンプト学習は大規模言語モデル(LLMs)のパフォーマンス向上に有効なアプローチである。
プロンプト学習方法は離散型と連続型に分類され、Chain-of-Thought技術を活用した推論タスクで大きな進展が見られている。
Methods:
PlumではPrompt learning using metaheuristic(Plum)という一般的なパラダイムが提案されており、さまざまなメタヒューリスティックアルゴリズムを応用して効果的なプロンプトを発見することが可能。
Experiments:
Plumアルゴリズムは指定時間内でGrIPSよりも優れたパフォーマンスを提供し、APIコール数も少なく抑えられていることが示されている。
Plum-HSはAPIコール数も少なく優れたパフォーマンスを達成し、将来的に他のpromptチューニングタスクに有望である。
Stats
大規模言語モデル(LLMs)[Devlin et al., 2018, Radford et al., 2019, Brown et al., 2020, Team et al., 2023, Roziere et al., 2023, Touvron et al., 2023a,b] の出現以来、prompt learningが注目されています。
Chain-of-Thought技術 [Wei et al., 2022b] を活用した推論タスクで大きな進展が見られます。