Główne pojęcia
SMARTは、指示調整のためのサブモジュラーデータ混合戦略を導入し、従来の手法を大幅に上回ることを実証します。
Streszczenie
Instruction Tuningは、未知のタスクに対するモデルの汎用性を向上させるために言語モデルを微調整する方法です。
SMARTは、サブモジュラー関数を使用してタスクに重要度スコアを割り当て、混合ウェイトを決定し、各タスクから非冗長なサンプルを選択します。
実験結果は、SMARTが例示比例混合や均等混合などの従来の方法よりも優れていることを明らかにしています。
低予算設定では、代表的なタスクの一部に予算を割り当てることがパフォーマンス向上につながることが示されています。
Statystyki
研究はFLAN 2022(Longpre et al.、2023)で行われました。
SMARTはExamples Proportional MixingやEqual Mixingなどの従来の手法よりも優れた結果を示しました。
最適なf1およびf2はグリッドサーチで見つけられました。
Cytaty
"Your ability to juggle many tasks will take you far."