最近の研究によると、現在の基盤モデルトレーニング環境では、公開ドメインデータへの重大な依存があります。さらなるスケールアップを図るためには、複数の専門的で高品質なプライベートドメインデータソース間で協力を組み込むことが不可欠です。しかし、プライベートデータを共有せずにローカルでモデルをトレーニングするという課題は、多くの障壁を生じさせます。この問題に対処するために、基盤モデルのフェデレーテッドファインチューニング用のデータ品質管理パイプラインが提案されています。このパイプラインはトレーニングデータの品質を反映したスコアを計算し、統一された標準のグローバルしきい値を決定します。
以前は手動選択プロセスに依存していましたが(Touvron et al.、2023b;a)、最近では低品質なデータフィルター(Computer, 2023)が導入されています。これらの自動化された方法は、中央集権的な設定で効率的なトレーニング効率向上を図ることが意図されています。
提案された品質管理パイプラインは大規模言語モデル(LLMs)のフェデレーテッドファインチューニング用に設計されており、混合品質環境で顕著な性能向上を示しています。具体的には、スコアリング関数として使用するための評価アルゴリズムを取り入れており、個々のトレーニングサンプル品質を細かく評価します。
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor