本論文は、教育コンテキストにおける知識の構造分解と段階的なガイド出力を実現するための、事前モジュールを統合した3段階SFTハイブリッドモデルを提案している。
まず、データのサンプリングと重複推定ネットワークを用いて高品質なデータセットを作成する。次に、3段階のLORAファインチューニングを行い、一般ドメイン知識、コード、教育、マルチターンダイアログデータを段階的に注入することで、モデルの特定ドメインでの性能を大幅に向上させる。
さらに、ベクトルデータベース、抽象構文木、効率的なシステムプロンプトを統合した事前モジュールを設計し、チューターの役割に関連付けられた強力な相関制約を実現する。
最後に、正則化制約、モデル圧縮、プルーニング、テキストフィルタリングを通じてモデルを最適化し、教育コンテキストでの実現可能性を証明する。
この方法により、チューターの本質を真に体現し、オープンソースの大規模言語モデルの中で最高水準のコーディング能力を達成するとともに、多くの比較実験でも高い精度と堅牢性を実証している。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Zhangquan Ch... a las arxiv.org 03-26-2024
https://arxiv.org/pdf/2403.15426.pdfConsultas más profundas