本論文は、教育コンテキストにおける知識の構造分解と段階的なガイド出力を実現するための、事前モジュールを統合した3段階SFTハイブリッドモデルを提案している。
まず、データのサンプリングと重複推定ネットワークを用いて高品質なデータセットを作成する。次に、3段階のLORAファインチューニングを行い、一般ドメイン知識、コード、教育、マルチターンダイアログデータを段階的に注入することで、モデルの特定ドメインでの性能を大幅に向上させる。
さらに、ベクトルデータベース、抽象構文木、効率的なシステムプロンプトを統合した事前モジュールを設計し、チューターの役割に関連付けられた強力な相関制約を実現する。
最後に、正則化制約、モデル圧縮、プルーニング、テキストフィルタリングを通じてモデルを最適化し、教育コンテキストでの実現可能性を証明する。
この方法により、チューターの本質を真に体現し、オープンソースの大規模言語モデルの中で最高水準のコーディング能力を達成するとともに、多くの比較実験でも高い精度と堅牢性を実証している。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Zhangquan Ch... lúc arxiv.org 03-26-2024
https://arxiv.org/pdf/2403.15426.pdfYêu cầu sâu hơn