核心概念
教育知識の構造分解と段階的ガイド出力を実現する、事前モジュールを統合した3段階SFTハイブリッドモデル
摘要
本論文は、教育コンテキストにおける知識の構造分解と段階的なガイド出力を実現するための、事前モジュールを統合した3段階SFTハイブリッドモデルを提案している。
まず、データのサンプリングと重複推定ネットワークを用いて高品質なデータセットを作成する。次に、3段階のLORAファインチューニングを行い、一般ドメイン知識、コード、教育、マルチターンダイアログデータを段階的に注入することで、モデルの特定ドメインでの性能を大幅に向上させる。
さらに、ベクトルデータベース、抽象構文木、効率的なシステムプロンプトを統合した事前モジュールを設計し、チューターの役割に関連付けられた強力な相関制約を実現する。
最後に、正則化制約、モデル圧縮、プルーニング、テキストフィルタリングを通じてモデルを最適化し、教育コンテキストでの実現可能性を証明する。
この方法により、チューターの本質を真に体現し、オープンソースの大規模言語モデルの中で最高水準のコーディング能力を達成するとともに、多くの比較実験でも高い精度と堅牢性を実証している。
統計資料
教育コンテキストでは、一般的な大規模言語モデルの知識と認知が不足しているため、専門的な知識と指導能力が必要である。
提案モデルは、データのサンプリングと重複推定ネットワークを用いて高品質なデータセットを作成し、3段階のLORAファインチューニングを行うことで、特定ドメインでの性能を大幅に向上させている。
事前モジュールには、ベクトルデータベース、抽象構文木、効率的なシステムプロンプトが統合されており、チューターの役割に関連付けられた強力な相関制約を実現している。
正則化制約、モデル圧縮、プルーニング、テキストフィルタリングを通じてモデルを最適化し、教育コンテキストでの実現可能性を証明している。
引述
"教育コンテキストでは、一般的な大規模言語モデルの知識と認知が不足しているため、専門的な知識と指導能力が必要である。"
"提案モデルは、データのサンプリングと重複推定ネットワークを用いて高品質なデータセットを作成し、3段階のLORAファインチューニングを行うことで、特定ドメインでの性能を大幅に向上させている。"
"事前モジュールには、ベクトルデータベース、抽象構文木、効率的なシステムプロンプトが統合されており、チューターの役割に関連付けられた強力な相関制約を実現している。"