核心概念
知識移転を活用した合成データ生成手法により、システム同定プロセスの効率性と汎化能力が向上する。
摘要
この論文は、データ不足が特徴的な状況で過学習を解消し、モデルの汎化性と堅牢性を高めるための新しい合成データ生成手法に焦点を当てています。提案された方法論の中心にある概念は、同じクラス内のシステムからの知識移転です。具体的には、事前トレーニングされたメタモデルを介して合成データが生成されます。このアプローチは、既存のトレーニングデータと組み合わせて損失関数を定義する際にも使用されます。また、小規模なトレーニングデータセットで過学習を回避するために早期停止も行われます。提案手法の有効性は数値例を通じて示され、合成データがシステム同定プロセスに統合される利点が強調されています。
统计
γ = 0では訓練データだけにフィットし、γ ≥ 10ではバリデーションデータで訓練と類似したMSEが得られる。
テスト結果では、合成データを使用した場合と使用しなかった場合でR2係数に大きな改善が見られる。
プレトレーニング済みTransformerは12層であり、各層128ユニットおよび4つのアテンションヘッドを持つ。
パラメトリックモデルM(·; θ)は137個のパラメータで特徴付けられる。
引用
"Synthetic data generation for system identification: leveraging knowledge transfer from similar systems"
"The efficacy of the approach is shown through a numerical example that highlights the advantages of integrating synthetic data into the system identification process."
"In this paper, we leverage the power of synthetic data in scenarios of small-size training data."