下流タスクのパフォーマンスを最適化するために、上流の特徴量表現を学習することの重要性を明らかにする。特に、タスク関連の特徴量と入力データの構造の両方を学習することが重要であり、それらの寄与がバイアスと分散の観点から特徴づけられる。