核心概念
複数の専門家を活用する学習の遅延問題に対して、新しい代理損失関数を提案し、その理論的な保証を示した。
要約
本論文では、複数の専門家を活用する学習の遅延問題を扱っている。
専門家の予測を活用することで、既存のモデルの性能を大幅に向上できる。例えば、言語モデルの誤情報生成への対策として、専門家の予測に頼ることが有効。
従来の研究では単一の専門家を想定していたが、本論文では複数の専門家を扱う。
新しい代理損失関数を提案し、その理論的な保証を示した。具体的には、H一致性の保証を得られることを示した。
提案の代理損失関数に基づいて、新しいアルゴリズムの設計が可能となる。
実験では、SVHN、CIFAR-10データセットを用いて、提案手法の有効性を確認した。
統計
専門家gj(x)の予測が正解と異なる確率は1gj(x)≠y
専門家gj(x)を利用する際の基本コストはβj