本論文は、ディープエンサンブル(DE)の推論コストを大幅に削減する新しい手法であるディフュージョンブリッジネットワーク(DBN)を提案している。
DEは、異なる初期値や学習順序で独立に訓練された複数のモデルの出力を平均化することで、予測精度や不確実性の定量化、OOD頑健性を向上させる手法である。しかし、推論時にはモデルの数だけ順伝播計算を行う必要があり、計算コストが大きくなるという課題がある。
DBNは、ディフュージョンシュレーディンガーブリッジ(DSB)理論に基づき、単一のアンサンブルメンバーの出力分布から全体のアンサンブル出力分布への確率的な遷移を直接学習する。これにより、全てのアンサンブルメンバーの順伝播を行わずに、アンサンブル予測を近似できる。さらに、ディフュージョンステップの蒸留を導入することで、推論速度を大幅に向上させている。
実験では、CIFAR-10、CIFAR-100、TinyImageNetのベンチマークデータセットにおいて、DBNがDE-3の性能を達成しつつ、計算コストを大幅に削減できることを示している。また、単一のDBNモデルが3つのアンサンブルモデルの知識を効果的に学習・蒸留できることも確認している。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Hyunsu Kim,J... a las arxiv.org 04-25-2024
https://arxiv.org/pdf/2404.15814.pdfConsultas más profundas