Core Concepts
多変量正規分布を用いた不確実性を考慮した損失関数を提案し、多視点予測と組み合わせることで、ノイズの多い教師データに対する分類精度を向上させる。
Abstract
本研究では、分類タスクにおける不確実性推定の手法を提案している。
まず、N次元多変量正規分布を仮定し、平均と分散を同時に予測する損失関数(UANLL)を提案した。この損失関数は、回帰問題の異分散回帰損失に似ており、予測の不確実性を考慮することができる。また、ラベルスムージングとの相性も良い。
次に、データ拡張を訓練時と推論時の両方で行い、各サンプルに対して複数の予測と不確実性推定を得る多視点予測手法を提案した。得られた予測と不確実性情報を用いて、最終的な予測を算出する手法として、多数決、重み付き多数決などを検討した。重み付き多数決の場合、重みの閾値をチューニングするためにパーティクルスワーム最適化を用いた。
提案手法をCIFAR-10データセットを用いて評価した結果、ノイズの多い教師データに対して高い精度を達成できることを示した。特に、多視点予測と組み合わせることで、精度が大幅に向上した。
Stats
提案手法のUANLL損失は、1サンプルあたりN次元の予測と1つの分散を出力する。
多視点予測では、各サンプルに対して50回の拡張を行い、それぞれの予測と不確実性を得る。
Quotes
"Two main questions should be resolved in that way. First, how to train a model to estimate uncertainties of its own predictions? And then, what to do with the uncertain predictions if they appear?"
"Given the multi-view predictions together with their uncertainties and confidences, we proposed several methods to calculate final predictions, including mode values and bin counts with soft and hard weights."