核心概念
トップk分類の詳細な研究を行い、いくつかの一般的な代理損失関数がトップk損失に関してH-整合性境界を持つことを示した。さらに、正確性とカーディナリティkのトレードオフを扱うために、基数認識を考慮した損失関数を導入し、それらの代理損失関数を提案した。これらの損失関数を最小化することで、新しい基数認識アルゴリズムを得ることができる。
要約
本論文は、トップk分類の詳細な研究を行っている。
トップk分類は、入力に対して最も可能性の高いk個のクラスを予測する課題である。これは単一クラス予測を拡張したものである。
著者らは、いくつかの一般的な代理損失関数(comp-sum損失、制約付き損失)がトップk損失に関してH-整合性境界を持つことを示した。これは非漸近的で仮説集合特有の強い整合性保証である。
さらに、正確性とカーディナリティkのトレードオフを扱うために、基数認識を考慮した損失関数を導入した。
基数認識を考慮した代理損失関数(cost-sensitive comp-sum損失、cost-sensitive制約付き損失)を提案し、それらがトップk損失に関してH-整合性境界を持つことを示した。
提案手法の有効性を、CIFAR-100、ImageNet、CIFAR-10、SVHNデータセットでの実験結果により示した。
統計
同じ正確性を達成するためには、トップk分類器に比べて、基数認識アルゴリズムの予測サイズを大幅に小さくできる。
CIFAR-100、CIFAR-10、SVHNデータセットでは、98%の正確性を達成するのに、トップk分類器の約半分の基数で済む。
ImageNetデータセットでは、95%の正確性を達成するのに、トップk分類器の3分の2の基数で済む。