機械学習の進歩において重要な役割を果たす標準化されたベンチマークについて議論されています。しかし、これらの静的なベンチマークは多くの評価を受けることで汎化能力が低下し、新しいアプローチが競争する際に過剰適合を促します。この問題に対処するために、ライフロングベンチマークが導入されました。この記事では、ライフロング-CIFAR10とライフロング-ImageNetという大規模な拡張可能なベンチマークが作成されています。また、効率的な評価フレームワークであるSort & Search(S&S)も紹介されており、これによりコスト効率の良いライフロング・ベンチマーキングが実現されます。
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania