本論文では、クラス増分学習(CIL)における性能指標の問題点を指摘し、新しい指標を提案している。
まず、従来の指標である平均タスク精度(ACC)が、実際の性能を過度に楽観的に評価してしまうことを示した。実験では、高精度なCIL手法であるDERやWeight Alignでも、クラス間の精度ばらつきが大きく、品質管理の観点から問題があることが明らかになった。
そこで、最小増分クラス精度(MICA)という新しい指標を提案した。MICAは、各タスクにおける最小のクラス精度を表す指標で、CIL手法の最悪ケースの性能を示す。さらに、MICAの変動を考慮した総合指標WAMICA(Weighted Average MICA)も提案した。
実験の結果、従来指標のACCでは高性能と評価されていた手法も、MICAやWAMICAでは低い評価となり、Gdumbなどの単純な手法が最も良い結果を示した。これは、ACCが実際の性能を適切に反映していないことを示唆している。
提案手法は、CIL手法の評価において、より現実的な性能を反映し、品質管理に適した指標を提供する。今後の研究では、テストデータの入手が困難な状況での性能評価や、他の性能指標との組み合わせなどが課題として挙げられる。
לשפה אחרת
מתוכן המקור
arxiv.org
שאלות מעמיקות