Core Concepts
CNNベースの説明アンサンブルを使用して、データセットの質、モデルが学習した表現、および説明の完全性を評価することができる。
Abstract
本研究では、CNNベースの説明アンサンブルを提案し、データセットの質、モデルの表現学習、および説明の完全性を評価するための新しい指標を紹介する。
まず、複数の説明手法を使用して説明を生成し、それらを組み合わせるCNNベースのモデルを訓練する。このモデルは、説明と対応するマスクを使用して物体のセグメンテーションを学習する。
次に、以下の3つの指標を提案する:
表現評価指標(ens)
説明アンサンブルのセグメンテーション性能を表す。高い値は、モデルが学習した表現の質が高いことを示す。
データ多様性指標(div)
訓練データとテストデータの性能差を表す。大きな差は、データセットの多様性が不足していることを示唆する。
説明完全性指標(exh)
説明が元の画像の特徴をどの程度捉えられているかを表す。高い値は、説明が十分に完全であることを示す。
これらの指標を使用して、さまざまな分類モデルの表現学習の質を比較し、データセットの課題を特定し、説明の完全性を評価した。結果は、CNNベースの説明アンサンブルが有効であることを示している。
Stats
表現評価指標(ens(iou))は、ResNet50が最も高い値を示した。
データ多様性指標(div(iou))は、"水ボトル"クラスで大きな差が見られた。
説明完全性指標(exh(iou))は、7つの説明手法を組み合わせた場合に最も高い値を示した。