Główne pojęcia
少数事例分類(FSC)では、訓練データと検証データの分布の違いにより、深層学習モデルの性能が大幅に低下する問題がある。特に、訓練データと検証データの間に偽相関が存在する場合、モデルはその偽相関に依存してしまい、一般化性能が悪化する。本研究では、この問題に取り組むための新しい大規模ベンチマーク「MetaCoCo」を提案する。
Streszczenie
本研究では、少数事例分類(FSC)における偽相関の問題に取り組むため、新しいベンチマーク「MetaCoCo」を提案した。
MetaCoCo の特徴は以下の通り:
100クラス、155のコンテキスト情報を含む大規模データセット
各クラスにさまざまなコンテキスト(背景)が関連付けられており、訓練データと検証データの間に偽相関が存在する
偽相関の程度を定量化するための新しい指標を提案
既存の最先端FSCモデルを評価した結果、偽相関の問題に対して十分な性能を発揮できないことを示した
これらの結果から、MetaCoCoは偽相関に頑健なFSCモデルの開発を促進する有用なベンチマークとなることが期待される。
Statystyki
本データセットには合計175,637枚の画像が含まれる。
100のクラスと155のコンテキストが定義されている。
訓練データ156,666枚、検証データ5,839枚、テストデータ12,268枚で構成される。
Cytaty
"少数事例分類(FSC)では、訓練データと検証データの分布の違いにより、深層学習モデルの性能が大幅に低下する問題がある。"
"特に、訓練データと検証データの間に偽相関が存在する場合、モデルはその偽相関に依存してしまい、一般化性能が悪化する。"