核心概念
本論文は、画像の因果的な反事実生成手法の包括的な評価フレームワークを提案する。このフレームワークは、生成された反事実画像の多様な側面を評価するための指標を組み込んでおり、構成性、有効性、介入の最小性、画像の現実性などを評価する。
要約
本論文は、画像の因果的な反事実生成手法の包括的な評価フレームワークを提示している。
まず、構造的因果モデル(SCM)に基づく反事実画像生成手法について説明する。SCMは、変数間の因果関係を表現するモデルであり、Deep-SCMフレームワークを用いて、深層学習手法を組み合わせて反事実推論を行う。
次に、提案する評価指標について詳述する。構成性、有効性、現実性、最小性の4つの指標を定義し、それぞれの計算方法を説明する。構成性は、介入を加えても画像が変化しないことを評価する。有効性は、介入した変数が目的の値に変化することを評価する。現実性はFIDを用いて生成画像の現実感を評価する。最小性は、反事実画像と元の画像の差異を最小限に抑えることを評価する。
最後に、MorphoMNISTとCelebAデータセットを用いて、3種類の反事実画像生成手法(Normalizing Flows、Conditional VAE、Conditional GAN)を提案指標で評価し、結果を示している。HVAE(Hierarchical VAE)が全体的に良好な性能を示すことが分かった。
統計
反事実画像と元の画像の差異を表すL1ノルムは、HVAEが最も小さい。
介入した変数の予測精度(F1スコア)は、HVAEが最も高い。
生成画像の現実性を表すFIDスコアは、HVAEが最も良好。