Core Concepts
合成データの生成プロセスを調整することで、安全に関する懸念を現実世界と同様に再現できるようにする。
Abstract
本論文では、合成データの忠実度を4つのタイプに分類し、特に安全に関する懸念を再現する「安全に配慮した忠実度」(SA-fidelity)を提案している。
入力値忠実度(IV-fidelity)は、合成データと実世界データの画素レベルの類似性を要求する。
出力値忠実度(OV-fidelity)は、合成データと実世界データの出力値の類似性を要求する。
潜在特徴忠実度(LF-fidelity)は、合成データと実世界データの特徴抽出結果の類似性を要求する。
SA-fidelityは、合成データと実世界データの出力が同じ安全上の懸念を引き起こすことを要求する。
提案手法では、合成データ生成プロセスのパラメータを最適化することで、SA-fidelityを高めることができる。実験の結果、このような調整によって、合成データと実世界データの間の安全上の懸念の相関が高まることが示された。
Stats
合成データと実世界データの間で安全上の懸念が一致しない件数は、合成データの生成手法によって大きく異なる。
同じ合成データ生成器でも、最適な設定と最悪の設定では、安全上の懸念の不一致件数に大きな差がある。
安全に配慮した忠実度(SA-fidelity)を最適化する設定は、他の忠実度指標を最適化する設定とは必ずしも一致しない。
Quotes
"合成データの生成プロセスを調整することで、安全に関する懸念を現実世界と同様に再現できるようにする。"
"安全に配慮した忠実度(SA-fidelity)は、合成データと実世界データの出力が同じ安全上の懸念を引き起こすことを要求する。"