核心概念
単一の正規化フローを用いて、シミュレーションの多変量分布をデータの分布に変換する手法を提案する。
要約
本研究では、高エネルギー物理学における分析に不可欠なシミュレーションイベントの不完全さを修正する手法を提案する。シミュレーションとデータの差異は、スケールファクターや重み付けなどの手法で効果的に修正されてきたが、根本的な分布の違いを修正することが重要である。
本研究では、単一の正規化フローを用いて、シミュレーションの多変量分布をデータの分布に変換する手法を提案する。正規化フローは、複雑な入力分布を単純な基底分布に写像する可逆な変換を学習する。提案手法では、シミュレーションとデータの両方を同時に学習し、boolean条件に基づいて異なる写像を学習する。これにより、単一のフローで両者の分布を修正することができる。
提案手法を物理的に意味のある多変量分布を持つ人工データセットに適用し、その有効性を検証した。マージナル分布、相関係数、識別器の性能の観点から、シミュレーションとデータの一致が大幅に改善されることを示した。特に、不連続な変数の分布も適切に修正できることが分かった。また、前処理として変数の滑らかな変換を行うことで、修正の質が向上することも示した。
統計
シミュレーションの pT 分布は指数関数的で、データとは異なるスケールパラメータを持つ。
シミュレーションの η 分布は、データよりも標準偏差が大きい。
vB
1 とvB
2 の分布は、シミュレーションとデータで不連続性の程度が異なる。