核心概念
機械学習の最新の革新により、ビニングを行わずに相関を含む多次元にわたる形で、データの展開が可能になった。既知の手法を改良し、新しい手法を開発し、同じ2つのデータセットに適用して性能を評価した。すべての手法が複雑な観測量にわたって正確に粒子レベルのスペクトルを再現できることがわかった。これらの手法は概念的に多様であり、標準模型をかつてないレベルの詳細で探査し、新現象への感度を高める一連の測定に役立つ興味深いツールキットを提供する。
摘要
本論文では、機械学習を用いた展開手法の概観を示した。既知の手法を改良し、新しい手法を開発した。これらの手法を同じ2つのデータセットに適用し、その性能を評価した。
まず、重み付けによる展開手法であるOmniFoldとその改良版のbOmniFoldを紹介した。これらは、分類器を用いて シミュレーションデータを重み付けすることで、粒子レベルの分布を推定する。
次に、分布写像による手法であるSchrödinger BridgeとDirect Diffusionを紹介した。これらは、生成ネットワークを用いて検出器レベルの分布を粒子レベルの分布に変換する。
最後に、生成的展開手法であるcINN、Transfermer、CFM、TraCFM、Latent Diffusionを紹介した。これらは、条件付き生成ネットワークを用いて、検出器レベルの事象から粒子レベルの事象を生成する。
すべての手法が複雑な観測量にわたって正確に粒子レベルのスペクトルを再現できることが示された。これらの手法は概念的に多様であり、標準模型をかつてないレベルの詳細で探査し、新現象への感度を高める一連の測定に役立つ興味深いツールキットを提供する。
統計資料
検出器レベルの分布と粒子レベルの分布の違いが最も大きいのは、ジェット多重度、グルーミングされたジェット質量、N-サブジェットネス比である。これらの違いは検出器のエネルギー閾値による影響が大きい。
重み付けによる展開手法では、大きな重みや小さな重みが統計的な希薄化を引き起こすため、Bayesian版のbOmniFoldはこれを抑制している。
引述
"機械学習の最新の革新により、ビニングを行わずに相関を含む多次元にわたる形で、データの展開が可能になった。"
"すべての手法が複雑な観測量にわたって正確に粒子レベルのスペクトルを再現できることがわかった。"
"これらの手法は概念的に多様であり、標準模型をかつてないレベルの詳細で探査し、新現象への感度を高める一連の測定に役立つ興味深いツールキットを提供する。"