核心概念
LHCの高エネルギー物理実験における欠損横運動量の推定問題に対して、FPGAを用いて10ナノ秒未満の高速な回帰木アルゴリズムを実装した。
摘要
本論文では、FPGAを用いた回帰木ベースのマシンラーニング手法の高速な並列実装を提案している。LHCの高エネルギー物理実験における欠損横運動量の推定問題を事例として取り上げ、20本の深さ10の決定木からなる回帰木アルゴリズムをFPGAで実装し、10ナノ秒未満の高速な処理を実現している。
提案手法は、従来のHLS(High Level Synthesis)ベースの実装と比較して、約10倍高速で、リソース使用量も約5倍小さい。DSP(Digital Signal Processor)やBRAM(Block RAM)を使用せずに、LUTとフリップフロップのみを用いて実装している。
さらに、ATLASのRPCを用いたミューオン運動量推定の問題にも適用し、従来のニューラルネットワークベースの手法と比較して、同等の物理性能を示しつつ、リソース使用量とレイテンシの点で優位性を示している。
提案手法は、LHCの高度化(HL-LHC)に向けたトリガーシステムの高度化において有用であると考えられる。
統計資料
LHCの欠損横運動量推定問題では、以下のような性能を示した:
40本の深さ6の決定木を用いた場合、レイテンシは25ナノ秒、リソース使用量はLUT 5.1k、FF 1.6kであった。
10本の深さ8の決定木を用いた場合、レイテンシは19ナノ秒、リソース使用量はLUT 10k、FF 4.7kであった。
20本の深さ10の決定木を用いた場合、レイテンシは10ナノ秒、リソース使用量はLUT 15.5k、FF 6.6kであった。
ATLASのRPCを用いたミューオン運動量推定問題では、以下のような性能を示した:
30本の深さ7の決定木を用いた場合、レイテンシは22ナノ秒、リソース使用量はLUT 11.3k、FF 3.8kであった。
引述
"LHCの高度化(HL-LHC)に向けたトリガーシステムの高度化において有用であると考えられる。"
"提案手法は、従来のHLS(High Level Synthesis)ベースの実装と比較して、約10倍高速で、リソース使用量も約5倍小さい。"