核心概念
本文提出了一種新的混合量子經典視覺轉換器架構,該架構結合了量子正交神經網絡 (QONN),以提高高能物理應用中的性能和計算效率。
本文介紹了一種新穎的混合量子經典視覺轉換器架構,該架構結合了量子正交神經網絡 (QONN),旨在增強高能物理應用中的性能和計算效率。基於量子視覺轉換器的進展,我們的方法利用了 QONN 的固有優勢(包括穩定性和在高維空間中的高效參數化)來解決先前模型的局限性。我們使用來自 CMS 開放數據的多探測器噴射圖像評估了所提出的架構,重點關注區分夸克引發和膠子引發噴射的任務。結果表明,在注意力機制中嵌入量子正交變換可以提供強大的性能,同時為即將到來的 高亮度大型強子對撞機 帶來的機器學習挑戰提供有希望的可擴展性。這項工作突出了量子增強模型在解決下一代粒子物理實驗的計算需求方面的潛力。
預計將於 本 十年末在歐洲核子研究中心啟動的高亮度大型強子對撞機 (HL-LHC) [1] 預計將產生前所未有的數據量,因此需要先進的計算框架和策略來高效地處理、處理和分析這個龐大的數據集。經典計算資源雖然有效,但在擴展到此類高維任務預計的數據和計算需求方面面臨著嚴重的限制。為了應對這一挑戰,量子機器學習 (QML) [2, 3] 已成為一種很有前途的解決方案。
量子視覺轉換器 (QViT) [4, 5, 6, 7] 最近被提出作為混合架構,它將量子電路集成到經典視覺轉換器 (ViT) [8] 框架中,以減少時間複雜度並提高涉及高維數據的機器學習任務的性能。傳統的 ViT 採用自注意力機制 [9] 和多層感知器 (MLP) [10] 從圖像數據中學習,這在各個領域的計算機視覺任務中都顯示出良好的效果。為了進一步推進這些模型,研究人員探索用 ansatz 量子電路 (VQC) 替換自注意力機制中的經典線性投影層,這是一種旨在利用量子計算來提高參數優化和特徵提取效率的策略。
我們的工作建立在這個量子經典混合框架的基礎上,利用了量子正交神經網絡 (QONN) [11, 12]。這種修改通過實現固有的正交變換提供了一項根本性進步,從而為高能物理特徵的高維數據空間提供了穩定性和改進的梯度特性。QONN 的正交性允許更有效的學習並增強模型的魯棒性,這在數據複雜性和噪聲構成重大挑戰的情況下尤其有利,例如粒子物理學中的噴射分類。
為了證明我們基於 QONN 的 QViT 模型的有效性,我們將其應用於使用來自 CMS 開放數據門戶 [13] 的多探測器噴射圖像來區分夸克引發和膠子引發噴射的問題。由於噴射分類對識別基本粒子相互作用和為粒子加速器上的實驗設計提供信息具有重要意義,因此它是高能物理學中一個經過充分研究的問題 [14]。
這項研究代表了量子增強機器學習的一項進步,特別是對於高能物理學中的任務。通過在轉換器架構中利用 QONN,我們的目標是提高 QML 高效處理高維數據集的能力。我們使用 CMS 開放數據進行的模型評估表明,QONN 提供了高效的計算和強大的分類性能,突出了它們在物理和其他領域的實際應用潛力。