這篇文章介紹了 E3x,這是一個用於構建關於三維空間的歐幾里得群 E(3) 等變神經網路的軟體套件,E(3) 包含了平移、旋轉和反射。與普通神經網路相比,E(3) 等變模型在輸入和/或輸出數據與三維物件相關聯時具有優勢。這是因為這些數量的數值(例如位置)通常取決於所選的坐標系。在參考坐標系變換下,這些數值會發生可預測的變化,但對於普通的機器學習模型來說,這些變化背後的規則可能難以學習。而內建 E(3) 等變性的神經網路可以保證精確滿足相關的變換規則,從而提高數據效率和準確性。
當我們想要用數字來描述空間中的一些幾何物件(例如點的集合或質量的分佈)時,我們需要選擇一個參考點作為原點,並在 x、y 和 z 方向上選擇一組正交基向量。這就定義了一個坐標系,它將物理空間中的點與 ℝ³ 中的數學點一一對應起來。然而,這個坐標系的選擇通常是任意的,我們也可以使用它的任何旋轉(或平移)版本。當我們使用機器學習模型處理幾何物件以提取分類或數值(對於迴歸任務)時,結果通常不應該依賴於我們對坐標系的選擇,因此它應該在平移、旋轉和(取決於任務)反射下保持不變。
在過去幾年中,等變機器學習模型已成功應用於許多不同的領域,例如電腦視覺、網格重建和量子化學。然而,實現等變運算並不容易,而且可能難以與現有的神經網路構建塊相協調。在實務中,這通常意味著設計普通神經網路所獲得的直覺和技能無法應用於構建等變模型,而且可能難以將現有的模型架構調整為等變版本。E3x 的目標是通過以下方式使等變模型的構建變得直觀和簡單:將特徵和神經網路構建塊推廣到等變,並允許將普通特徵和神經網路行為作為一種極限情況來恢復。
E3x 的理論基礎是群論和表示論。群論研究的是對稱性的數學,而表示論研究的是群在向量空間上的作用。E3x 使用這些數學工具來構建關於 E(3) 等變的神經網路。
E3x 的程式碼可以在 https://github.com/google-research/e3x 找到,詳細的文檔和使用範例可以在 https://e3x.readthedocs.io 找到。
翻譯成其他語言
從原文內容
arxiv.org
深入探究