核心概念
本文提出了一種基於持久同源 (PH) 的統一框架,用於表徵無序系統中的局部和全局結構,並通過機器學習和傳統物理方法驗證了其在預測粒子重排和分類全局相方面的有效性和可解釋性。
論文概述
本論文提出了一種基於持久同源 (PH) 的統一框架,用於表徵無序系統中的局部和全局結構。該框架使用相同的算法和數據結構同時生成局部和全局描述符,並已證明在預測粒子重排和分類全局相方面非常有效且易於解釋。
研究背景
局部和全局結構表徵強調材料的不同方面。局部表徵側重於微觀特徵,如配位環境、短程有序、鍵角和鍵長;而全局表徵則側重於宏觀特徵,如長程有序、相結構、晶格常數和整體對稱性。現有的大多數全局表徵方法依賴於對局部特徵進行簡單操作(如平均、串聯或變換)來從局部表徵中得出全局表示。因此,局部和全局表徵通常源於不同的數學框架、算法或數據結構,缺乏一個統一的數學框架來解釋微觀結構如何與宏觀性質相互作用和轉變。
研究方法
持久同源 (PH) 是一種從代數拓撲學中衍生出來的方法,它可以將點雲的拓撲信息編碼成可向量化的表示。基於這種方法,作者開發了一個框架,可以對無序系統進行局部和全局表徵。
局部表徵
粒子的局部環境由其鄰域(周圍區域)表徵。對於粒子 pi,其鄰域表示為 L(P)i(r) = {a ∈ R3 | ∥pi − a∥2 ≤ r},其中 r > 0。通過計算一系列遞增半徑 r1 < r2 < ... < rN 的 PH,為每個相應的鄰域生成點雲 P(P)p,q。每個點雲 P(P)p,q 都有一個對應的持久圖像 (PI) 向量 V(P)p,q。直觀地說,較小半徑的鄰域對局部特徵的影響更大,而較大半徑的鄰域的貢獻較小。因此,粒子 p 的多尺度 PI 特徵向量 I(P)p 通過將 PI 向量與指數衰減相加得到:
I(P)p = Σ(q=1, N) V(P)p,q * e^(-τ(rq-r1))
全局表徵
對於整個系統,PH 直接應用於點雲 P,得到全局 PI 向量:
I(P)entire = Vec(P)
全局 PI 向量捕獲系統的整體結構,而局部 PI 向量通過擴展鄰域半徑並對較遠區域的影響進行指數衰減來提供多尺度信息。這些向量共同建立了一個統一的數學框架,將全局結構與單個粒子的局部環境聯繫起來。
結果與討論
作者通過兩個分類任務驗證了該框架的有效性:
**預測粒子重排:**使用局部描述符 I(P)p 來識別在特定條件下容易發生重排的粒子。
**相分類:**使用全局描述符 I(P)entire 對液相、晶相和非晶相進行分類。
結果表明,線性核在兩項任務中都略優於 RBF 核,但無論使用哪種核,準確率都保持較高水平。主成分分析 (PCA) 在性能損失很小的情況下顯著減少了預測變量的數量,這表明粒子重排(任務 1)和相(任務 2)是由少數特徵決定的。
結論
作者提出了一種基於持久同源 (PH) 的統一框架,用於表徵無序系統中的局部和全局結構。該框架可以作為傳統物理方法的補充,提供一個統一的表示,無縫地解釋微觀結構如何影響宏觀性質。此外,它還可以生成高性能的描述符,豐富可解釋機器學習的下游任務中的特徵工程或初始結構映射。
統計資料
使用了包含 864 個粒子的 Lennard-Jones (LJ) 系統進行分子動力學 (MD) 模擬。
探索了 20 個不同溫度的等溫軌跡,並將其分為兩組進行訓練和測試。
使用了 Kob-Andersen (KA) 二元混合物進行額外的淬火模擬,以研究玻璃化過程。
採用了主成分分析 (PCA) 來降低特徵矩陣的維度,同時保留 98% 的方差。
使用支持向量機 (SVM) 進行分類,測試了線性和 RBF 核。