核心概念
利用原子勢能描述子進行無監督分類可以有效識別晶體相、點缺陷和界面。
摘要
本研究比較了三種無監督降維技術(PCA、UMAP和PaCMAP)在識別硅和水系統中的晶體相、點缺陷和界面的性能。
首先,我們評估了這些算法在識別晶體多型和熔融相方面的表現。PCA無法有效區分不同相,而UMAP和PaCMAP在適當初始化的情況下則可以清楚地區分晶體相和熔融相。
接下來,我們將分析重點轉移到點缺陷的識別上。對於硅中的單空位和插質,PCA無法提供有用信息,而UMAP和PaCMAP則能夠成功定位這些缺陷。對於水系統,即使在存在巨大類別不平衡的情況下,UMAP仍能夠識別出分子單空位和插質。
最後,我們探討了在過冷水中識別冰核的能力。UMAP在這方面表現出色,而PaCMAP則需要增加額外的冰晶體數據才能實現完全分離。
總的來說,PaCMAP在區分水和冰相方面優於UMAP,但在處理類別不平衡的情況下則表現不如UMAP。兩種算法都能有效地識別晶體缺陷,具體選擇取決於所研究系統的特點。
統計資料
硅中單空位附近的四個最近鄰居原子缺失。
硅中插質原子及其三個最近鄰居原子被移位。
過冷水中冰核周圍的水分子與冰晶體分子有明顯不同的局部化學環境。
引述
"無監督算法提供了一種與所研究系統無關的替代方法,可以利用分子動力學模擬中預先計算的原子勢能描述子。"
"UMAP和PaCMAP都展現出良好的整體性能,具體選擇應根據所研究系統的特點而定。"