本研究比較了三種無監督降維技術(PCA、UMAP和PaCMAP)在識別硅和水系統中的晶體相、點缺陷和界面的性能。
首先,我們評估了這些算法在識別晶體多型和熔融相方面的表現。PCA無法有效區分不同相,而UMAP和PaCMAP在適當初始化的情況下則可以清楚地區分晶體相和熔融相。
接下來,我們將分析重點轉移到點缺陷的識別上。對於硅中的單空位和插質,PCA無法提供有用信息,而UMAP和PaCMAP則能夠成功定位這些缺陷。對於水系統,即使在存在巨大類別不平衡的情況下,UMAP仍能夠識別出分子單空位和插質。
最後,我們探討了在過冷水中識別冰核的能力。UMAP在這方面表現出色,而PaCMAP則需要增加額外的冰晶體數據才能實現完全分離。
總的來說,PaCMAP在區分水和冰相方面優於UMAP,但在處理類別不平衡的情況下則表現不如UMAP。兩種算法都能有效地識別晶體缺陷,具體選擇取決於所研究系統的特點。
Іншою мовою
із вихідного контенту
arxiv.org
Глибші Запити