本文提出使用強化學習(RL)來控制五角形貼片粒子的動態自組裝,以生成具有少量缺陷的十二角準晶體(DDQC)結構。
首先,作者使用Q學習法訓練RL代理,找到最佳的溫度控制策略。訓練過程中,RL代理自主發現了一個特徵溫度T*,在此溫度下結構波動增強了形成DDQC的機會。估計的策略是:當結構還未達到DDQC時,先將溫度快速調整到T*附近,讓系統有機會逃離亞穩定態;當DDQC已初步形成時,再緩慢降低溫度以消除缺陷,最終獲得高品質的DDQC。
作者進一步測試了估計的策略,發現即使初始溫度不同,也能可靠地生成DDQC。此外,作者還展示了RL在控制亞穩定態和不穩定目標結構方面的能力。通過簡單的三井位勢模型,作者分析了RL如何克服能量障礙的機制。
總的來說,本文展示了RL在動態自組裝控制中的潛力,不僅可以生成目標結構,還能提供物理洞見。RL自主發現了關鍵的特徵溫度,並設計出高效的溫度控制策略,優於傳統的緩慢降溫方法。
翻译成其他语言
从原文生成
arxiv.org
更深入的查询