李 超,熊 楨,肖舒晴,王 強,劉 森,周才英
(江西理工大學理學院,江西 贛州 341000)
近年來,人工智能的快速發(fā)展使機器學習成為研究人員熱衷于嘗試的新方法。機器學習已被廣泛應用于化學、材料科學等領域。團簇是材料尺度納米材料的一個新概念[1],使得原子團簇在各領域的大量應用,目前對原子團簇的穩(wěn)態(tài)結構計算與預測的研究顯得尤為重要[2],主要集中在搜索穩(wěn)態(tài)結構,即能量最低的全局最優(yōu)結構。對于團簇的幾何結構,有關學者進行了不少的研究,主要通過勢能函數,獲得Au20團簇的穩(wěn)態(tài)結構[3]。本文主要通過XGBoost、LGBM、SVR、Random forest四種機器學習算法,建立Au20原子團簇能量的預測模型,結合優(yōu)化的粒子群算法,得到Au20的最穩(wěn)態(tài)結構。
引人庫倫矩陣,解決團簇坐標維度與機器學習輸入向量維度不匹配的問題,轉化維度方法如下:
(1)根據原子三維坐標、原子核數、構建庫倫矩陣[4]。
式中,Pi表示第i個原子的核電荷數;Ui為第i個原子的坐標向量;Cij為對應庫倫矩陣的第i行,第j列的元素。
(2)通過提取矩陣的特征值把N×N維的庫倫矩陣降維成N×1的特征向量。
(3)得到機器學習的輸入向量。
已知輸入變量XT,把XT對應能量Ei作為輸出變量Yi,將(XT,Yi)代 入 到XGBoost、LGBM、SVR、Random forest機器學習算法[6]中,得到Au20團簇能量預測模型。將80%的Au20團簇數據劃分為訓練集、將20%的數據化為檢驗集,通過均方根誤差(RMSE)、擬合度(R2)對XGBoost、LGBM、SVR、Random forest算法進行檢驗,選取誤差最小、擬合度最高的模型進行預測。RMSE和R2的公式:
對各個算法進行超參數調優(yōu),得到擬合算法圖:
圖1分別為四種算法的預測值和真實值的對比曲線,我們根據四種算法的RMSE和R2,選擇RMSE較小,R2較大的模型作為Au20能量預測的最優(yōu)模型,得到擬合程度對比表如表1所示。
圖1 XGBoost、LGBM、SVR、Random forest擬合效果圖
表1 擬合程度對比表
粒子群算法是一種優(yōu)化算法,通過群體中個體之間的協(xié)作和信息共享來尋找最優(yōu)解,而IPSO算法是改進的粒子群優(yōu)化算法[5],通過利用動態(tài)的慣性因子ω、采用收縮因子、引入自適應慣性權重和平均適應度的粒子群優(yōu)化算法?;贗PSO算法思想,編寫代碼,得到Au20團簇能量迭代收斂曲線圖。
由圖2可知,Au20隨著迭代次數的增加,能量不斷降低,團簇能量數值收斂于-1557.197左右的數值,根據原子點的坐標,利用VMD軟件,繪制出其結構如圖3所示。
圖2 Au20團簇能量收斂曲線圖
圖3 Au20最穩(wěn)態(tài)結構
由圖3可知,Au20原子團簇呈金字塔型,有四層構成,分別數目是10、6、3、1,且最底層三角形為等邊三角形。
本文用IPSO算法結合機器學習算法對Au20原子團簇的結構進行優(yōu)化,得到了最穩(wěn)態(tài)結構。得到結果表明,Au20最穩(wěn)態(tài)結構呈金字塔型,具有良好的對稱性。根據本文的研究,我們可以得出機器學習算法和智能算法能很好應用于原子團簇結構研究中。