李豐范,匡健隆,季佳浩,商春磊,吳宏輝1,?,汪水澤,毛新平
1) 北京科技大學(xué)材料科學(xué)與工程學(xué)院,北京 100083 2) 北京科技大學(xué)碳中和創(chuàng)新研究院,北京材料基因工程高精尖創(chuàng)新中心,北京 100083
作為一個復(fù)雜的多維度耦合系統(tǒng),材料的性能一直是人們關(guān)注的重點之一. 通過“試錯法”利用受控實驗與已有的物理模型建立材料成分與性能之間的因果關(guān)系[1-3],是最為廣泛使用的方法. 但是,該方式存在著研究周期長、成本高等問題,極大地限制著高性能新材料的發(fā)展[4]. 以密度泛函理論為例,依托該框架已經(jīng)成功預(yù)測了數(shù)千種化合物的性質(zhì)[5],但該理論需要的計算成本較高. 針對上述問題,國際上提出了材料基因工程計劃[6],旨在通過材料大數(shù)據(jù)技術(shù)的發(fā)展,加快新材料從研發(fā)到實際應(yīng)用的進程,推動材料研發(fā)模式的變革.
在當前背景下,數(shù)據(jù)驅(qū)動的機器學(xué)習(xí)(Machine learning, ML)技術(shù)在預(yù)測材料性能領(lǐng)域展現(xiàn)出了驚人的活力[7-8]. 機器學(xué)習(xí)作為人工智能領(lǐng)域的一個分支,其特點是以數(shù)據(jù)為基礎(chǔ)[9],能夠?qū)κ占降臄?shù)據(jù)進行分析,實現(xiàn)對目標的預(yù)測. 在金融[10]、化學(xué)[11]、醫(yī)學(xué)[12]、農(nóng)業(yè)[13]等領(lǐng)域,機器學(xué)習(xí)的準確性已得到驗證. Liu 等[14-15]首次厘清了機器學(xué)習(xí)應(yīng)用于材料領(lǐng)域面臨的三大關(guān)鍵矛盾“高維度與小樣本數(shù)據(jù)、模型準確性與易用性、學(xué)習(xí)結(jié)果與領(lǐng)域知識”,并提出面向機器學(xué)習(xí)全流程嵌入領(lǐng)域知識的協(xié)調(diào)策略. 藉此發(fā)展材料領(lǐng)域知識嵌入的機器學(xué)習(xí)方法,包括材料領(lǐng)域知識的符號化表示、數(shù)據(jù)質(zhì)量的提升、基于命名實體識別的描述符自動獲取、基于特征選擇的描述符篩選、分而治之的機器學(xué)習(xí)新模型構(gòu)建與解釋[16].
對于材料領(lǐng)域來說,機器學(xué)習(xí)提供了利用實驗數(shù)據(jù)進行二次開發(fā)的機會[17-19],成為預(yù)測材料性能的新方法,并已得到一定的應(yīng)用. 例如,Gao等[20]運用機器學(xué)習(xí)技術(shù)和特征工程等方法對數(shù)據(jù)進行分析,預(yù)測了202 個奧氏體不銹鋼焊縫的鐵素體含量,為機器學(xué)習(xí)輔助材料設(shè)計提供了思路.Fukuichi[21]運用機器學(xué)習(xí)技術(shù)將3d、4d、5d 過渡金屬碳化物的元素物理性質(zhì)和硬度聯(lián)系起來,發(fā)現(xiàn)材料的價電子數(shù)、電負性和熱性質(zhì)等因素會影響其硬度. Zhang 等[22]開發(fā)了一種基于機器學(xué)習(xí)的多變量校準模型,以預(yù)測鋼中的微量元素.
材料性能是一個寬泛而又深入的概念,其中材料的服役性能則是影響材料使用的關(guān)鍵因素之一. 人們長期以來廣泛研究了材料的疲勞[23]、蠕變[24]、腐蝕[25]等服役性能. 與力學(xué)性能不同,服役性能強調(diào)材料在實際使用中的表現(xiàn)[26]. 因此,在早期的研究中,人們往往會將材料投入到實際環(huán)境中或者模擬材料在實際環(huán)境中的情況,進一步對材料的性能進行檢測[27-28]. 然而,該方法存在實驗周期長、成本高等缺點. 為解決這一問題,開發(fā)了一系列新的方法,其中加速試驗是最為廣泛使用的方法之一. 通過實驗室模擬環(huán)境加速試驗,能夠在較短的時間內(nèi)獲得某幾種特定因素對材料服役性能的影響[29-30]. 然而,該方法仍然存在所需時間較長、部分材料性能預(yù)測準確率低的問題. 而且,在加速過程中可能會忽略某些關(guān)鍵細節(jié),進而影響最終的實驗結(jié)果. 另一種方法是將材料的其他性能與服役性能相聯(lián)系,通過數(shù)學(xué)建模預(yù)測服役性能. Liu 等[31]建立了Y-T-F 模型,將材料的疲勞、屈服和拉伸性能聯(lián)系起來,能夠更為實用地預(yù)測材料疲勞強度. 然而,該方法實行起來難度較高,并且針對不同的材料,理論模型的偏差可能較大.
目前,機器學(xué)習(xí)技術(shù)作為一種新的思路已經(jīng)被應(yīng)用于預(yù)測材料的服役性能[32-33]. 通過依托于先前實驗中獲得的材料基礎(chǔ)數(shù)據(jù)和建立的數(shù)據(jù)庫,研究者們已經(jīng)初步實現(xiàn)了對材料服役性能的預(yù)測.本文介紹了機器學(xué)習(xí)的基本原理和相關(guān)模型,以機器學(xué)習(xí)對金屬材料的疲勞、蠕變、腐蝕等性能的預(yù)測為案例,綜述了機器學(xué)習(xí)在材料服役性能預(yù)測領(lǐng)域的應(yīng)用,最后對機器學(xué)習(xí)預(yù)測金屬材料服役性能的前景做出了展望.
機器學(xué)習(xí)是一門綜合統(tǒng)計學(xué)、計算機科學(xué)、應(yīng)用數(shù)學(xué)與工程學(xué)等多領(lǐng)域的交叉學(xué)科,是人工智能的核心技術(shù)之一,有望成為繼“實驗”、“理論”、“計算”后的第四范式[34]. 目前,機器學(xué)習(xí)方法已經(jīng)在材料領(lǐng)域得到廣泛應(yīng)用并取得顯著的成果,例如熱電材料[35]、高溫合金[36]、高熵合金[37]等領(lǐng)域.機器學(xué)習(xí)可輔助新材料的發(fā)現(xiàn),推進理論研究的進步,實現(xiàn)對材料性能的高效預(yù)測,有著非常廣闊的應(yīng)用前景. 本文介紹了機器學(xué)習(xí)對金屬材料的疲勞、蠕變、腐蝕等服役性能預(yù)測領(lǐng)域的應(yīng)用,如圖1 所示.
圖1 機器學(xué)習(xí)在金屬材料服役性能領(lǐng)域的應(yīng)用Fig.1 Application of ML in the field of serviceability of metallic materials
在材料科學(xué)中,機器學(xué)習(xí)的主要應(yīng)用包括分類、回歸、聚類和降維等方面[38]. 已經(jīng)有多種機器學(xué)習(xí)算法在材料科學(xué)領(lǐng)域得到了廣泛應(yīng)用,包括支持向量機(Support vector machines, SVM)、隨機森林(Random forests, RF)、人工神經(jīng)網(wǎng)絡(luò)(Artificial neural networks, ANN)、高斯過程回歸(Gaussian process regression, GPR)、嶺回歸(Ridge regression, RR)、K 近鄰算法(K-nearest neighbor, KNN)、套索回歸(Lasso regression, LR)、聚類分析(Cluster analysis)、多層感知器(Multilayer perceptron, MLP)等.不同的機器學(xué)習(xí)算法對結(jié)果的預(yù)測精度和泛化能力會產(chǎn)生不同的影響,Gao 等[20]采用13 種機器學(xué)習(xí)算法來預(yù)測不銹鋼焊縫的鐵氧體數(shù)量,對于不同的算法,絕對系數(shù)R2在0.913 和0.956 之間變化;均 方 誤 差(Mean squared error, MSE)在0.0336 和0.0475 之間變化.
因此,針對實際的應(yīng)用情況選擇合適的機器學(xué)習(xí)算法非常重要. 在材料科學(xué)中,神經(jīng)網(wǎng)絡(luò)、隨機森林、支持向量機和聚類分析這四種機器學(xué)習(xí)算法已經(jīng)相對成熟,它們在預(yù)測金屬材料服役性能和設(shè)計新型高性能金屬材料方面具有明顯的優(yōu)勢. 本文重點介紹了這四種常用的機器學(xué)習(xí)模型,如圖2 所示.
圖2 常用的機器學(xué)習(xí)算法. (a) 神經(jīng)網(wǎng)絡(luò)模型;(b)隨機森林模型;(c)支持向量機模型;(d)聚類模型Fig.2 Standard machine learning algorithms: (a) artificial neural network model; (b) random forest model; (c) support vector machine model; (d) cluster analysis model
1943 年,McCulloch 和Pitts[39]提出了神經(jīng)網(wǎng)絡(luò)的概念和M-P 模型,人工神經(jīng)網(wǎng)絡(luò)由此萌芽.Rosenblatt[40]在M-P 模型的基礎(chǔ)上建立了感知器,首次構(gòu)建了具有學(xué)習(xí)能力的人工神經(jīng)網(wǎng)絡(luò). 人工神經(jīng)網(wǎng)絡(luò)是一種模仿生物神經(jīng)元工作方式的算法,用于對數(shù)據(jù)進行分析和處理,它由輸入層、隱藏層和輸出層組成. 與過去只能處理簡單線性可分問題的單層感知器[41]相比,人工神經(jīng)網(wǎng)絡(luò)模型通常由多層感知器組成,能夠解決單層感知器無法解決的異或問題. 在工作時,人工神經(jīng)網(wǎng)絡(luò)是通過模仿生物神經(jīng)元的工作方式對數(shù)據(jù)進行分析和處理. 人工神經(jīng)網(wǎng)絡(luò)由大量非線性且聯(lián)系緊密的神經(jīng)元分布式存儲,由于每個神經(jīng)元與每個連接對網(wǎng)絡(luò)的整體功能的貢獻較小,因此出現(xiàn)少量故障對整體的功能影響甚微[42]. 與傳統(tǒng)的線性回歸方法相比,人工神經(jīng)網(wǎng)絡(luò)具有更高的容錯性,淺層的神經(jīng)網(wǎng)絡(luò)有反向傳播(Back propagation, BP)模型和徑向基函數(shù)(Radial basis function, RBF)模型等. 當特征維度過大或網(wǎng)絡(luò)層數(shù)過多時,神經(jīng)網(wǎng)絡(luò)容易出現(xiàn)梯度消失和過擬合等問題. 因此,發(fā)展了深度神經(jīng)網(wǎng)絡(luò)的概念[43].
決策樹(Decision tree, DTree)算法是一種單獨的分類器,容易出現(xiàn)過擬合的問題,為了避免這一問題,提出了集成學(xué)習(xí)(Ensemble learning)算法. 其中,Bagging 集成學(xué)習(xí)理論最具代表性[44-45].2001 年,Breiman 等[45]將Bagging 集成學(xué)習(xí)理論與隨機子空間方法相結(jié)合,提出了隨機森林的概念.隨機森林是由許多決策樹集合而成的算法,相較于單個分類器決策樹,隨機森林具有更高的泛化能力,這是因為它引入了隨機性,使得異常值和噪聲產(chǎn)生的干擾較少且不容易出現(xiàn)過擬合[46]. 隨機森林主要用于分類、回歸和特征選擇. 隨機森林分類由多個決策樹分類模型組合而成,每個決策樹分類模型都對最優(yōu)的分類結(jié)果有一票投票權(quán).Fernandez-Delgado 等[47]通過對179 種分類算法的性能進行比較,發(fā)現(xiàn)隨機森林分類的性能最為優(yōu)異.
1995 年,Cortes 和Vapnik[48]基于結(jié)構(gòu)風(fēng)險最小化原理提出了支持向量機的概念. 支持向量機最初用于解決二分類問題,目的是尋找最優(yōu)分類超平面來滿足分類要求. 然而在實際問題中,數(shù)據(jù)通常不是線性可分的,因此需要將低維數(shù)據(jù)通過一個特定的模型映射到高維空間,再尋找超平面.但是,高維數(shù)據(jù)會導(dǎo)致計算復(fù)雜度增加,為了避免維數(shù)災(zāi)難,合理使用核函數(shù)來代替內(nèi)積[49]. 支持向量機能夠解決回歸、模式識別、函數(shù)模擬、數(shù)據(jù)分類等多種問題,特別在小樣本、非線性和高維模式識別等方面表現(xiàn)出優(yōu)勢[50]. 與其他同類方法相比,支持向量機具有適應(yīng)性好、泛化能力強、訓(xùn)練 效率高等特點.
聚類學(xué)習(xí)是最早采用的數(shù)據(jù)挖掘方法之一.與監(jiān)督學(xué)習(xí)方法——人工神經(jīng)網(wǎng)絡(luò)、隨機森林、支持向量機不同,聚類分析是一種無監(jiān)督學(xué)習(xí)方法.聚類分析依據(jù)樣本之間的相似程度將相似度較高的樣本歸類于同一級別,因此,不同類別之間的差異較大[51]. 然而,一種聚類算法不可能適用于所有不同的多維數(shù)據(jù)集[52],并且在解決實際應(yīng)用問題時,由于數(shù)據(jù)的復(fù)雜性和多樣性,單一的聚類算法可能不適用[53]. 目前,有許多聚類算法,大致可分為基于密度聚類、基于層次聚類、基于網(wǎng)格聚類、基于圖論聚類和基于平方誤差的迭代重分配聚類等不同類別.
金屬材料在實際應(yīng)用環(huán)境中的性能表現(xiàn)被稱為金屬材料的服役行為,可以反映材料的性能優(yōu)劣. 其中包括疲勞壽命、蠕變壽命、腐蝕速率等指標. 然而,設(shè)計測試實驗來評估材料的服役性能需要耗費大量的時間和資源. 為了節(jié)省成本和時間,可以將金屬材料的成分組成、測試環(huán)境條件等因素作為特征輸入到機器學(xué)習(xí)模型中,以實現(xiàn)對金屬材料服役行為的準確預(yù)測. 這種方法可以為金屬材料的設(shè)計和金屬材料性能的提高提供可靠的思路,從而滿足更多實際應(yīng)用的需求.
金屬材料的疲勞斷裂行為和疲勞壽命預(yù)測一直以來都是材料學(xué)領(lǐng)域極其重要的研究課題. 金屬材料結(jié)構(gòu)的疲勞斷裂會導(dǎo)致嚴重的安全事故并帶來一定程度上的經(jīng)濟損失,因此準確預(yù)測金屬材料疲勞壽命是一項具有深遠意義的工作[54]. 近年來,人們利用機器學(xué)習(xí)模型預(yù)測金屬材料疲勞壽命,實現(xiàn)了對于不同強度金屬材料S-N 曲線的預(yù)測[55]. Bao 等[56]利用SVM 模型對Ti-6Al-4V 合金的關(guān)鍵幾何缺陷特征進行訓(xùn)練,并采取交叉驗證的網(wǎng)絡(luò)搜索方法對參數(shù)進行擬合. 預(yù)測疲勞壽命與實驗疲勞壽命之間的決定系數(shù)可達0.99,表明SVM 模型對金屬材料疲勞壽命具有較強的預(yù)測能力. Li 等[57]將金屬試樣斷裂表面缺陷的關(guān)鍵幾何特征與疲勞性能相關(guān)聯(lián),以數(shù)據(jù)驅(qū)動的方式推動了對缺陷-疲勞關(guān)系的理解. 采用支持向量回歸(Support vector regression, SVR)對缺陷特征和疲勞壽命之間的關(guān)系進行建模,平均絕對誤差低至0.101. 針對疲勞壽命半經(jīng)驗公式的局限性,Lei 等[58]提出了兩種機器學(xué)習(xí)模型用于優(yōu)化疲勞壽命與輸入特征之間的映射關(guān)系,機器學(xué)習(xí)模型預(yù)測精度(R2≥0.922,MSE≤0.116)與半經(jīng)驗公式的預(yù)測性能相比(R2≤0.847,MSE≥0.237),表現(xiàn)出優(yōu)異的預(yù)測能力,表明機器學(xué)習(xí)預(yù)測疲勞壽命具有可行性.
He 等[59]采用一種基于合金特征和化學(xué)成分的機器學(xué)習(xí)方法,對不銹鋼AISI 304, AISI 310,AISI 316 和AISI 316FR 等的疲勞壽命進行了研究.在輸入合金特征和化學(xué)成分的條件下,他們比較了八種不同算法的精度,其中SVR 和ANN 表現(xiàn)最佳. 基于合金特征和化學(xué)成分的機器學(xué)習(xí)流程如圖3(a)所示,包括數(shù)據(jù)采集、合金特征構(gòu)建、特征篩選和模型訓(xùn)練/測試四個步驟. 后者直接利用化學(xué)成分、靜態(tài)力學(xué)性能和試驗條件建立疲勞壽命評估模型. 圖3(b)、(c)總結(jié)了輸入變量與目標變量的關(guān)聯(lián)重要性程度和基于化學(xué)成分的模型的沙普利加和解釋(SHAP)值. 可以看出,總應(yīng)變范圍是影響疲勞壽命最關(guān)鍵的變量,而試驗溫度、釩添加等變量也與疲勞壽命有較高的關(guān)系. 基于合金特征,圖3(d)、(e)展示了通過SVR 算法構(gòu)建的疲勞壽命預(yù)測結(jié)果. 訓(xùn)練和測試數(shù)據(jù)集的均方根誤差分別為0.10 和0.13,證明該模型具有良好的預(yù)測精度. 圖3(f)、(g)是基于合金特征的神經(jīng)網(wǎng)絡(luò)算法建立的疲勞壽命評價結(jié)果,ANN 模型的訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集的均方根誤差分別為0.14 和0.17,分別比SVR 模型的均方根誤差高40%和31%.
圖3 奧氏體不銹鋼疲勞壽命的機器學(xué)習(xí)模型預(yù)測過程及結(jié)果. (a) 奧氏體不銹鋼在不同溫度下的高精度疲勞壽命機器學(xué)習(xí)模型預(yù)測過程;(b) 輸入變量的重要性;(c) 基于化學(xué)成分的模型的 SHAP 值;(d) 表示SVR 模型對故障循環(huán)次數(shù)的疲勞壽命預(yù)測結(jié)果;(e) 表示SVR 模型對故障循環(huán)次數(shù)的疲勞壽命預(yù)測結(jié)果的對數(shù)形式;(f) 表示ANN 模型對故障循環(huán)次數(shù)的疲勞壽命預(yù)測結(jié)果;(g)表示ANN 模型對故障循環(huán)次數(shù)的疲勞壽命預(yù)測結(jié)果的對數(shù)形式[59]Fig.3 ML model prediction process and results for the fatigue life of austenitic stainless steels: (a) ML model for high-precision fatigue life prediction for austenitic stainless steels at different temperatures; (b) the importance of input variables; (c) SHAP values for the chemical compositions-based model;(d) fatigue life prediction results of the SVR model for the number of failure cycles; (e) logarithmic form of the fatigue life prediction results of the SVR model for the number of failure cycles; (f) fatigue life prediction results of the ANN model for the number of failure cycles; (g) logarithmic form of the fatigue life prediction results of the ANN model for the number of failure cycles[59]
為了在樣本量有限的情況下實現(xiàn)對金屬材料疲勞壽命的精準預(yù)測,Wei 等[60]提出了一種基于遷移學(xué)習(xí)(TRansfer learning, TR)概念的疲勞強度預(yù)測和高通量合金設(shè)計模型. 如圖4(a)所示,該模型的第一層使用基于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural networks, CNN)或基于傳統(tǒng)機器學(xué)習(xí)算法的簡化機器學(xué)習(xí)(Simplified machine learning, SML)來預(yù)測鋼材的準靜態(tài)力學(xué)特性. 第二層將預(yù)測的鋼材準靜態(tài)特性與高周疲勞強度聯(lián)系在一起. 圖4(b)為屈服強度(Yield strength, YS)、極限抗拉強度(Ultimate tensile strength, UTS)和延伸率(Elongation, EL)的平均預(yù)測值的散點圖和誤差條. 在訓(xùn)練集中,YS、UTS 和EL 的預(yù)測結(jié)果與實驗值高度一致,誤差較小,表明該模型在鋼材成分范圍內(nèi)訓(xùn)練較好. 圖4(c)和(d)顯示了TR 模型和非TR 模型驗證集的平均預(yù)測值之間的比較. 可以看出,TR 模型的預(yù)測精度比非TR 模型高,特別是在低疲勞強度和高疲勞強度領(lǐng)域,這是由于TR 模型的使用大大擴展了基于同一小型數(shù)據(jù)庫進行準確預(yù)測的范圍. 圖4(e)和(f)顯示了不同TR 模型驗證集的平均R2和平均絕對值誤差(Mean Absolute Error, MAE).考慮到TR 模型的線性SVR,5 種算法均能準確預(yù)測疲勞強度,其R2值均超過0.92,且標準差較低,其中梯度提升回歸(Gradient boosting regression,GBR)的預(yù)測效果最好. 圖4(g)和(h)展示了不同非TR模型對于疲勞強度預(yù)測的結(jié)果,驗證集上所有算法的表現(xiàn)均顯示出極低的R2值和高的MAE 值,這說明存在嚴重的過擬合問題. 這也反映出在樣本量較少的情況下,使用非TR 模型進行疲勞強度預(yù)測是不適用的.
圖4 基于遷移學(xué)習(xí)的小樣本鋼材的預(yù)測過程及結(jié)果. (a)利用拉伸性能的疲勞強度遷移學(xué)習(xí)預(yù)測框架示意圖;(b) YS,UTS 和EL 的實驗值與CNN拉伸模型預(yù)測值;(c) 表示CNN 框架生成的驗證集中的實驗值與預(yù)測值;(d) 表示SML 框架生成的驗證集中的實驗值與預(yù)測值;(e) TR 模型使用不同算法的平均R2 結(jié)果;(f) TR 模型使用不同算法的MAE 結(jié)果; (g) 非TR 模型使用不同算法的平均R2 結(jié)果;(h) 非TR 模型使用不同算法的MAE結(jié)果[60]Fig.4 Prediction process and results for small sample steels based on transfer learning (TR): (a) schematic diagram of the TR prediction framework for fatigue strength using tensile properties; (b) experimental values of YS, UTS and EL with CNN tensile model predictions; (c) experimental and predicted values in the validation set generated by the CNN framework; (d) experimental and predicted values in the validation set generated by the simplified ML framework; (e) average R2 results for TR model using different algorithms; (f) mean absolute error results results for TR model using different algorithms;(g) average R2 results for Non-TR model using different algorithms; (h) mean absolute error results results for Non-TR model using different algorithms[60]
蠕變是金屬材料在高溫環(huán)境下的重要的性能之一. 然而,高成本的蠕變測試限制了傳統(tǒng)試錯法開發(fā)新合金的效率. 此外,蠕變機理的復(fù)雜性和影響因素的多樣性極大增加了物理建模和仿真設(shè)計的難度. 利用機器學(xué)習(xí)來預(yù)測蠕變等長期服役性能能夠大大節(jié)省時間和資源. Wang 等[61]利用機器學(xué)習(xí)建立了定量模型來預(yù)測Cr-Mo 鋼的蠕變壽命,采用Larson-Miller 參數(shù)(LMP)、Manson-Haferd參數(shù)(MHP)和Manson-Succop 參數(shù)(MSP)來代替蠕變壽命作為目標特征. 結(jié)果表明,將蠕變壽命替換為LMP、MHP 和MSP 三個參數(shù)作為目標特征后,隨機森林模型預(yù)測的準確率R2值為0.9641,均方根誤差為0.0119,有效地提高了模型預(yù)測精度.He 等[62]使用五種機器學(xué)習(xí)算法用于預(yù)測高溫合金的蠕變壽命,每種算法的平均相對標準偏差(Average relative standard deviation, ARSD)均小于2.5%,預(yù)測精度較高. Han 等[63]通過數(shù)據(jù)驅(qū)動的機器學(xué)習(xí)算法預(yù)測鎳基單晶高溫合金的蠕變壽命,得到預(yù)測精度R2為0.96,RMSE 為12.25. 可為下一代鎳基單晶高溫合金的成分設(shè)計和性能優(yōu)化提供技術(shù)支撐.
Wang 等[64]提出了一種提高蠕變壽命的合金設(shè)計框架,該框架由蠕變壽命預(yù)測和高通量設(shè)計兩個模塊組成. 在第一個模塊中,通過比較各種機器學(xué)習(xí)策略,得出最佳的機器學(xué)習(xí)蠕變壽命預(yù)測模型. 在第二個模塊中,采用帶濾波的遺傳算法,在特定蠕變條件下獲得具有最優(yōu)成分和工藝參數(shù)的新合金方案. 圖5(a)展示了蠕變壽命預(yù)測模塊和高通量設(shè)計模塊的基本流程,首先根據(jù)材料特性和環(huán)境因素進行輸入,然后利用標準化后的蠕變數(shù)據(jù)集訓(xùn)練不同的機器學(xué)習(xí)模型,最后利用濾波器獲得不同蠕變溫度和應(yīng)力下的最優(yōu)解. 圖5(b)顯示了皮爾遜相關(guān)系數(shù)的熱力圖,兩個不同特征間的皮爾遜相關(guān)系數(shù)的絕對值都小于0.9,表明數(shù)據(jù)集中包含的所有特征都可以視為自變量. 圖5(c)以RF 模型的平均精度下降值(MAD)為標準,定量地顯示了每個特征對蠕變壽命的相關(guān)重要性. 從圖5(d)、(e)可以看出,無論是訓(xùn)練集還是測試集,邏輯回歸模型(Logistic regression, LR)的預(yù)測結(jié)果都相當離散. 而MLP 的預(yù)測結(jié)果則落在一條斜率為1 的直線上,如圖5(f)、(g)所示. 這證明將MLP模型與遺傳算法相結(jié)合進行蠕變壽命預(yù)測是一種有效的蠕變合金設(shè)計方法.
圖5 低合金鋼蠕變壽命預(yù)測過程及結(jié)果. (a) 蠕變壽命預(yù)測模塊和高通量設(shè)計模塊的基本流程;(b) 皮爾遜相關(guān)系數(shù)熱力圖;(c) 各個特征的相關(guān)重要性;(d) 訓(xùn)練集結(jié)果(LR);(e) 測試集結(jié)果(LR);(f) 訓(xùn)練集結(jié)果(MLP);(g) 測試集結(jié)果(MLP)[64]Fig.5 Creep life prediction process and results for low-alloy steel: (a) basic process of creep life prediction module and high-throughput design module;(b) pearson correlation coefficient heat map; (c) correlation importance of each feature; (d) training set results (LR); (e) test set results (LR); (f) training set results (MLP); (g) test set results (MLP)[64]
蠕變斷裂壽命是影響高溫合金材料使用壽命和力學(xué)性能的關(guān)鍵材料參數(shù). 因此,準確有效地預(yù)測蠕變壽命具有重要的現(xiàn)實意義. Liu 等[36]開發(fā)了一種分治自適應(yīng)(Divide and conquer self adaptive,DCSA)的學(xué)習(xí)方法,該方法結(jié)合了多種材料特征,以實現(xiàn)準確、迅速地預(yù)測蠕變斷裂壽命. 機器學(xué)習(xí)研究表明,在蠕變數(shù)據(jù)集上,相對于其他五種機器學(xué)習(xí)模型,DCSA 方法具有更高的預(yù)測精度,其均方根誤差、平均絕對百分比誤差、R2分別為0.3839、0.0003 和0.9176. 如圖6(a)所示,DCSA 通常由兩個階段組成:合金樣品的自動劃分和最優(yōu)模型的自適應(yīng)選擇. 隨后,利用主成分分析(Principal components analysis, PCA)提取原始輸入特征的主成分,并選擇兩種特征主成分PC1 和PC2 作為代替原始輸入特征的主要分量. 該方法將所有合金樣品分成了8 個均勻的團簇,每個團簇的樣品數(shù)量如圖6(b)、(c)所示. 模型訓(xùn)練的性能如圖6(d)~(i)所示,橫軸為實測蠕變斷裂壽命,縱軸為預(yù)測蠕變斷裂壽命.通過將SVR、RF、GPR、RR、LR 以及DCSA 六種模型預(yù)測的蠕變斷裂壽命值與實測值建立函數(shù)關(guān)系并繪圖,可以看到DCSA 模型的預(yù)測性能最佳,對于每個數(shù)據(jù)簇選擇的最優(yōu)模型都達到了良好的擬合效果. 因此,DCSA 模型可以建立精確的鎳基單晶高溫合金材料蠕變斷裂壽命的結(jié)構(gòu)-性能關(guān)系映射,為合金逆向設(shè)計提供依據(jù).
圖6 基于分治法的機器學(xué)習(xí)預(yù)測鎳基單晶高溫合金蠕變斷裂壽命過程及結(jié)果. (a) 用DCSA 模擬蠕變破裂壽命的過程;(b) 聚類結(jié)果的二維散射分布,x 坐標和y 坐標分別代表主成分PC1 和PC2;(c) 每個聚類中的樣本數(shù);(d) 隨機森林預(yù)測結(jié)果;(e) 支持向量回歸預(yù)測結(jié)果;(f) 高斯過程回歸預(yù)測結(jié)果;(g) 套索回歸預(yù)測結(jié)果;(h) 嶺回歸預(yù)測結(jié)果;(i) DCSA 方法預(yù)測結(jié)果[36]Fig.6 Prediction process and results for the creep rupture life of Ni-based single crystal superalloys using divide-and-conquer approach-based ML:(a) DCSA procedure for modeling the creep rupture life; (b) two-dimensional scattering distribution of clustering results, the x- and y-coordinates represent principal components PC1 and PC2; (c) number of samples in each cluster; (d) RF prediction results; (e) SVR prediction results; (f) GPR prediction results; (g) LR prediction results; (h) RR prediction results; (i) DCSA method prediction results[36]
金屬材料腐蝕廣泛影響著交通、石油、化工等領(lǐng)域,帶來了較高的維護成本和安全隱患[65],因此準確預(yù)測金屬材料腐蝕速率對于高性能材料的設(shè)計至關(guān)重要. Aghaaminiha 等[66]以26855 個低碳鋼腐蝕速率數(shù)據(jù)為基礎(chǔ),以化學(xué)成分和腐蝕條件為輸入特征,訓(xùn)練了一個隨機森林模型. 結(jié)果表明,腐蝕速率的時間分布主要取決于緩蝕劑的使用劑量,而最終的腐蝕速率主要取決于環(huán)境的惡劣程度. 經(jīng)過訓(xùn)練的隨機森林模型可以很好地預(yù)測低碳鋼的腐蝕速率,均方誤差在0.005 ~ 0.093 之間.Diao 等[67]基于85 組低合金鋼的海水浸泡腐蝕數(shù)據(jù),以化學(xué)成分和環(huán)境因素為輸入特征訓(xùn)練優(yōu)化隨機森林模型. 基于機器學(xué)習(xí)的腐蝕速率預(yù)測模型表現(xiàn)出了良好的低合金鋼海水腐蝕速率預(yù)測精度,為腐蝕研究提供了有力的工具. 優(yōu)化模型預(yù)測的腐蝕速率與實測腐蝕速率之間的R2均在0.9 以上. Yan 等[68]基于日本國立材料研究所(NIMS)數(shù)據(jù)庫中大氣腐蝕數(shù)據(jù),探索材料、環(huán)境因素和腐蝕速率之間的關(guān)聯(lián),提出了一種基于機器學(xué)習(xí)研究低合金鋼海洋大氣腐蝕行為的建模方法,建立了一種預(yù)測精度較高的隨機森林腐蝕速率優(yōu)化預(yù)測模型,訓(xùn)練集和測試集的R2分別為0.94 和0.73,預(yù)測精度良好.
大氣腐蝕是一種廣泛且具有較大危害的腐蝕,準確且實時的大氣腐蝕監(jiān)測對于金屬材料的選擇和設(shè)計有著重要指導(dǎo)意義. Pei 等[69]基于Fe/Cu型電偶腐蝕傳感器對碳鋼的大氣腐蝕進行了監(jiān)測,并訓(xùn)練隨機森林模型來預(yù)測瞬時大氣腐蝕. 如圖7(a)所示,左側(cè)展示了隨機森林模型的預(yù)測過程,以降雨狀態(tài)、溫度、相對濕度(RH)、空氣中污染物質(zhì)含量等參數(shù)作為輸入,每個分類回歸樹模型都被訓(xùn)練用于預(yù)測. RF 方法將多個分類回歸樹模型融合起來組成一個更加準確和穩(wěn)定的模型,最終輸出預(yù)測值. 圖7(a)右側(cè)為每個分類回歸樹(Classification and regression tree, CART)模型的訓(xùn)練和預(yù)測過程. 為了比較各環(huán)境參數(shù)對大氣腐蝕的重要性,以環(huán)境參數(shù)為輸入,大氣腐蝕監(jiān)測電流(Atmospheric corrosion monitoring current,IACM)為輸出建立RF 模型,結(jié)果如圖7(b)所示. 影響IACM輸出的前3 個重要環(huán)境參數(shù)是溫度、降水狀況和相對濕度. 為了驗證銹蝕形成演化對IACM預(yù)測的重要性,在3 個不同時間段(0~11 d、0~22 d、0~34 d),分別對ANN、SVR 和RF 模型的預(yù)測擬合結(jié)果進行比較,如圖7(d)~(i)所示. 當模型中不包含QACM(電量,IACM對測試時間進行積分)時,隨著暴露時間的延長,數(shù)據(jù)集越來越分散. 結(jié)果表明,隨著時間的增加,在不考慮銹蝕形成的情況下,模型變得更加不準確. 而在模型中考慮銹蝕形成時,數(shù)據(jù)點的分布沿對角線延伸,但并沒有隨著暴露時間的增加而變寬,表明預(yù)測精度穩(wěn)定.
圖7 基于機器學(xué)習(xí)的Fe/Cu 腐蝕傳感器大氣腐蝕預(yù)測過程及結(jié)果. (a) RF 模型和各CART 模型的訓(xùn)練和預(yù)測過程;(b)暴露1 個月后環(huán)境因子對IACM 的重要性指數(shù);(c) 各模型R2 的變化;(d) ANN 預(yù)測結(jié)果;(e) SVR 預(yù)測結(jié)果;(f) RF 預(yù)測結(jié)果(不以電量為輸入);(g) ANN 預(yù)測結(jié)果;(h) SVR 預(yù)測結(jié)果;(i) RF 預(yù)測結(jié)果(以電量為輸入)[69]Fig.7 Machine learning-based atmospheric corrosion prediction process and results for Fe/Cu corrosion sensors: (a) training and prediction process of RF model and each CART model; (b) importance index of environmental factors for IACM after one month of exposure; (c) variation of R2 for each model;(d) ANN prediction results; (e) SVR prediction results; (f) RF prediction results (without electricity as input); (g) ANN prediction results; (h) SVR prediction results; (i) RF prediction results (with electricity as input)[69]
鎂合金作為結(jié)構(gòu)材料和生物醫(yī)用材料,具有廣闊的應(yīng)用前景. 然而,鎂合金耐腐蝕性差的特點限制了其進一步的應(yīng)用. 為避免實驗測試的時間和成本,Wang 等[70]利用機器學(xué)習(xí)模型預(yù)測了具有氫吸附能的Mg 金屬間化合物,為耐蝕合金的設(shè)計提供了有效的機器學(xué)習(xí)預(yù)測模型. 如圖8(a)所示,從數(shù)據(jù)庫中收集了995 個二元Mg 金屬間化合物,經(jīng)過能量穩(wěn)定性、平衡電位、氫吸附能等特征篩選后確定了329 個原則上可合成的二元Mg 金屬間化合物. 圖8(b)圓點的顏色代表了不同凸殼能量量化的金屬間化合物的穩(wěn)定性,紫色和黃色分別代表穩(wěn)定和半穩(wěn)定金屬間化合物;圖8(c)利用皮爾遜相關(guān)性分析將特征的數(shù)量從18 個減少到14 個. 如圖8(d)~(i)所示,采用SVR 和K 近鄰算法建立回歸模型,預(yù)測二元Mg 金屬間化合物表面的氫吸附能(Hydrogen adsorption Energy,Eads). 圖8(d)和(g)表明兩種機器學(xué)習(xí)算法在利用這兩種特征時具有相當?shù)腅ads預(yù)測能力,平均RMSE 為0.13 eV;圖8(e)和(h)表明特征越多,模型的預(yù)測能力就越強,但進一步增加特征的數(shù)量,可能會出現(xiàn)過擬合,從而導(dǎo)致預(yù)測精度降低;為了進一步驗證模型的推廣性,基于密度泛函理論(Density functional theory, DFT)模擬計算了5 種新型金屬間化合物,DFT計算和ML 預(yù)測的Eads的比較如圖8(f)和(i)所示,平均RMSE 分別為0.11 和0.23. 上述結(jié)果表明機器學(xué)習(xí)模型對篩選具有金屬間化合物的耐腐蝕二元鎂合金具有指導(dǎo)意義.
圖8 機器學(xué)習(xí)預(yù)測二元鎂合金腐蝕性能的過程及結(jié)果. (a) 高通量篩選二元鎂金屬間化合物抑制電偶腐蝕的工作流程;(b) 綜合篩選結(jié)果包括相穩(wěn)定性、平衡電位差和計算的交換電流密度; (c) 18 個特征的Pearson 相關(guān)系數(shù)(PCC)圖; (d) 具有Ω-維特征(范圍為1~5)的KNN 模型,對訓(xùn)練和測試數(shù)據(jù)集進行500 次隨機劃分后的平均RMSE; (g) 具有Ω-維特征(范圍為1~5)的SVR 模型,對訓(xùn)練和測試數(shù)據(jù)集進行500 次隨機劃分后的平均RMSE; (e) KNN 模型中包含Ω-維特征的最佳性能模型的交叉驗證R2; (h) SVR 模型中包含Ω-維特征的最佳性能模型的交叉驗證R2; (f) KNN模型DFT 計算的Eads 與ML 預(yù)測的Eads,包含訓(xùn)練數(shù)據(jù)集中沒有的5 種新的金屬間化合物; (i) SVR 模型DFT 計算的Eads 與ML 預(yù)測的Eads,包含訓(xùn)練數(shù)據(jù)集中沒有的5 種新的金屬間化合物[70]Fig.8 Process and results of ML for predicting corrosion properties of binary magnesium alloys: (a) designed high-throughput workflow for screening binary Mg intermetallics, which could inhibit galvanic corrosion; (b) comprehensive screening results containing phase stability, equilibrium potential difference, and calculated exchange current density; (c) Pearson correlation coefficient map of 18 features. (d) Average RMSE of 500 times random divisions of training and test dataset for KNN models with Ω-dimensional features (Ω = 1–5); (g) Average RMSE of 500 times random divisions of training and test dataset for SVR models with Ω-dimensional features (Ω = 1–5); (e) The cross-validation R2 of the best performance model containing Ωdimensional features for KNN models ; (h) The cross-validation R2 of the best performance model containing Ω-dimensional features for SVR models;(f) Parity plots comparing DFT-computed Eads against ML-predicted Eads using KNN models and five new intermetallics not included in the training dataset; (i) Parity plots comparing DFT-computed Eads against ML-predicted Eads using SVR models and five new intermetallics not included in the training dataset[70]
除預(yù)測金屬材料的疲勞、蠕變、腐蝕性能之外,機器學(xué)習(xí)還可以應(yīng)用于預(yù)測金屬材料的強韌性、耐磨性能、氫脆敏感性和輻照損傷等方面. 在機械工程領(lǐng)域中,由于金屬零件遇到嚴重的磨損與沖擊,往往需要更換零件,從而導(dǎo)致經(jīng)濟損失[71],因此,預(yù)測表面涂層的耐磨性非常重要. 氫原子會降低大多數(shù)金屬材料的機械性能[72],氫脆主要會導(dǎo)致材料的韌性和疲勞壽命降低[73],并且會增大材料的脆性,導(dǎo)致脆性斷裂. 然而,氫脆的機理目前仍未完全清楚,通過使用機器學(xué)習(xí)算法分析與氫脆相關(guān)的特征,可以為解決含氫環(huán)境下材料脆化問題提供思路. 核電是目前重要的能源之一,然而輻照可以誘發(fā)材料降解,會導(dǎo)致材料的機械失效,對核反應(yīng)堆的正常運行造成威脅,目前,機器學(xué)習(xí)已被應(yīng)用于預(yù)測傳統(tǒng)核材料的輻照響應(yīng)[74].
Kim 等[75]首次使用機器學(xué)習(xí)方法預(yù)測合金元素和試驗條件對奧氏體鋼的氫環(huán)境脆化指數(shù)的影響. 他們使用算法分析輸入特征與氫環(huán)境脆化指數(shù)的相關(guān)性,并評估了四種機器學(xué)習(xí)模型的性能.結(jié)果發(fā)現(xiàn)RF 模型的準確率最高,R2為0.7,而LR、BP、SVM 的R2為0.6 左右. 針對氫導(dǎo)致的金屬材料性能惡化,Thankachan 等[76]采用多層前饋反向傳播的機器學(xué)習(xí)模型預(yù)測拉伸強度,模型預(yù)測精度R2為0.9900;采用單層前饋反向傳播的機器學(xué)習(xí)模型預(yù)測延伸率,模型預(yù)測精度R2為0.9932,可高效預(yù)測充氫鋁合金的拉伸強度和延伸率. Zhao[74]總結(jié)了機器學(xué)習(xí)算法在高熵合金輻射損傷領(lǐng)域中的應(yīng)用,包括輻照響應(yīng)預(yù)測、原子間勢的發(fā)展和缺陷演化,該文獻還對這些應(yīng)用未來的發(fā)展進行了展望,并肯定了機器學(xué)習(xí)算法的應(yīng)用前景. 此外,Zhao 還強調(diào)了大量高質(zhì)量數(shù)據(jù)的重要性.
本文總結(jié)并分析了在預(yù)測金屬材料服役性能中常用的機器學(xué)習(xí)模型,包括神經(jīng)網(wǎng)絡(luò)、隨機森林、支持向量機和聚類分析等. 隨后,以疲勞、腐蝕、蠕變這三種典型服役性能為例,綜述了機器學(xué)習(xí)在預(yù)測金屬材料具體服役性能方面的應(yīng)用. 在這一過程中,要充分考慮目標的特點,并選擇合適的機器學(xué)習(xí)模型以達到最佳效果. 此外,數(shù)據(jù)的質(zhì)量與數(shù)量對預(yù)測準確性影響很大. 在選取特征參量時要充分且適度,以避免出現(xiàn)過擬合現(xiàn)象.
目前,機器學(xué)習(xí)在預(yù)測金屬材料的服役性能方面已經(jīng)取得了一定進展,但還有很大的發(fā)展空間:
(1)數(shù)據(jù)是開展機器學(xué)習(xí)的基礎(chǔ),依托文獻報道的相關(guān)實驗結(jié)果可獲得大量數(shù)據(jù),但由于實際實驗測試過程中實驗條件存在偏差或信息采集缺失,后續(xù)機器學(xué)習(xí)準確性會受到一定影響,因此,構(gòu)建完善的數(shù)據(jù)標準,可極大推動機器學(xué)習(xí)在材料科學(xué)研究中的應(yīng)用.
(2)建立完備的材料數(shù)據(jù)庫是大數(shù)據(jù)時代材料學(xué)發(fā)展的必經(jīng)之路,但現(xiàn)在的數(shù)據(jù)庫普遍存在類似數(shù)據(jù)完整性不夠、數(shù)據(jù)質(zhì)量欠缺等問題. 需要建立完備的材料大數(shù)據(jù)共享平臺,進一步推動未來新材料服役性能的預(yù)測.
(3)算法是機器學(xué)習(xí)的核心部分之一. 現(xiàn)有的主流算法在大部分情況下已經(jīng)能夠?qū)崿F(xiàn)對材料服役性能的準確預(yù)測,但在面對如數(shù)據(jù)量不足等問題時,其結(jié)果往往難以令人滿意. 通過開發(fā)新的算法或探索不同算法間的聯(lián)系,可以提高機器學(xué)習(xí)的預(yù)測精度并擴大其使用范圍.
(4)與傳統(tǒng)的物理建模方式不同,機器學(xué)習(xí)的黑箱特性使得預(yù)測金屬材料服役性能的過程難以被解釋. 將機器學(xué)習(xí)與熱力學(xué)或動力學(xué)模型相結(jié)合,深度挖掘材料不同性能參數(shù)間的物理規(guī)律. 在提高機器學(xué)習(xí)準確性的同時,能夠幫助我們更好地認識材料本身具備的性質(zhì).