李亞豪,葉益聰,趙鳳媛,唐 宇,朱利安,白書欣
(國防科技大學(xué) 空天科學(xué)學(xué)院 材料科學(xué)與工程系,長沙 410073)
鋼鐵、鋁合金及鎂合金等傳統(tǒng)合金是以單一元素為主要元素,摻雜少量其他元素來改善材料性能,因此合金的性能常常受限于其主元的性質(zhì)。Yeh 等[1]和Cantor 等[2]提出的高熵合金(high entropy alloy,HEA)打破了傳統(tǒng)合金的設(shè)計(jì)理念,它是一種無主元或多主元合金,每種組成元素都是合金的主元,這使得高熵合金的原子分布混亂無序,而恰恰是這種高混亂度產(chǎn)生了意想不到的穩(wěn)定性,使得高熵合金更傾向于形成固溶體結(jié)構(gòu)。通過對(duì)高熵合金組成主元的自由設(shè)計(jì),有望解決傳統(tǒng)結(jié)構(gòu)材料低溫和高應(yīng)變速率下韌脆轉(zhuǎn)變、強(qiáng)度塑性矛盾等問題[3-5],擁有廣泛的應(yīng)用潛力[6-7]。例如,Li 等[3]設(shè)計(jì)的相變?cè)鏊艿碾p相Fe50Mn30Co10Cr10高熵合金,相比同等晶粒尺寸的CrMnFeCoNi 合金,塑性提高超過20%的同時(shí)強(qiáng)度增加近30%。
高熵合金多種主元的復(fù)雜性造成其潛在成分空間過于龐大以及合金相結(jié)構(gòu)與性能的影響因素眾多等問題,若采用傳統(tǒng)的材料研究方法,合金設(shè)計(jì)過程將十分困難,研發(fā)及性能優(yōu)化周期也比較長。研究人員曾試圖從以往的數(shù)據(jù)中總結(jié)高熵合金相形成的規(guī)律[8-12],例如Zhang 等[8]通過計(jì)算Ω參數(shù)來分辨高熵合金是否形成固溶體結(jié)構(gòu)。然而受限于可視化分析和高熵合金樣本的數(shù)據(jù)量,在對(duì)合金的參數(shù)進(jìn)行結(jié)構(gòu)判據(jù)的歸納總結(jié)過程中,僅支持2 個(gè)至多3 個(gè)參數(shù)同時(shí)分析,難以充分考慮高熵合金相結(jié)構(gòu)影響因素,使得經(jīng)驗(yàn)參數(shù)的判據(jù)只能局限于小體系中。隨著數(shù)據(jù)挖掘技術(shù)和人工智能的高速發(fā)展,以機(jī)器學(xué)習(xí)方法為代表的數(shù)據(jù)驅(qū)動(dòng)材料科學(xué)能夠有效聯(lián)合經(jīng)驗(yàn)、理論、實(shí)驗(yàn)和計(jì)算機(jī)模擬方面的優(yōu)勢(shì),更準(zhǔn)確地探究高熵合金成分-結(jié)構(gòu)-性能間的關(guān)系與規(guī)律[13-14]。近年來,使用機(jī)器學(xué)習(xí)手段輔助高熵合金設(shè)計(jì)的報(bào)道逐漸增多[15-20],通過這種數(shù)據(jù)驅(qū)動(dòng)的方法,能夠極大減少新型合金設(shè)計(jì)的時(shí)間和成本。目前機(jī)器學(xué)習(xí)模型已經(jīng)在高熵合金各種性質(zhì)的預(yù)測上有所研究,例如,Yan 等[16]通過訓(xùn)練好的梯度提升(gradient boosting,GB)模型,預(yù)測并驗(yàn)證了10 種新型固溶體結(jié)構(gòu)的難熔高熵合金。Sun 等[18]利用XGBoost 模型實(shí)現(xiàn)了對(duì)TiZrNbTa 合金硬度的精準(zhǔn)預(yù)測,經(jīng)過實(shí)驗(yàn)驗(yàn)證,其預(yù)測值的準(zhǔn)確率高達(dá)97.8%。Liu 等[19]在利用機(jī)器學(xué)習(xí)方法研究γ′相增強(qiáng)的Co 基高溫合金的工作中,將合金的γ,γ′相分類模型和γ′相固溶度的回歸模型同時(shí)用于成分空間的高通量篩選,取得了較好的結(jié)果。
AlCoCrCuFeNi 系高熵合金具備良好的軟磁性能[21]、力學(xué)性能[22]、耐磨性[23]等特點(diǎn)。馮力等[23]將AlCoCrCuFeNi0.5 合金作為耐磨涂層用于45#鋼表面。自該體系高熵合金提出以來已被眾多學(xué)者研究報(bào)道,特別是關(guān)于其相組織和硬度的研究,至今已積累了大量相關(guān)的材料數(shù)據(jù),為數(shù)據(jù)驅(qū)動(dòng)的研究提供了有利條件。目前已有一些建立機(jī)器學(xué)習(xí)模型輔助AlCoCrCuFeNi 合金體系研究的相關(guān)報(bào)道,例如Huang 等[24]基于神經(jīng)網(wǎng)絡(luò)算法構(gòu)建了AlCoCrCuFeNi合金的相分類模型,對(duì)于該體系合金固溶體和金屬間化合物的分類準(zhǔn)確率高達(dá)94.3%。然而,僅做了模型計(jì)算工作,并未進(jìn)行實(shí)際的實(shí)驗(yàn)驗(yàn)證,無法證明其模型的實(shí)際泛化能力。Wen 等[20]以AlCoCrCuFeNi 合金的成分作為輸入,硬度作為輸出,通過支持向量機(jī)模型設(shè)計(jì)了硬度高達(dá)880HV 的新型合金。本工作采用機(jī)器學(xué)習(xí)的方法,以AlCoCrCuFeNi 高熵合金為切入點(diǎn),通過同時(shí)建立高熵合金的相預(yù)測模型和硬度預(yù)測模型,以期使用相對(duì)傳統(tǒng)實(shí)驗(yàn)方法更低的設(shè)計(jì)成本和時(shí)間,在高熵合金設(shè)計(jì)空間中快速篩選出相種類和硬度皆符合預(yù)期的新合金,并通過實(shí)驗(yàn)檢驗(yàn)?zāi)P徒Y(jié)果,開展合金設(shè)計(jì)的新模式。
建立機(jī)器學(xué)習(xí)模型的過程,本質(zhì)上是利用特定的機(jī)器學(xué)習(xí)算法,根據(jù)所給的數(shù)據(jù)集計(jì)算特定的參數(shù)組合,學(xué)習(xí)數(shù)據(jù)集中隱含的知識(shí),得到與數(shù)據(jù)擬合程度較高且具有一定泛化能力的預(yù)測模型。
1.1.1 數(shù)據(jù)集的建立
多年的高熵合金研究積累了大量的數(shù)據(jù),關(guān)于高熵合金的相結(jié)構(gòu)和硬度預(yù)測模型,也有很多相關(guān)的文獻(xiàn)報(bào)道。本工作借鑒了Senkov 等[25-27]、Machaka[28]、Wen 等[20]和Qiao 等[29]的工作。其中Machaka[28]使用1460 個(gè)高熵合金相數(shù)據(jù)來訓(xùn)練模型,并對(duì)高熵合金面心立方(face centered cubic, FCC)相、體心立方(body centered cubic, BCC)相和FCC+BCC 雙相的三分類進(jìn)行了較為準(zhǔn)確的預(yù)測,然而該數(shù)據(jù)集中涉及到制備方法和熱處理工藝等影響因素,使得合金成分上存在較多重復(fù)。由于工藝因素影響復(fù)雜,且驗(yàn)證過程較難控制,本工作將不考慮這些因素造成的影響,僅選擇報(bào)道最多的電弧熔煉法制備的鑄態(tài)合金數(shù)據(jù),最終得到一個(gè)包含323 條數(shù)據(jù)的高熵合金相結(jié)構(gòu)數(shù)據(jù)集。硬度數(shù)據(jù)集則沿用Wen 等[20]所用的一個(gè)包含155 條Al-CoCrCuFeNi 系高熵合金硬度的數(shù)據(jù)集。此外,注意到Senkov 等[27]的報(bào)道中含有18 個(gè)額外的AlCoCr-CuFeNi 系高熵合金硬度數(shù)據(jù)。本工作將兩個(gè)硬度數(shù)據(jù)合并,樣本增加至173 個(gè)。至此,構(gòu)建了一個(gè)較大的高熵合金相結(jié)構(gòu)數(shù)據(jù)集和一個(gè)較小的硬度數(shù)據(jù)集,兩個(gè)數(shù)據(jù)集中的樣本成分覆蓋了大部分現(xiàn)有的AlCoCr-CuFeNi 系高熵合金成分。
值得一提的是,前人的工作中在建立相預(yù)測模型時(shí)使用了很多經(jīng)驗(yàn)參數(shù),而較少使用成分作為特征,而建立硬度預(yù)測模型時(shí)常使用成分作為特征,較少增添經(jīng)驗(yàn)參數(shù)。為了探究AlCoCrCuFeNi 系高熵合金的相結(jié)構(gòu)和硬度模型,選用由合金成分及元素物理性質(zhì)計(jì)算得到的價(jià)電子濃度(valence electron concentration, VEC)[9]、電負(fù)性差Δχ[11]、原子尺寸差δ[8]、平均熔點(diǎn)Tm、混合焓ΔHmix[8]、混合熵ΔSmix[8]和Ω[12]等7 種經(jīng)驗(yàn)參數(shù)。原因是:(1)這些經(jīng)驗(yàn)參數(shù)都曾經(jīng)被用來研究過對(duì)高熵合金相形成的影響,并取得了一定的研究成果,說明這些參數(shù)是對(duì)合金設(shè)計(jì)有一定影響作用以及指導(dǎo)意義的;(2)這些參數(shù)的計(jì)算較為方便,所涉及到的元素物理基本性質(zhì)都較易獲取,其中元素的價(jià)電子數(shù)、Pauling 電負(fù)性和原子尺寸的數(shù)據(jù)來源于文獻(xiàn)[30],元素之間的ΔHmix數(shù)據(jù)來源于文獻(xiàn)[31]。
1.1.2 機(jī)器學(xué)習(xí)算法
雖然一般的機(jī)器學(xué)習(xí)算法都能解決分類和回歸任務(wù),但是由于其原理不同,在問題解決的方式上會(huì)有所偏好,因此使用合適的機(jī)器學(xué)習(xí)算法來擬合數(shù)據(jù)集,能夠得出最優(yōu)的效果。因此,機(jī)器學(xué)習(xí)模型的選擇尤為重要,這需要了解每種模型的特點(diǎn)。其中表1中所示的支持向量機(jī)(support vector machine,SVM)、隨機(jī)森林(random forest,RF)和人工神經(jīng)網(wǎng)絡(luò)(artificial neural net,ANN)三種經(jīng)典算法分別代表著經(jīng)典二分類算法、樹集成算法和黑箱模型算法,本工作選擇這三種算法分別訓(xùn)練并對(duì)比高熵合金的相預(yù)測模型和硬度預(yù)測模型。
表1 機(jī)器學(xué)習(xí)算法及描述Table 1 Machine learning algorithms and characteristics
分類和回歸是兩種不同的任務(wù),使用的評(píng)價(jià)標(biāo)準(zhǔn)也不同。對(duì)于相分類模型的訓(xùn)練,選擇準(zhǔn)確率作為評(píng)價(jià)標(biāo)準(zhǔn),對(duì)于回歸模型的訓(xùn)練,選擇可決系數(shù)R2和均方根誤差(root mean square error,RMSE)作為評(píng)價(jià)標(biāo)準(zhǔn)。此外,為了提高模型的泛化能力,避免過擬合,采用5 折交叉驗(yàn)證(5-fold cross validation,5-CV)求取平均準(zhǔn)確率的方法獲得模型最適合的超參數(shù)。
圖1 為機(jī)器學(xué)習(xí)指導(dǎo)高熵合金設(shè)計(jì)的路線圖,模型部分即是高熵合金相預(yù)測模型和硬度預(yù)測模型的建立過程。完成模型建立后,進(jìn)一步選擇串聯(lián)兩個(gè)準(zhǔn)確率都較高的相分類模型和硬度回歸模型,對(duì)未知成分空間中的高熵合金進(jìn)行相和硬度的高通量預(yù)測,從中選擇目標(biāo)相和硬度的成分,實(shí)現(xiàn)對(duì)含有特定相和硬度可控的高熵合金高效設(shè)計(jì)。
圖1 機(jī)器學(xué)習(xí)指導(dǎo)高熵合金設(shè)計(jì)的路線圖Fig.1 Flow chart of ML assisted HEA design
本工作所用的Al,Co,Cr,Cu,F(xiàn)e,Ni 單質(zhì)金屬原料都是直徑1 mm、長度3 mm 左右的金屬顆粒,純度在99.5%以上。稱重配料后使用電弧熔煉法制備鑄態(tài)合金,爐內(nèi)真空度7×10-3Pa,0.025 MPa 的氬氣保護(hù)氣氛,每個(gè)錠子反復(fù)熔煉5 次以上,保證合金中金屬原料混合均勻。
使用CuKα 射線源對(duì)制備的合金進(jìn)行X 射線衍射分析(XRD, RIGAKUD/MAX-C);硬度測試采用HMAS-C1000SZD 型號(hào)顯微硬度計(jì),測試力為10 N,保壓時(shí)間10 s,每個(gè)合金測試3 次,取平均值。
2.1.1 數(shù)據(jù)集分析
高熵合金中的固溶體(solid solutions, SS)相與金屬間化合物(intermetallics, IM)相是最重要的兩種相結(jié)構(gòu),它們分別代表著高熵合金中“熵”主導(dǎo)結(jié)構(gòu)與“焓”主導(dǎo)結(jié)構(gòu)。結(jié)合所得相結(jié)構(gòu)數(shù)據(jù)集中的信息,本工作只研究固溶體相(包括FCC 結(jié)構(gòu)和BCC結(jié)構(gòu))和IM 相(包括B2 相及其他IM 相)兩種相結(jié)構(gòu)。
數(shù)據(jù)集中含有不同相的合金樣本數(shù)量存在較大差異,并且多數(shù)合金為多相結(jié)構(gòu),直接建立多分類模型需要考慮的類別較多。例如單相FCC、單相IM、FCC+BCC 相和FCC+IM 相等多種類別組合,使得每一類的數(shù)據(jù)量較少,難以達(dá)到較好的訓(xùn)練效果。因此,為了充分利用數(shù)據(jù),將數(shù)據(jù)只分成兩類,建立多個(gè)二分類模型,保證每一類別的數(shù)據(jù)量。
相結(jié)構(gòu)數(shù)據(jù)集中的每個(gè)樣本根據(jù)其組織中的相組成被賦予IM 類、FCC 類和BCC 類三種二分類標(biāo)簽:含有IM 相(1 類)和不含有IM 相(0 類)、含有BCC相(1 類)和不含有BCC 相(0 類)以及含有FCC 相(1類)和不含有FCC 相(0 類)。例如,其中的樣本Al0.7Co0.3CrFeNi 合金,其組織為FCC+BCC+IM 混合相結(jié)構(gòu),因此在上述的IM 類、FCC 類和BCC 類的標(biāo)簽中都為1 類。通過上述三種二分類的數(shù)據(jù)來分別訓(xùn)練模型辨別合金中是否含有IM 相、FCC 相和BCC相的能力。
一般而言,相關(guān)性較大的特征不宜同時(shí)存在于數(shù)據(jù)集中。因此,在將數(shù)據(jù)用于模型訓(xùn)練之前,通常會(huì)計(jì)算特征之間的皮爾遜相關(guān)系數(shù)(Pearson correlation coefficient,PCC),來初步判斷不同特征之間是否存在較大的線性相關(guān)性。一般認(rèn)為|PCC|≥0.8 時(shí),兩個(gè)特征之間具有強(qiáng)相關(guān)性(線性相關(guān));0.3<|PCC|<0.8時(shí),兩個(gè)特征之間具有弱相關(guān)性;|PCC|≤0.3 時(shí),兩個(gè)特征之間沒有相關(guān)性。圖2 為高熵合金相數(shù)據(jù)集中特征之間的PCC 熱度圖和相結(jié)構(gòu)數(shù)據(jù)集中三種分類方式下的樣本數(shù)據(jù)分布圖。由圖2(a)可知,相關(guān)性最大的兩個(gè)特征為ΔHmix和δ,其PCC 值為-0.76。而據(jù)上述的評(píng)價(jià)標(biāo)準(zhǔn),這兩個(gè)特征僅是具有弱相關(guān)性。因此,通過PCC 值的初步評(píng)判,在相結(jié)構(gòu)數(shù)據(jù)集中選用的13個(gè)特征兩兩之間不存在強(qiáng)相關(guān)性,該數(shù)據(jù)集是適合用于機(jī)器學(xué)習(xí)模型訓(xùn)練的。
圖2 高熵合金相數(shù)據(jù)集中特征之間的PCC 熱度圖(a)和相結(jié)構(gòu)數(shù)據(jù)集中三種分類方式下的樣本數(shù)據(jù)分布圖(b)Fig.2 PCC heat maps between features in HEA phase data set(a) and data distribution map under three types of classification in phase data set(b)
數(shù)據(jù)集的樣本分布情況也是模型訓(xùn)練之前需要研究的重要部分。圖2(b)給出了數(shù)據(jù)集在三種分類方式下的樣本分布情況,圖中斜線左邊的數(shù)字表示該類樣本的數(shù)量,右邊的數(shù)據(jù)是該類樣本所占的比例,例如樣本集中IM 相的正樣本有118 個(gè),占所有樣本的37%。由此可見,三種樣本分布都不均勻,其中IM 類和FCC 類樣本分布差異較大,說明數(shù)據(jù)集中含有IM相的樣本數(shù)以及不含有FCC 相的樣本數(shù)目較少,這類有偏數(shù)據(jù)集對(duì)模型的學(xué)習(xí)訓(xùn)練將帶來一定的挑戰(zhàn),有可能使得模型的學(xué)習(xí)結(jié)果產(chǎn)生偏好性。
2.1.2 預(yù)測模型結(jié)果分析
采用SVM,RF 和ANN 算法分別構(gòu)建基于IM 類、FCC 類和BCC 類三種分類方式的二分類模型,并使用5-CV 方法求取平均準(zhǔn)確率,如表2 所示。
表2 三種算法在各個(gè)標(biāo)簽下的準(zhǔn)確率Table 2 Accuracy of three algorithms under each tag
對(duì)比表2 中模型的訓(xùn)練效果,發(fā)現(xiàn)基于三種算法的模型對(duì)于相同標(biāo)簽的預(yù)測準(zhǔn)確率較為相近,其中SVM 模型在三種標(biāo)簽的數(shù)據(jù)集中都有相對(duì)較高的分類準(zhǔn)確率,說明SVM 算法在本工作所用的較小數(shù)據(jù)集中的二分類能力更有優(yōu)勢(shì)。反觀RF 模型和ANN模型,其測試集準(zhǔn)確率則是基本相當(dāng),但是通過對(duì)比兩個(gè)模型的訓(xùn)練集和測試集準(zhǔn)確率,可以發(fā)現(xiàn),兩個(gè)模型的訓(xùn)練集準(zhǔn)確率顯著高于測試集準(zhǔn)確率;兩個(gè)模型的測試集準(zhǔn)確率基本相當(dāng),而ANN 模型的訓(xùn)練集準(zhǔn)確率更高,說明兩個(gè)模型都存在一定的過擬合,且ANN 模型的過擬合程度要更高一些。
此外,IM 類的分類準(zhǔn)確率都較低,測試集準(zhǔn)確率僅有約80%,而FCC 類和BCC 類的識(shí)別準(zhǔn)確率都在90%以上,說明模型對(duì)IM 類的識(shí)別能力比較差。三個(gè)模型的訓(xùn)練結(jié)果都較差,因此問題可能出在數(shù)據(jù)集的質(zhì)量上。前文提到有偏數(shù)據(jù)集會(huì)給模型的訓(xùn)練帶來一些挑戰(zhàn),F(xiàn)CC 類數(shù)據(jù)是比IM 類更為偏的一組數(shù)據(jù),然而FCC 類的預(yù)測準(zhǔn)確率確很高。具體分析需要借助混淆矩陣(confusion matrix)的計(jì)算,混淆矩陣能夠直觀地觀察到每一個(gè)類別的預(yù)測情況,幫助判斷模型是否存在過擬合。
圖3 為三個(gè)模型基于5 折交叉驗(yàn)證方法在各個(gè)標(biāo)簽類別下的混淆矩陣。圖3(a-1),(a-2),(a-3)分別表示SVM 模型在IM 分類、FCC 分類和BCC 分類情況下計(jì)算得到的混淆矩陣。由于訓(xùn)練時(shí)使用了5 折交叉驗(yàn)證,而混淆矩陣只用測試集數(shù)據(jù)計(jì)算,因此這里將5次計(jì)算的混淆矩陣相加,最終得到全樣本集預(yù)測結(jié)果的混淆矩陣。
以圖3(a-1)為例,該圖表示SVM 模型在IM 標(biāo)簽二分類下5 次交叉驗(yàn)證混淆矩陣的和,其中縱坐標(biāo)為樣本的實(shí)際標(biāo)簽,橫坐標(biāo)為模型預(yù)測標(biāo)簽。因此右下角0.73/86 表示實(shí)際為含有IM 類(1 類),并且SVM 模型的預(yù)測也為1 類的樣本數(shù)為86,占IM 標(biāo)簽總數(shù)(118)的0.73,即正樣本的召回率為73%。
有偏數(shù)據(jù)集的訓(xùn)練結(jié)果往往存在偏好性,模型往往傾向于把樣本判斷為類別比較多的那一方。若發(fā)生在圖3(a-1)中所示的混淆矩陣中,則會(huì)導(dǎo)致把IM類認(rèn)為是不含有IM 類,即左下角的樣本數(shù)會(huì)比較多。這種偏好性往往是模型過擬合導(dǎo)致的,在樣本較多的類別召回率接近模型訓(xùn)練集準(zhǔn)確率的情況下,樣本較少的類別召回率與訓(xùn)練集相差較大,而這種訓(xùn)練集準(zhǔn)確率異常高于測試集準(zhǔn)確率的情況稱為過擬合。
圖3 (a-1),(b-1),(c-1)中的結(jié)果表明,三個(gè)模型在IM 類別的預(yù)測上確實(shí)存在一定程度上的過擬合,其中RF 模型的過擬合程度最為嚴(yán)重,其測試集預(yù)測平均準(zhǔn)確率為0.805,但是IM 類的召回率僅有61%。而ANN 模型擁有不遜于SVM 的測試集預(yù)測準(zhǔn)確率的同時(shí),其召回率達(dá)到了三個(gè)模型最高的0.75,與平均準(zhǔn)確率0.808 較為相近。因此,在IM 相的預(yù)測模型中,盡管SVM 的測試集平均預(yù)測準(zhǔn)確率最高,但由于存在一定程度的過擬合,憑借0 類樣本更高的準(zhǔn)確率提升了其平均準(zhǔn)確率,不利于模型對(duì)未知合金的預(yù)測。綜合上述考慮,ANN 模型在IM 類預(yù)測上的泛化能力更優(yōu)。
與IM 類數(shù)據(jù)類似,F(xiàn)CC 相標(biāo)簽中兩種類別的數(shù)據(jù)量比例失衡更為嚴(yán)重,因此也需要通過混淆矩陣輔助判斷是否存在過擬合現(xiàn)象。圖3(a-2),(b-2),(c-2)的結(jié)果表明,數(shù)據(jù)更少的不含F(xiàn)CC 相類別(0 類)并沒有被模型更多地預(yù)測為含有FCC 相類(1 類),即左上角的數(shù)值較高表明較大的負(fù)樣本召回率。通過比較三個(gè)模型的混淆矩陣,可以發(fā)現(xiàn)SVM 模型在FCC 類的預(yù)測上不僅有最高的召回率,平均預(yù)測準(zhǔn)確率也是最高的,并且兩個(gè)準(zhǔn)確率相近,因此可以初步判定,本工作訓(xùn)練的SVM 相分類模型沒有發(fā)生過擬合,為FCC 類預(yù)測的最佳模型。而RF 模型與ANN 模型雖然有相同且與SVM 模型相近的平均準(zhǔn)確率,但RF 模型的召回率僅有0.82,遠(yuǎn)低于0.923 的平均準(zhǔn)確率,ANN 模型的召回率同樣較低,說明這兩個(gè)模型存在較大的過擬合。
相比上述兩類數(shù)據(jù),BCC 相標(biāo)簽中的兩類數(shù)據(jù)量則更為接近1∶1,不會(huì)造成模型有偏好地學(xué)習(xí)。圖3(a-3),(b-3),(c-3)中的結(jié)果也證明了這一點(diǎn)。可以看出,正負(fù)樣本的預(yù)測準(zhǔn)確率比較相近,都在90%左右。其中又以SVM 模型的準(zhǔn)確率最高,其兩類樣本的召回率都高于RF 模型和ANN 模型。
2.1.3 相形成影響因素分析
三個(gè)測試表現(xiàn)最佳的相分類模型分別是ANNIM,SVM-FCC 和SVM-BCC。然而機(jī)器學(xué)習(xí)模型不僅是一個(gè)高效的預(yù)測篩選器,研究者們往往更想知道模型為什么做出這樣的預(yù)測,從而分析影響結(jié)果的因素,輔助理論解釋的完善。圖4 為基于ANN-IM 模型的特征重要性排序和SHAP(Shapley additive explanations)值分布圖。圖4(a)給出了基于ANN-IM 模型的特征重要性排序,圖中縱坐標(biāo)為特征名稱,橫坐標(biāo)為該特征對(duì)模型輸出值的平均影響占比。結(jié)果表明,Tm,ΔHmix,VEC 和Al 元素的含量是影響IM 相形成最重要的4 個(gè)特征。圖4(b)給出了基于ANN-IM 模型的SHAP 值分布圖,其中縱坐標(biāo)同樣為特征名稱,并且是按照特征重要性排序,橫坐標(biāo)為特征中每個(gè)樣本計(jì)算得到的SHAP 值,該值大于0 表示樣本對(duì)模型的輸出有正影響,即對(duì)IM 相(1 類)的形成有促進(jìn)作用。右邊的彩色柱代表特征數(shù)值的大小,具體表現(xiàn)在圖中每一個(gè)點(diǎn)代表一個(gè)樣本,在某一個(gè)樣本中該特征的數(shù)值越大則該點(diǎn)越紅,反之該特征的數(shù)值越小該點(diǎn)越藍(lán)。以影響最大的Tm為例,Tm越高,合金越傾向于形成IM 相。
圖4 基于ANN-IM 模型的特征重要性排序(a)和SHAP 值分布圖(b)Fig.4 Feature importance ranking(a) and SHAP value distribution(b) based on ANN-IM model
圖5 為基于SVM 的FCC 相預(yù)測模型和BCC 相預(yù)測模型的SHAP 值分布圖。由圖5(a)可知,Al 元素的含量、VEC 和Tm是影響高熵合金FCC 相形成的最重要的三個(gè)特征,并且Al 元素含量越低,VEC 越高或者Tm越低,合金越會(huì)傾向于形成FCC 相。由圖5(b)可知,ΔSmix和Tm是影響高熵合金B(yǎng)CC 相形成的最重要兩個(gè)特征,并且ΔSmix越大,Tm越低,越容易形成BCC 相。
圖5 基于SVM-FCC 模型(a)和SVM-BCC 模型(b)的SHAP 值分布圖Fig.5 Distribution of SHAP values based on SVM-FCC model(a) and SVM-BCC model(b)
可知,ΔHmix越小,越容易形成IM 相。ΔHmix代表元素之間的親和性以及形成化合物的傾向性,因此,ΔHmix很低時(shí)容易形成IM 相在材料學(xué)中是容易解釋的。此外,從圖4 和圖5(a)中還能發(fā)現(xiàn),VEC 和Al 元素含量都是影響IM 相和FCC 相形成的關(guān)鍵因素,其中VEC 越高,IM 相和FCC 相都越易形成。VEC 對(duì)于合金結(jié)構(gòu)的影響主要取決于合金金屬鍵的強(qiáng)弱。一般而言,較強(qiáng)的金屬鍵往往具有較高濃度的價(jià)電子,金屬鍵越強(qiáng),意味著晶體結(jié)構(gòu)的平衡原子間距更短、密堆程度更高。因此,價(jià)電子就像金屬原子之間的黏結(jié)劑,VEC 越大,往往更傾向于形成致密程度較高的晶體結(jié)構(gòu)。而IM 相和FCC 相一般都是密堆結(jié)構(gòu),與VEC 較大時(shí)這兩相更易形成的結(jié)論吻合。Al元素含量則對(duì)兩相起到相反的影響作用,Al 含量越多越容易形成IM相,且越難形成FCC 相,這可能與Al 原子的尺寸與其他3d 過渡族為主的金屬原子相差較大且ΔHmix較負(fù)的因素有關(guān)。圖5(b)的結(jié)果表明,影響B(tài)CC 形成的最重要因素是ΔSmix,且ΔSmix越大越容易形成BCC 相。ΔSmix越大越容易形成固溶體結(jié)構(gòu),再結(jié)合圖4 的結(jié)果,在AlCoCrCuFeNi 體系中,ΔSmix大不僅僅容易形成固溶體結(jié)構(gòu),還易形成BCC 固溶體結(jié)構(gòu)。
2.2.1 數(shù)據(jù)集分析
構(gòu)建機(jī)器學(xué)習(xí)硬度預(yù)測模型之前,同樣需要對(duì)數(shù)據(jù)進(jìn)行預(yù)分析。圖6 為硬度數(shù)據(jù)集的PCC 熱度圖和硬度值分布圖。由圖6(a)的PCC 熱度圖可知,Tm,Δχ與Ω兩兩之間都存在強(qiáng)相關(guān)性,說明在硬度數(shù)據(jù)集中,這三個(gè)特征存在一定的信息重疊,理應(yīng)刪除其中兩個(gè)特征。但是,一方面,PCC 只能說明兩個(gè)特征之間的關(guān)系,在同時(shí)考慮多特征時(shí)可能出現(xiàn)不同的結(jié)果;另一方面,機(jī)器學(xué)習(xí)在處理高維度問題上擁有強(qiáng)大能力,能夠同時(shí)納入多特征進(jìn)行多維度計(jì)算。因此,在硬度模型計(jì)算中仍保留這13 個(gè)特征。
圖6 硬度數(shù)據(jù)集中特征之間的PCC 熱度圖(a)和樣本分布圖(b)Fig.6 PCC heat maps(a) and data distribution maps(b) between features in hardness data set
圖6 (b)給出的硬度值分布表明,數(shù)據(jù)集中除了100~200HV 低硬度的數(shù)據(jù)較多外,基本服從正態(tài)分布。但是對(duì)于機(jī)器學(xué)習(xí)來說,均勻分布的數(shù)據(jù)更適合其學(xué)習(xí),正態(tài)分布的數(shù)據(jù)會(huì)使機(jī)器學(xué)習(xí)在兩端的極值處獲得較少信息。因此,以該數(shù)據(jù)集建立的機(jī)器學(xué)習(xí)模型對(duì)于數(shù)據(jù)分布較少的端部預(yù)測能力可能會(huì)較差,這將對(duì)高硬度合金預(yù)測與設(shè)計(jì)帶來挑戰(zhàn)。
2.2.2 預(yù)測模型結(jié)果分析
在硬度預(yù)測模型的訓(xùn)練中同樣采用5 折交叉驗(yàn)證,并采用R2和RMSE 兩個(gè)評(píng)價(jià)指標(biāo)。圖7 為基于SVM,RF 和ANN 三種算法的計(jì)算結(jié)果??芍?,在5 折交叉驗(yàn)證方法下,RF 模型與ANN 模型的測試結(jié)果非常相近且較差,而SVM 模型擁有最高的R2值和最低的RMSE,表明SVM 回歸在硬度數(shù)據(jù)的學(xué)習(xí)和預(yù)測上有著較大的優(yōu)勢(shì)。此外,模型帶來的差異不可忽視,因此選擇多種算法構(gòu)建模型來對(duì)比結(jié)果是有必要的。
圖7 硬度預(yù)測模型結(jié)果對(duì)比Fig.7 Comparison of results for hardness prediction models
2.2.3 硬度影響因素分析
圖8 為基于SVM 模型計(jì)算得到的特征重要性柱狀圖和SHAP 值分布圖。結(jié)果表明,Al 元素含量、δ、Ni 元素含量、VEC 和ΔHmix是影響較大的特征。
圖8 基于SVM 硬度預(yù)測模型的特征重要性排序(a)和SHAP 值分布圖(b)Fig.8 Feature importance ranking(a) and SHAP value distribution(b) based on SVM hardness prediction model
由圖8(b)的結(jié)果可知,Al 元素含量與δ的值越大,對(duì)形成高硬度合金的影響越顯著。事實(shí)上這兩個(gè)特征存在一定的關(guān)系,相對(duì)于Co,Cr,Cu,F(xiàn)e 和Ni 的原子半徑(都約為12 nm),Al 原子的原子半徑較大(約14 nm),當(dāng)Al 原子與其他元素組成新合金后,δ會(huì)變得很大,導(dǎo)致晶格畸變較為嚴(yán)重,產(chǎn)生原子級(jí)別的固溶強(qiáng)化作用,從而提升合金的硬度。此外,Ni 元素含量、VEC 和ΔHmix的值越小,對(duì)形成高硬度合金的影響越顯著 。實(shí)際上這幾種特征之間是相互關(guān)聯(lián)的,例如提高Al 元素含量并且降低Ni 元素含量,導(dǎo)致δ增大的同時(shí),還會(huì)降低合金的VEC(Al 價(jià)電子數(shù)為3,Ni 價(jià)電子數(shù)為10)。此外,由于Al 元素和其他元素都有較低的ΔHmix,Al 元素含量較高同樣也會(huì)降低合金ΔHmix,而ΔHmix較小時(shí)傾向于形成IM 相,IM 相往往具有比SS相更高的硬度,使得合金整體硬度提高。
2.3.1 機(jī)器學(xué)習(xí)模型指導(dǎo)AlCoCrCuFeNi 高熵合金設(shè)計(jì)方法
如圖1 所示,進(jìn)一步選擇串聯(lián)兩個(gè)準(zhǔn)確率都較高的相分類模型和硬度回歸模型,對(duì)未知成分空間中的高熵合金進(jìn)行相和硬度的高通量預(yù)測,從中選擇目標(biāo)相和硬度的成分,實(shí)現(xiàn)對(duì)含有特定相和硬度可控的高熵合金高效設(shè)計(jì)。具體步驟如下:首先根據(jù)兩個(gè)數(shù)據(jù)集的成分范圍構(gòu)建AlCoCrCuFeNi 系合金的成分空間,數(shù)據(jù)集中各個(gè)元素成分上下限即為成分空間的上下限(5%≤Al≤47%,5%≤Co≤22%,6%≤Cr≤34%,5%≤Cu≤16%,5%≤Fe≤31%,5%≤Ni≤22%,原子分?jǐn)?shù)),將成分變化步長設(shè)為1%,只保留四元、五元和六元合金,得到2730995 個(gè)成分。
進(jìn)一步對(duì)成分空間進(jìn)行相預(yù)測和硬度預(yù)測的雙重約束預(yù)測??紤]到SVM-FCC 模型的分類結(jié)果較好,擁有超過90%的準(zhǔn)確率,并且FCC 相在合金中常常起到增塑的作用,因此使用SVM-FCC 模型對(duì)合金是否含有FCC 相進(jìn)行初步預(yù)測篩選,得到1408950 個(gè)含有FCC 相的成分點(diǎn),再對(duì)這些數(shù)據(jù)(1408950 個(gè)成分點(diǎn))進(jìn)一步使用硬度回歸模型預(yù)測其硬度,最后選出5種硬度較高的合金(Al28Co10Cr27Cu10Fe5Ni20,Al28Co10Cr25-Cu15Fe22,Al18Co21Cr34Cu10Fe12Ni5,Al18Co21Cr33Cu7Fe13Ni8及Al18Co22Cr6Cu12Fe30Ni12,以每個(gè)成分最后一個(gè)元素的含量代表該成分的合金,分別表示為Ni20,F(xiàn)e22,Ni5,Ni8,Ni12)來驗(yàn)證模型的準(zhǔn)確性。Ni20,F(xiàn)e22,Ni5,Ni8,Ni12 的硬度預(yù)測值分別為623.68HV,618.90HV,651.13HV,668.16HV,503.29HV。
2.3.2 新型AlCoCrCuFeNi高熵合金制備與模型驗(yàn)證
圖9 為5 種合金試樣的XRD 譜圖??芍?,5 種合金中或多或少含有一些FCC 相,此與相預(yù)測模型相吻合,也證明本工作的機(jī)器學(xué)習(xí)相預(yù)測模型的準(zhǔn)確率較高。
圖9 所制備合金的XRD 譜圖Fig.9 XRD patterns of prepared alloys
表3 為5 種合金的預(yù)測硬度和測試硬度值。為了更直觀對(duì)比預(yù)測硬度和實(shí)際硬度,圖10 給出5 種合金硬度的分布情況??梢钥吹剑A(yù)測硬度和測試硬度較為接近,基本都在對(duì)角線附近,其R2達(dá)到0.944,并且RMSE 僅有12.58HV。
圖10 合金的預(yù)測硬度與測試硬度對(duì)比Fig.10 Comparison of predicted hardness and experimental hardness of alloys
表3 所制備合金的測試硬度和預(yù)測硬度Table 3 Experimental hardness and predicted hardness of prepared alloys
在5 種合金中,Ni8 合金擁有最高的硬度。圖9 中Ni8 合金的XRD 結(jié)果表明,B2 相和FCC 相的峰強(qiáng)相差較大,說明兩相含量相差較大,更多的B2 相導(dǎo)致合金具有更高的硬度。通過合金顯微組織分析,可以進(jìn)一步揭示不同合金硬度差異的原因。圖11 為5 種合金的BSE 圖及點(diǎn)成分分析。可以觀察到,每種合金都具有明顯的兩相組織,圖中深色的相為基體相,少量的淺色相為第二相。以硬度較大的Ni5 和Ni8 合金為例,如圖11(a),(b)所示,合金中存在白色條狀或點(diǎn)狀分布的FCC 相,并由成分分析可推測該相為FCC 結(jié)構(gòu)富Cu 的固溶體析出相,基體相為硬度較大的B2 相,與XRD 譜圖中含有少量FCC 相與大量B2 相的結(jié)果相吻合。此外,從圖11(b)高倍數(shù)下照片能夠觀察到,基體相中存在納米級(jí)別的白色細(xì)小第二相,其引入更多的相界面也能在一定程度上提升材料的硬度。再結(jié)合圖11(c)~(e)中兩相的比例,不難發(fā)現(xiàn)合金的硬度和白色的FCC 相的含量有關(guān),與圖9 的XRD 譜圖中兩相的峰強(qiáng)比結(jié)果也吻合。
為了進(jìn)一步確認(rèn)合金的相結(jié)構(gòu),選擇5 種合金中硬度最高的Ni8 合金,對(duì)其進(jìn)行TEM 觀察,如圖12 所示。圖12(a)為Ni8 合金的TEM 圖,能夠明顯觀察到兩種相的存在,分別是淺色的基體相與深色的析出相。圖12(b),(c)分別為圖12(a)中1,2 處所指兩種相的選區(qū)電子衍射(SAED)圖,根據(jù)圖中所示的衍射斑點(diǎn),確認(rèn)基體相為B2 結(jié)構(gòu)的硬質(zhì)相,析出相為FCC 結(jié)構(gòu)的相。因此,類比到其他4 種合金,結(jié)合圖11 的BSE 圖,可以確認(rèn)FCC 相結(jié)構(gòu)預(yù)測模型的結(jié)果與實(shí)際相吻合。
圖12 Ni8 合金的TEM 圖(a)及合金中基體相(b)和析出相(c)的SAED 圖Fig.12 TEM image of Ni8 alloy(a),SAED images of matrix phase(b) and precipitated phase(c) in alloys
此外,對(duì)合金進(jìn)行EDS 表征來觀察合金的元素分布,如圖13 所示??梢园l(fā)現(xiàn),基體相基本包含各種元素,而析出相是一種富Cu 相,且含有少量的Al,基本不含有其他元素,表明Cu 元素與基體相難以相容,凝固時(shí)容易析出。
(1)在數(shù)據(jù)集較小的材料體系中,SVM 擁有比RF和ANN 更好的訓(xùn)練結(jié)果,其中SVM 模型在FCC 相的平均識(shí)別準(zhǔn)確率高達(dá)0.944,SVM 硬度預(yù)測模型的RMSE 為56.065HV,達(dá)到一個(gè)較好的訓(xùn)練水平。
(2)VEC,Al 元素含量,ΔHmix是影響高熵合金形成FCC 相、BCC 相、IM 相最重要的因素。Al 元素的加入對(duì)合金的硬度影響最明顯,且Al 含量越高,形成高硬度合金的可能性越大。
(3)通過兩個(gè)訓(xùn)練好的模型,對(duì)高熵合金成分的巨大成分空間進(jìn)行高通量相與硬度預(yù)測,篩選并制備了5 種新合金來驗(yàn)證模型。XRD,SEM 和TEM 等結(jié)果表明,5 種合金的相都是FCC+IM,與預(yù)測相吻合,且實(shí)驗(yàn)測試硬度與預(yù)測硬度的R2為0.944,RMSE 僅有12.58HV,模型預(yù)測結(jié)果良好。