田 靜,黃依平,苗恩新,李 苑,劉軍波,張本濤,劉 涌,韓高榮
(1.浙江大學(xué)材料科學(xué)與工程學(xué)院硅材料國家重點(diǎn)實(shí)驗(yàn)室,杭州 310027;2.中國建筑第四工程局有限公司, 廣州 510665)
傳統(tǒng)玻璃幕墻主要采用鋼化、夾膠處理的平板玻璃。隨著建筑設(shè)計(jì)美學(xué)及功能要求的變化,線膨脹系數(shù)高達(dá)90×10-7℃-1的普通浮法玻璃難以滿足超厚玻璃幕墻對(duì)玻璃材料的要求。為獲得更低線膨脹系數(shù)的玻璃材料,通常采用以下解決方案:1)制造微晶玻璃[1],如以β-石英晶體為主晶相的商用Li2O-Al2O3-SiO2系微晶玻璃具有幾乎為零的線膨脹系數(shù),但是低成本、均勻、可見光透明的大尺寸微晶玻璃生產(chǎn)極為困難[2];2)制造TiO2-SiO2二元體系玻璃,如美國康寧公司開發(fā)的ULE?玻璃(ultra low expansion glass),它在5~35 ℃幾乎沒有任何尺寸變化,成為半導(dǎo)體工業(yè)[3]及天文學(xué)領(lǐng)域[4]的首選材料,但該類玻璃對(duì)原料純度要求極高,難以實(shí)現(xiàn)低成本制造;3)制造硼硅酸鹽體系玻璃,硼硅酸鹽玻璃與普通浮法玻璃相比具有更低的密度和線膨脹系數(shù),如“派來克斯”玻璃,雖然它具有良好的熱穩(wěn)定性、化學(xué)穩(wěn)定性和機(jī)械性能[5],但是必須對(duì)其組分與密度、線膨脹系數(shù)、彈性模量等進(jìn)行適配性優(yōu)化,才能滿足玻璃幕墻應(yīng)用的實(shí)際需求。
組分與性能關(guān)系的定量化預(yù)測(cè)一直是玻璃研究領(lǐng)域的難點(diǎn)和熱點(diǎn)。為了解決這個(gè)問題,早前的研究者們[6-8]提出了一些基于玻璃性能隨組分變化線性加和的簡(jiǎn)單經(jīng)驗(yàn)?zāi)P?通過玻璃組分和獲得的性能計(jì)算系數(shù)來粗略預(yù)測(cè)玻璃的性能,這些模型通常經(jīng)驗(yàn)性較強(qiáng),往往只適用于一些特定的體系,且不同研究者提出的性能計(jì)算系數(shù)不同,預(yù)測(cè)的準(zhǔn)確性差。隨著技術(shù)的進(jìn)步和研究的深入,一些基于物理模型的玻璃性能預(yù)測(cè)方法得以建立,例如基于玻璃網(wǎng)絡(luò)鍵約束與自由度的拓?fù)涫`理論[9-10]、基于量子化學(xué)的第一性原理計(jì)算[11-12]和基于“杠桿原理”的相圖模型[13-14]等。其中,基于硫系玻璃和簡(jiǎn)單二元、三元、四元氧化物玻璃的拓?fù)涫`理論進(jìn)行預(yù)測(cè)時(shí),預(yù)測(cè)性能局限于線膨脹系數(shù)、硬度、脆性系數(shù)和玻璃轉(zhuǎn)變溫度;基于第一性原理的分子動(dòng)力學(xué)(ab initio molecular dynamics, AIMD)法,相對(duì)于經(jīng)典分子動(dòng)力學(xué),它不受限于勢(shì)函數(shù)的開發(fā),可以模擬多元體系,但它存在嚴(yán)重的時(shí)間空間局限性,限制了這一方法的預(yù)測(cè)能力;基于“杠桿原理”的相圖模型對(duì)非線性較強(qiáng)的玻璃性能預(yù)測(cè)能力不足??梢?這些模型受限于不同體系玻璃的適用性,對(duì)于復(fù)雜玻璃體系預(yù)測(cè)的可遷移性和準(zhǔn)確性仍有待進(jìn)一步提高。實(shí)際上,只要冷卻速率足夠大,元素周期表中幾乎所有元素都可以形成玻璃,可能的組分多達(dá)1052種[15]。同時(shí),玻璃的非晶態(tài)特性使其在化學(xué)組成上不需要遵循化學(xué)計(jì)量的要求,因此開發(fā)新型玻璃材料時(shí)可以探索的組分?jǐn)?shù)量十分龐大。此外,玻璃的非平衡和非遍歷特性又使玻璃結(jié)構(gòu)難以用平衡熱力學(xué)或者統(tǒng)計(jì)力學(xué)的方法來描述[16],這對(duì)傳統(tǒng)的試錯(cuò)型和經(jīng)驗(yàn)型開發(fā)方式提出了嚴(yán)峻挑戰(zhàn),亟待引入更快速、更高效的新方法。
隨著近年“材料基因組計(jì)劃”[17]的實(shí)施,以機(jī)器學(xué)習(xí)(machine learning)為代表的數(shù)據(jù)驅(qū)動(dòng)型建模技術(shù)快速發(fā)展[18-19],并在玻璃研究領(lǐng)域得到了應(yīng)用[20-21]。目前已報(bào)道了諸多玻璃組分和性能預(yù)測(cè)模型的研究工作,如:Mauro等[22]針對(duì)包含851個(gè)硅酸鹽玻璃樣本的數(shù)據(jù)集,采用人工神經(jīng)網(wǎng)絡(luò)(artifical neural network, ANN)算法建立了玻璃組分與玻璃液相線溫度的模型;Cassar等[23]采用ANN算法使用大數(shù)據(jù)集建立了玻璃組分與玻璃轉(zhuǎn)變溫度的模型,并對(duì)比決策樹(decision tree, DT)、K-近鄰(K-nearest neighbor, K-NN)和隨機(jī)森林(random forest, RF)三種算法對(duì)玻璃轉(zhuǎn)變溫度、液相線溫度、彈性模量、線膨脹系數(shù)、折射率和阿貝數(shù)等六種性能所建立模型的預(yù)測(cè)效果發(fā)現(xiàn),采用RF算法建立的預(yù)測(cè)模型在每種性能上都有最好的表現(xiàn)[24];Deng等[25]利用康寧公司收集的大型數(shù)據(jù)集對(duì)氧化物玻璃的密度、彈性模量、剪切模量和泊松比進(jìn)行了全面的機(jī)器學(xué)習(xí)研究,并對(duì)比了RF、K-NN、ANN、支持向量機(jī)(support vector machine, SVM)和線性回歸LASSO(least absolute shrinkage and selection operator)五種算法,其中LASSO模型對(duì)于線性度較好的密度表現(xiàn)最優(yōu),而非線性的彈性模量、剪切模量和泊松比則要應(yīng)用RF、ANN和K-NN等算法才能獲得較好的擬合結(jié)果;Yang等[26]將高通量分子動(dòng)力學(xué)模擬獲得的由231個(gè)Ca-Al-Si系玻璃樣本組成的數(shù)據(jù)集作為訓(xùn)練集,對(duì)比研究了使用多項(xiàng)式回歸、LASSO、RF和ANN四種算法訓(xùn)練的玻璃彈性模量預(yù)測(cè)模型,其中RF模型表現(xiàn)出最好的非線性擬合能力,ANN模型擁有最好的泛化能力;Hu等[27]同樣使用由高通量分子動(dòng)力學(xué)模擬獲得的二元、三元硅酸鹽玻璃數(shù)據(jù)集,開發(fā)了梯度推進(jìn)機(jī)算法(GBM-LASSO),建立了玻璃組分與密度、體模量和剪切模量的模型;Ravinder等[28]采用高保真的深度神經(jīng)網(wǎng)絡(luò)算法在玻璃組分與密度、彈性模量、剪切模量、硬度、玻璃轉(zhuǎn)變溫度、線膨脹系數(shù)、液相線溫度和折射率等八個(gè)性能之間建立了預(yù)測(cè)模型。在眾多的機(jī)器學(xué)習(xí)算法中,RF算法具有較好的非線性捕獲能力,適用于高維特征空間及大數(shù)據(jù)集,在各相關(guān)工作中都有較好的表現(xiàn)。
本研究針對(duì)超厚玻璃幕墻對(duì)輕質(zhì)、低膨脹玻璃材料的性能需求,從SciGlass數(shù)據(jù)庫[29]中提取104規(guī)模的數(shù)據(jù)集,利用隨機(jī)森林算法構(gòu)建氧化物玻璃的組分與線膨脹系數(shù)、密度和彈性模量三個(gè)性能的預(yù)測(cè)模型,采用SHAP(shapley additive explanation)分析[30]等方法對(duì)預(yù)測(cè)模型進(jìn)行可解釋性研究,并且在硼硅酸鹽玻璃的大型組分空間中實(shí)現(xiàn)了性能的準(zhǔn)確預(yù)測(cè)和組分的快速篩選,為輕質(zhì)、低膨脹硼硅酸鹽幕墻玻璃組分的設(shè)計(jì)開發(fā)提供新的思路。
本文所有初始數(shù)據(jù)均來自SciGlass數(shù)據(jù)庫[29],從中分別提取了玻璃組分及其對(duì)應(yīng)的線膨脹系數(shù)、密度和彈性模量,并對(duì)數(shù)據(jù)集進(jìn)行了數(shù)據(jù)清洗。
1)無效樣本剔除。去除標(biāo)簽值為空的樣本和氧元素含量低于30%(原子分?jǐn)?shù))的樣本,確保數(shù)據(jù)來自有效的氧化物玻璃。
2)輸入特征降維。為建立相對(duì)完整的預(yù)測(cè)模型,剔除出現(xiàn)頻率極低且含量極少的元素樣本,如H、C、N、F、S、Cl、Br、I、Ag、Au、Pt、Ru、Hg等。最終以其余56種元素的氧化物作為輸入特征,進(jìn)行歸一化處理并去除重復(fù)樣本。
3)極端值樣本剔除。設(shè)定線熱膨脹系數(shù)、密度和彈性模量的取值區(qū)間分別為[0.10,300]×10-7℃-1,[1,10] g/cm3和[1,170] GPa,忽略區(qū)間外的樣本。
經(jīng)以上操作后的數(shù)據(jù)集,含密度數(shù)據(jù)的樣本有62 312個(gè),含線膨脹系數(shù)數(shù)據(jù)的樣本有52 073個(gè),含彈性模量數(shù)據(jù)的樣本有13 030個(gè)。
隨機(jī)森林(RF)是一個(gè)以決策樹為基本單元的集成算法[31-33]。本文的RF回歸模型以氧化物摩爾組分為輸入,相關(guān)性能為輸出,在訓(xùn)練過程中按照3∶1的比例劃分?jǐn)?shù)據(jù)集為訓(xùn)練集和測(cè)試集,以平均絕對(duì)誤差(mean absolute error, MAE)和決定系數(shù)R2為模型評(píng)估指標(biāo),定義如式(1)、(2)所示。
(1)
(2)
采用熔融-冷卻法制備玻璃樣品。以分析純的石英砂、氧化鋁、四硼酸鈉、碳酸鈣、堿式碳酸鎂、無水碳酸鈉為原料,采用梅特勒ME2002E型精密天平稱量玻璃原料,經(jīng)瑪瑙研缽充分混合研磨后放入石英坩堝,隨后在宜興萬石JGMT-8/300型高溫升降爐中進(jìn)行玻璃熔制。具體過程為:從室溫經(jīng)過90 min升溫至1 000 ℃,再從1 000 ℃經(jīng)過50 min升溫至1 590 ℃,在1 590 ℃保溫2 h后又經(jīng)10 min升溫至1 630 ℃,在1 630 ℃保溫50 min后經(jīng)25 min降溫至1 560 ℃,玻璃液經(jīng)黃銅模具成型后,玻璃塊體與模具一起在河北雅格隆GW1100-50型箱式電爐中730 ℃下退火1 h后隨爐冷卻[35]。制得的樣品經(jīng)過切割、打磨和拋光后,采用美國Cetea的Analyte HE型193 nm激光剝蝕(laser Ablation, LA)系統(tǒng)進(jìn)樣與德國Thermofisher的iCAP QR型電感耦合等離子體質(zhì)譜儀(Inductively Coupled Plasma Mass Spectrometry, ICP-MS)聯(lián)機(jī)的LA-ICP-MS測(cè)試樣品氧化物組分;采用北京旭輝新銳的MD-100型玻璃密度儀測(cè)量樣品密度;采用北京旭輝新銳的DIL-1000型膨脹系數(shù)測(cè)量?jī)x測(cè)量樣品線膨脹系數(shù),溫度范圍設(shè)置在室溫到300 ℃;采用Agilent G200型納米壓痕儀測(cè)量樣品彈性模量。
圖1為數(shù)據(jù)集中線膨脹系數(shù)(coefficient of linear expansion, CTE)、密度和彈性模量的數(shù)據(jù)分布情況及三種性能樣本的氧化物數(shù)量分布情況。圖1(a)~(c)分別為樣本的線膨脹系數(shù)、密度和彈性模量的分布直方圖,可以看出,線膨脹系數(shù)和密度數(shù)據(jù)分布具有明顯的非對(duì)稱形狀,線膨脹系數(shù)的樣本點(diǎn)主要分布在(60~120)×10-7℃-1,密度的樣本點(diǎn)主要分布在2~3 g/cm3,彈性模量的數(shù)據(jù)分布近似于正態(tài)分布,樣本主要分布在50~100 GPa。圖1(d)~(f)為樣本氧化物數(shù)量的分布直方圖,對(duì)于三種性能來說,三元體系的樣本數(shù)量均最大,樣本數(shù)量隨氧化物種類的增多顯著減少,表明以往的工作更多關(guān)注組分簡(jiǎn)單的玻璃體系。
圖1 數(shù)據(jù)集中線膨脹系數(shù)、密度和彈性模量的數(shù)據(jù)分布情況及三種性能數(shù)據(jù)集樣本的氧化物種類分布情況Fig.1 Data distribution of coefficient of linear expansion, density and elastic modulus and distribution of oxide types of three properties in data set
圖2為建立的RF模型在訓(xùn)練集和測(cè)試集上的表現(xiàn)。由圖2可見,線膨脹系數(shù)、密度和彈性模量的RF模型在訓(xùn)練集上的MAE和R2分別為2.040 0×10-7℃-1和0.988 0,0.037 4 g/cm3和0.994 0,1.297 0 GPa和0.985 6,表明三個(gè)模型在訓(xùn)練集上與試驗(yàn)結(jié)果具有良好的一致性。RF模型在訓(xùn)練集上對(duì)密度的擬合能力優(yōu)于線膨脹系數(shù)和彈性模量,這種差異則可能與樣本數(shù)量、數(shù)據(jù)質(zhì)量、算法擬合能力和性能本身可預(yù)測(cè)的難易程度有關(guān)[1,27,36]。對(duì)比三個(gè)模型在測(cè)試集上的表現(xiàn),數(shù)據(jù)分布比訓(xùn)練集更離散,且在測(cè)試集上線膨脹系數(shù)、密度和彈性模量模型均表現(xiàn)出了高于訓(xùn)練集的MAE,分別為4.500 0×10-7℃-1、0.100 4 g/cm3和3.445 2 GPa,表明模型在泛化遷移過程中發(fā)生了一定程度的“失真”。但是考慮到本研究采用了104規(guī)模的大樣本集合和56個(gè)特征的高維輸入空間,建立的RF模型仍表現(xiàn)出較好的泛化能力,表明三個(gè)模型針對(duì)多元組分玻璃的性能預(yù)測(cè)具有較強(qiáng)的實(shí)用性。
圖2 優(yōu)化后的線膨脹系數(shù)、密度和彈性模量模型在訓(xùn)練集和測(cè)試集上的表現(xiàn)Fig.2 Performance of optimized coefficient of linear expansion, density and elastic modulus models on training set and test set
為了進(jìn)一步驗(yàn)證模型的預(yù)測(cè)能力,利用訓(xùn)練好的模型對(duì)文獻(xiàn)中報(bào)道的樣本進(jìn)行預(yù)測(cè)[37-42],結(jié)果如圖3所示。由圖3可見,線膨脹系數(shù)、密度和彈性模量的預(yù)測(cè)相對(duì)誤差分別在±10%、±5%和±5%,表明本文建立的模型可以準(zhǔn)確預(yù)測(cè)不同氧化物玻璃體系的線膨脹系數(shù)、密度和彈性模量,滿足實(shí)際應(yīng)用的要求。
圖3 RF模型對(duì)文獻(xiàn)報(bào)道的氧化物玻璃線膨脹系數(shù)、密度和彈性模量的預(yù)測(cè)值和試驗(yàn)值的對(duì)比[37-42](點(diǎn)線為相對(duì)誤差?yuàn)A線)Fig.3 Comparison between predicted results from RF models and experimental results of coefficient of linear expansion, density and elastic modulus of oxide glass reported by other papers[37-42](the two pink dot-dashed lines are relative deviation lines)
隨機(jī)森林模型的構(gòu)建完全基于數(shù)據(jù),其內(nèi)部是一個(gè)“黑盒”,為了給模型提供一定的可解釋性,首先采用特征的置換重要性分析來評(píng)估氧化物組分對(duì)性能的影響作用[43-44]。置換重要性定義為通過隨機(jī)打亂某個(gè)特征在OOB(out of bag)樣本集中的排列順序來破壞它們與目標(biāo)值的原始關(guān)聯(lián),將特征值亂序之前與亂序之后在OOB集上的R2差值作為該特征的重要性,一個(gè)特征的置換重要性數(shù)值越大,則該特征與模型整體預(yù)測(cè)精度越相關(guān)。RF模型重要性排序在前10的特征(氧化物)在訓(xùn)練集和測(cè)試集上的置換重要性表現(xiàn)如圖4所示。從圖中可以看出:對(duì)于線膨脹系數(shù)而言,修飾體堿金屬氧化物(Na2O、K2O)、網(wǎng)絡(luò)形成體(SiO2、B2O3)和中間體氧化物(Al2O3)最為重要;對(duì)于密度而言,重金屬氧化物(Bi2O3、PbO、TeO2)以及網(wǎng)絡(luò)形成體氧化物(SiO2、B2O3)最為重要;對(duì)于彈性模量而言,網(wǎng)絡(luò)形成體(SiO2、B2O3)、中間體氧化物(Al2O3)以及修飾體堿金屬氧化物(Na2O)、堿土金屬氧化物(MgO)最為重要,這與基于玻璃化學(xué)基礎(chǔ)理論的分析是一致的。進(jìn)一步可以發(fā)現(xiàn),三個(gè)模型對(duì)部分特征置換重要性的評(píng)價(jià)在訓(xùn)練集和測(cè)試集上不一致,如線膨脹系數(shù)和密度模型在訓(xùn)練過程中分別高估Li2O和Na2O的重要性,而彈性模量模型在訓(xùn)練過程中則極大地高估了CaO的作用,對(duì)應(yīng)了彈性模量模型具有最差的泛化能力,與圖2結(jié)果一致。
圖4 線膨脹系數(shù)、密度和彈性模量隨機(jī)森林回歸模型在訓(xùn)練集和測(cè)試集上的特征置換重要性分析Fig.4 Feature permutation importance analysis of coefficient of linear expansion, density and elastic modulus random forest regression models on training set and test set
為了在置換特征重要性排序基礎(chǔ)上進(jìn)一步探明氧化物對(duì)性能的影響,引入基于合作博弈論個(gè)體邊緣收益的SHAP分析[45]。三個(gè)性能模型的SHAP分析值蜂群圖如圖5所示。蜂群圖的左側(cè)標(biāo)簽為根據(jù)特征SHAP值絕對(duì)值的平均值進(jìn)行重要性排序的前10種氧化物,水平軸上的有色點(diǎn)代表包含該氧化物的一個(gè)玻璃樣本;點(diǎn)的顏色表示該氧化物在樣本中的含量,隨著右側(cè)色標(biāo)中的冷色到暖色,對(duì)應(yīng)氧化物含量由小到大;點(diǎn)在x軸的位置代表該氧化物在樣本中的SHAP值,具有相同SHAP值的點(diǎn)在垂直方向堆疊。由于SHAP值具有可加和性,即
圖5 線膨脹系數(shù)、密度和彈性模量RF模型SHAP分析值蜂群圖Fig.5 Beeswarm plot of SHAP analysis values of coefficient of linear expansion, density and elastic modulus
yi=ybase+f(xi1)+f(xi2)+…+f(xik)
(3)
樣本xi中所有特征的SHAP值f(xik)與基礎(chǔ)值ybase(目標(biāo)值的平均值)之和等于該樣本的預(yù)測(cè)值yi,因此SHAP分析可以反映特征對(duì)目標(biāo)的貢獻(xiàn)是正向的還是負(fù)向的。
如圖5(a)所示,對(duì)于氧化物玻璃的線膨脹系數(shù),修飾體Na2O、K2O、Li2O和BaO含量的增加將會(huì)增加線膨脹系數(shù),形成體以及中間體SiO2、Al2O3、ZnO含量的增加將減小線膨脹系數(shù),但形成體TeO2[46-47]卻表現(xiàn)出了相反的作用。此外,PbO作為一種常用的助熔劑,其含量的增加也會(huì)導(dǎo)致玻璃線膨脹系數(shù)的增大。如圖5(b)所示,對(duì)于氧化物玻璃的密度,PbO、Bi2O3、TeO2、BaO和La2O3等重金屬氧化物含量的增加將增大玻璃密度,對(duì)于相對(duì)原子質(zhì)量較低的形成體、修飾體和中間體氧化物SiO2、B2O3、P2O5、Na2O、Li2O、MgO、Al2O3,它們含量的增加將主要減小玻璃的密度。如圖5(c)所示,對(duì)于氧化物玻璃的彈性模量,形成體和中間體SiO2、Al2O3、MgO、TiO2含量的增加會(huì)增大玻璃的彈性模量,但P2O5在玻璃中獨(dú)特的網(wǎng)絡(luò)結(jié)構(gòu)決定了高含量的P2O5會(huì)減小玻璃的彈性模量。修飾體Na2O和K2O含量的增大將減小玻璃彈性模量,但高陽離子場(chǎng)強(qiáng)的Li2O[36]和Y2O3[48]含量的增加對(duì)彈性模量起正向作用,而CaO則表現(xiàn)出一定的兩面性。除此之外,在線膨脹系數(shù)和彈性模量的SHAP圖中均清楚地表現(xiàn)了著名的“硼反?!爆F(xiàn)象,即B2O3含量的增加既可能增加也可能降低線膨脹系數(shù)和彈性模量,與文獻(xiàn)[49-50]結(jié)論一致。
以硼硅酸鹽玻璃六元體系Si-Al-B-Ca-Mg-Na為設(shè)計(jì)對(duì)象,利用前文建立的RF模型在該體系中進(jìn)行系統(tǒng)性研究和試驗(yàn)驗(yàn)證。限定SiO2的含量在60%~80%(摩爾分?jǐn)?shù),下同),所有氧化物的含量總和為100%,氧化物組分間隔為1%,由此形成包含1 179 255種玻璃組成的樣本空間。用RF模型計(jì)算了該樣本空間中所有玻璃的線膨脹系數(shù)、密度和彈性模量,結(jié)果如圖6所示,映射圖以彈性模量值為色標(biāo),累計(jì)耗時(shí)約38 654 core·s(≈10.7 core·h)。樣本點(diǎn)的線膨脹系數(shù)主要集中在(30.00~90.00)×10-7℃-1,密度在2.30~2.70 g/cm3,彈性模量在70.00~90.00 GPa。輕質(zhì)、低膨脹幕墻玻璃要有盡可能低的密度、線膨脹系數(shù)和相對(duì)適宜的彈性模量,同時(shí)考慮到玻璃實(shí)際生產(chǎn)涉及的熔融溫度、成玻特性等工藝性能,最終在密度低于2.40 g/cm3、線膨脹系數(shù)低于60.00×10-7℃-1、SiO2含量為[70,80]%、網(wǎng)絡(luò)修飾體含量為[10,20]%的區(qū)域內(nèi)挑選了4組硼硅酸鹽玻璃組分進(jìn)行試驗(yàn)驗(yàn)證,所選樣本均分布在圖6矩形框內(nèi)。
圖6 組分空間中各樣本點(diǎn)在線膨脹系數(shù)-密度面上的二維映射分布Fig.6 2D mapping distribution of data points on coefficient of linear expansion-density plane in composition space
表1為玻璃設(shè)計(jì)組分與LA-ICP-MS實(shí)測(cè)組分對(duì)比。由于熔制過程中存在原料揮發(fā)、坩堝成分滲析等因素的影響,實(shí)際組分同設(shè)計(jì)組分總會(huì)有所偏差,一般來說,含量少的組分偏差會(huì)相對(duì)較大,其中所有樣本的SiO2組分偏差均分布在3%以內(nèi)。圖7為樣本性能測(cè)試值與預(yù)測(cè)值的對(duì)比。四個(gè)樣本的密度相對(duì)偏差均在±1%,線膨脹系數(shù)和彈性模量的相對(duì)偏差在±5%。這些結(jié)果再次印證了本工作建立的RF模型具有足夠的準(zhǔn)確性,能夠在真實(shí)世界的高維組分空間中準(zhǔn)確預(yù)測(cè)氧化物玻璃的線膨脹系數(shù)、密度和彈性模量。《玻璃幕墻工程技術(shù)規(guī)范》(JGJ 102—2003)[51]對(duì)玻璃幕墻材料彈性模量的規(guī)定為0.72×105N/mm2(72.00 GPa),對(duì)線膨脹系數(shù)的規(guī)定為(0.80~1.00)×10-5℃-1((80.00~100.00)×10-7℃-1),對(duì)材料重力密度的規(guī)定為25.60 kN/m3(2.61 g/cm3)。本文篩選出的四組樣品在彈性模量合規(guī)的情況下,具有更低的密度和線膨脹系數(shù),提高了玻璃的抗熱沖擊性能,增加了玻璃本身以及其他連接件和支撐件的使用壽命。
表1 玻璃樣品的設(shè)計(jì)組分與LA-ICP-MS實(shí)測(cè)組分Table 1 Nominal composition and experimental compositions from LA-ICP-MS of glass samples /%
圖7 四個(gè)樣本的線膨脹系數(shù)、密度和彈性模量的試驗(yàn)值與預(yù)測(cè)值的對(duì)比以及基于試驗(yàn)值的相對(duì)偏差Fig.7 Comparison between experimental results and predicted results from coefficient of linear expansion, density and elastic modulus models of four samples, and relative deviation based on experimental results
1)本文利用機(jī)器學(xué)習(xí)方法和玻璃材料數(shù)據(jù)庫,在氧化物玻璃組分和線膨脹系數(shù)、密度及彈性模量等三項(xiàng)性能之間建立了隨機(jī)森林預(yù)測(cè)模型,在包含56種氧化物的高維組分空間中實(shí)現(xiàn)了對(duì)性能的準(zhǔn)確預(yù)測(cè)。
2)結(jié)合隨機(jī)森林模型的特征重要性分析和SHAP分析進(jìn)行了模型可解釋性研究,復(fù)現(xiàn)了氧化物玻璃組分中的硼反常等現(xiàn)象,提高了模型的透明度和可信度。利用該預(yù)測(cè)模型對(duì)Si-Al-B-Ca-Mg-Na六元氧化物組分空間中的約118萬個(gè)玻璃配方進(jìn)行快速預(yù)測(cè),從中篩選了4組硼硅酸鹽玻璃組成,性能的測(cè)試結(jié)果與模型預(yù)測(cè)相符,且優(yōu)于相關(guān)規(guī)范要求。