周岳鈺,高 靜,汪 燕,黃曉曉,吳建嵐,王 強,衛(wèi)陳龍,聞 軍(通信作者)
(安慶師范大學 安徽 安慶 246133)
材料作為現代社會發(fā)展的三大支柱之一,對科學發(fā)展和社會進步起著重要作用。高性能材料的開發(fā)和應用成為材料研究領域的重要課題。材料的研究方法大體可分為實驗法和計算法。實驗研究方法主要基于研究者的經驗和直覺,但常常面臨著制備成本高、研發(fā)周期長、效率低下等問題。第一性原理計算、分子動力學、有限元模擬等常用計算模擬方法因其相對精準預測能力,已被廣泛用于半導體材料[1]、發(fā)光材料[2-3]、新能源材料[4-5]等方面。然而,上述高通量計算方法在運行時間、計算能力等方面還存在諸多限制。
隨著以人工智能、大數據等為主導的“第四次工業(yè)革命”時代的到來,人工智能的新分支——機器學習已被廣泛應用于機器人技術[6]、計算機視覺[7-8]、數據挖掘[9]、生物醫(yī)學[10-11]等眾多領域。機器學習因其高效的計算和預測能力,逐漸被用于材料科學研究領域?;诔浞值膶嶒炑芯亢屠碚撚嬎悖藗兛梢岳脵C器學習方法,快速完成數據挖掘,學習有用信息,揭示其中所蘊含的信息和規(guī)律,準確預測材料性能、篩選目標材料。機器學習方法幫助研究者在更小范圍內進行理論計算和實驗驗證,縮短了材料研發(fā)周期。近年來,利用機器學習方法進行材料性質預測和新材料設計的文章數量呈現激增趨勢,見圖1。
機器學習概念最早在1959 年由Samuel 提出[12],現已發(fā)展成為一個涉及計算機科學、統計學等多領域交叉學科。它的基本原理是:機器學習模型不斷學習、積累以往的經驗或數據,自動優(yōu)化性能,提高處理未知問題的能力,使之在全新的情境下做出決策和判斷。機器學習的完整過程可分為數據輸入、機器學習訓練以及結果輸出等3 部分,見圖2。首先根據研究的具體問題收集相關數據,對原始數據進行預處理,再根據目標選擇合適的模型以及評估方法,利用訓練數據不斷優(yōu)化模型,最終以最優(yōu)化模型輸出預測結果。
算法是機器學習的關鍵。按照學習方式主要分為監(jiān)督學習、半監(jiān)督學習以及無監(jiān)督學習,其中以監(jiān)督學習的應用最為廣泛。在監(jiān)督學習中,利用一組帶有已知標簽的樣本,通過調整機器學習模型參數,對訓練數據進行學習,并做出準確預測。常用的機器學習算法包括支持向量機、決策樹、K-近鄰、人工神經網絡以及深度學習等。下面簡單介紹常用算法。
(1)支持向量機[13]:作為一種二分類模型,支持向量機的基本原理是,求解出能夠正確劃分訓練數據集并且使幾何間隔最大的分離超平面。當訓練數據集線性可分或近似線性可分時,支持向量機通過學習,生成線性分類器來劃分訓練數據集。對于輸入空間中的非線性分類問題,可以通過核函數替換內積,將低維特征空間中的非線性分類問題映射到高維特征空間中,尋找具有最大間隔的超平面。
(2)決策樹[14]:決策樹是一種基于樹結構的機器學習算法,從一系列帶有特征和標簽的數據集中提取出決策規(guī)則,并以樹狀圖呈現。決策樹工作原理是按照某一個準則(信息熵或者基尼系數),從所有數據的根節(jié)點開始,根據某一屬性值分裂為葉子節(jié)點。選擇屬性和相應的決策邊界,使用其他屬性從兩個子節(jié)點繼續(xù)分離,直到一個節(jié)點中的所有實例都屬于同一類。決策樹算法的核心思想是通過遞推方法,選擇最優(yōu)特征來分類或回歸。
(3)K-近鄰[15]:K-近鄰的核心思想是計算空間中樣本與每個訓練數據之間的距離,取距離最近的K 個訓練數據。其大多數類別決定樣本的所屬類別。K-近鄰算法精度高,但計算復雜度高。
(4)人工神經網絡[16]:人工神經網絡算法模仿人腦神經元的工作方式,建立某些簡單的模型,按不同的連接方式組成的復雜信息處理系統,實現類似于人腦的判斷和決策。人工神經網絡由輸入層、隱藏層、輸出層3部分組成。其中,輸入層接受來自外部的數據,作為中間部分的隱藏層起到了調整神經元權重以及單元間連接強度的作用,并且將處理后的結果輸出到輸出層。輸出層經過激活函數激活后,輸出最終結果。
(5)深度學習[17]:深度學習的結構類似于人工神經網絡,含有多個隱藏層,結構更加復雜。該算法學習能力強,但計算量更大、對設備要求更高。常見的深度學習算法包括卷積神經網絡、循環(huán)神經網絡以及生成對抗網絡等。
近年來,機器學習方法因其泛化能力強、計算速度快等優(yōu)勢,在預測材料性質方面嶄露頭角。機器學習方法已被成功應用于預測包括帶隙、發(fā)射/激發(fā)波長、玻璃形成能力、抗剪強度、發(fā)光熱猝滅溫度、功函數等在內的材料各類性質[18-22]。下文主要介紹機器學習在預測帶隙、熒光粉發(fā)射/激發(fā)波長、玻璃形成能力以及抗剪強度等性質方面的應用。
2.1.1 帶隙
帶隙是半導體或絕緣體的導帶底與價帶頂之間的能量差。帶隙大小決定著材料的能帶結構,影響其電子結構和光學性質。近年來,一些國內外研究者利用機器學習方法成功預測了各類材料的帶隙。游洋等[23]基于密度泛函理論計算的數據,選取電負性、第一電離能以及形成熱等物理性質作為特征描述符,分別建立套索回歸、支持向量回歸、梯度樹提升回歸等3 種機器學習模型訓練數據,成功預測了16 種二維MX2 型材料的帶隙。此外,機器學習方法也被應用于預測類金剛石結構熱電材料的帶隙。徐永林等[24]采用組分替換策略和查重技術產生新材料體系數據集,提出一種高效集成學習模型來帶隙預測(第1 層為套索回歸+支持向量回歸+梯度提升決策樹,第2 層為梯度提升決策樹),并利用第一性原理高通量計算進行驗證。無機化合物中,金屬帶隙值等于零,而非金屬帶隙值大于零。針對任意化學組成的無機化合物,其帶隙值的大小情況需要分開考慮。Brgoch 等[25]采用機器學習分類方法篩選出帶隙值大于零的非金屬化合物,利用支持向量回歸模型預測出了780 個非金屬化合物的帶隙,并將其與實驗數值進行比較。隨后,他們利用已訓練模型,預測了11 194個非金屬化合物的帶隙。綜上所述,利用化學組分以及電子結構等信息可以預測帶隙。需要指出的是,研究用于帶隙預測的特征描述符更具挑戰(zhàn)性和實際性。Chaube 等[26]不僅通過機器學習回歸方法預測了46 970 個未知無機鹵化物鈣鈦礦的帶隙,而且基于隨機森林模型對特征重要性進行排序。結果表明,外層電子數、汽化熱、Allen 電負性、熔點以及沸點等特征在帶隙預測過程中發(fā)揮著重要作用。
2.1.2 熒光粉發(fā)射/激發(fā)波長
熒光粉材料因其在固態(tài)照明和顯示方面的廣泛應用,引起了材料科學家的研究興趣。特別是,Eu2+摻雜熒光粉具有發(fā)射光譜窄、穩(wěn)定性高以及量子產率高等特點。眾所周知,熒光粉的發(fā)射波長決定著顯示器件顏色的品質。機器學習方法是一種研究Eu2+摻雜熒光粉發(fā)射波長的全新手段,有助于新型熒光粉的優(yōu)化和設計。Nakano 等[27]從文獻中收集了288 個Eu2+摻雜熒光粉(包括鹵化物、氧化物以及氮化物等)的發(fā)射波長。根據熒光粉基質的化學計量信息,他們開發(fā)了基于機器學習方法的發(fā)射峰值波長預測模型,該模型的預測誤差在139 meV 之內。基于此,他們還結合當前發(fā)射光譜調諧機制,對該模型進行了理論驗證。不同于依靠經驗直覺、愛迪生式的傳統實驗方法,利用數據驅動預測發(fā)射波長的機器學習具有快速、準確等特點。Lai 等[28]根據已報道的A3BSi2O7:Eu2+系列熒光粉的實驗發(fā)射波長,利用回歸模型成功預測了R1-xKxLSO:0.01Eu2+(0 ≤x ≤1)系列熒光粉的發(fā)射波長,并建立起熒光粉晶體結構與發(fā)光性質之間的聯系。與此同時,機器學習方法也可預測無機熒光粉的激發(fā)波長。例如,Barai 等[29]利用原子性質相關的特征描述符表征激發(fā)波長,建立激發(fā)波長與特征描述符之間的映射關系,通過套索回歸以及人工神經網絡等機器學習方法預測激發(fā)波長,并與實驗數據進行了比較。
2.1.3 玻璃形成能力
大多液體材料在特定情況下都可形成玻璃,但是不同材料形成玻璃的能力有所差異。量化玻璃形成能力對于玻璃材料工業(yè)生產和科學研究都具有重要意義。近年來,機器學習方法預測玻璃形成能力是玻璃物理學中一個新的研究方向。其中,人們主要關注非晶態(tài)合金的玻璃形成能力。
臨界冷卻速率是衡量玻璃形成能力的最可靠依據,但憑借傳統實驗手段往往難以測得,實驗人員常使用臨界鑄造直徑(Dmax)來表征塊體金屬玻璃的玻璃形成能力。例如Liu 等[30]搭建隨機森林、K-近鄰、梯度提升決策樹以及極端梯度提升等四種機器學習方法,分別預測出Dmax,并將其與測量值進行比較。結果表明,極端梯度提升模型的預測性能最好。預測具備良好玻璃形成能力的合金材料,具有重要的實際應用意義。例如,Xiong 等[31]首先根據7種不同機器學習分類方法篩選出Dmax 大于或等于5 mm 的化合物,利用回歸方法預測其Dmax。結果表明,極端梯度提升模型預測結果最佳,其交叉驗證的決定系數高達0.801。值得注意的是,循序向后逆向選擇的特征選擇方法被包裝在算法中,實現特征選擇與機器算法的最佳組合。Su 等[32]采用隨機森林算法預測二元金屬合金的玻璃形成能力,首次提出機器學習模型性能的二元合金標準化評價指標。上述研究結果表明,機器學習是一種強大的材料性質預測手段,可用于篩選具有良好金屬玻璃形成能力的合金材料。
2.1.4 抗剪強度
抗剪強度是指材料發(fā)生剪斷時的極限強度,是描述材料抵抗剪切滑動能力的重要指標。利用機器學習方法預測材料的抗剪強度,將極大降低試驗成本、縮短研究周期,這對工程應用和生產生活具有重要意義[33]。近年來,不少研究者開展了此類研究。例如,Wei 等[34]通過搭建人工神經網絡模型,提出一種基于神經網絡的點蝕梯形波形鋼腹板抗剪強度預測系統。通過適當訓練和校正,建立影響變量與抗剪強度之間的非線性映射關系,進而實現不同點蝕參數下的剪切強度的可靠預測。材料的抗剪強度預測一般以鋼筋混泥土為研究對象。例如Mohammed 等[35]基于文獻報道的有關梁的幾何和混凝土性能參數的實驗數據,利用支持向量機算法,預測鋼筋混凝土梁的抗剪強度。在實際生產生活中,抗剪強度還可能與材料的使用時間有關?;诖耍現u 等[36]開展了相關研究。他們采用梯度提升回歸樹模型預測任意使用時間下銹蝕鋼筋混凝土的抗剪強度,該模型平均決定系數大于0.9,具有良好的預測能力。
機器學習不僅在材料性質預測上應用廣泛,在新材料合成設計方面也同樣發(fā)揮著重要作用,影響并推動著材料科學的發(fā)展。下文將簡單介紹機器學習方法在稀土熒光材料、鈣鈦礦材料以及催化材料等領域的應用情況。
2.2.1 稀土熒光材料
稀土熒光材料因其色彩品質高、光吸收能力強、轉換效率高、物理化學性質穩(wěn)定等優(yōu)點,在激光、照明、顯示、輻射探測等眾多領域獲得應用。基于數據驅動的機器學習方法在發(fā)現稀土發(fā)光新材料方面取得多項重要研究結果。例如,Zhuo 等[37]為了尋找高效熒光粉基質材料,利用支持向量回歸方法對熒光粉基質材料的德拜溫度進行預測。同時,利用高通量密度泛函理論計算方法獲得帶隙?;陬A測的帶隙和德拜溫度,自動識別出帶隙最大、德拜溫度最高的熒光粉基質材料是NaBaB9O15。通過合成制備與表征分析,他們發(fā)現晶體結構剛性大小取決于[B3O7]5-陰離子骨架。向其中摻入Eu2+離子,獲得了416 nm 的藍紫光窄帶發(fā)射(半峰寬為34.5 nm),量子產率高達95%?;诓牧匣瘜W組分、電子結構以及光譜信息,機器學習還可以預測材料的熱穩(wěn)定性、量子效率以及發(fā)射帶寬等性質。例如,Wang 等[38]比較9 種常見Eu2+摻雜窄帶紅光氮化物熒光粉的電子結構發(fā)現,Eu2+離子兩個最高4 f能級之間分裂較大。利用該特征描述符對2 259 種氮化物篩選,成功識別出5種基質。向其中摻入Eu2+離子之后,熒光粉具有化學性質穩(wěn)定、熱穩(wěn)定性良好、量子效率高、發(fā)射帶寬窄等特點??傊?,采用機器學習或者其他人工智能方法首先識別出高性能稀土發(fā)光材料,然后結合第一性原理模擬計算方法進行驗證,最后通過實驗制備合成,這一套研究方法有望用于高性能稀土發(fā)光材料的合成設計。
2.2.2 鈣鈦礦材料
高性能鈣鈦礦的開發(fā)和應用一直都是材料科學領域的研究熱點之一。與傳統實驗手段和第一性原理計算方法相比,基于充分的實驗和理論研究,機器學習在尋找高性能鈣鈦礦材料方面發(fā)揮著重要作用[39-40]。例如,Liu 等[41]基于實驗數據,選用容忍因子、八面體因子、電負性等9個主要特征描述符作為機器學習輸入變量,利用機器學習分類方法對每條輸入數據建模訓練,分類準確度達到94.6%,接著采用梯度提升決策樹算法從891 條數據中篩選331 種鈣鈦礦,根據可成形性概率和凸包能篩選出較為穩(wěn)定的鈣鈦礦材料。Balachandra 等[42]搭建兩個獨立機器學習模型,分別用于篩選鈣鈦礦和其中具有新型立方結構的鈣鈦礦。他們利用兩個分層的機器學習模型成功篩選出了20 個具有新立方型結構的鈣鈦礦。值得注意的是,近年來,有機-無機雜化鈣鈦礦(HOIPs)引起了材料科學工作者的廣泛關注。Lu 等[43]結合機器學習和高通量計算方法成功預測出HOIPs。根據皮爾遜關系圖中14 個最佳材料特征,快速篩選出3 個(C2H5OInBr3、C2H5OSnBr3以及C2H6NSnBr3)帶隙合適、室溫熱穩(wěn)定性良好的無鉛HOIPs,解決HOIPs 的毒性和環(huán)境穩(wěn)定性差等問題。另外,Wang 團隊[44]篩選出了686 個帶隙合適的HOIPs,同時還結合密度泛函理論計算,驗證了132 個穩(wěn)定無毒的斜菱形HOIPs,為后續(xù)實驗合成提供了有益信息。
2.2.3 催化材料
催化材料在工業(yè)生產中占據重要地位。傳統實驗研究手段不僅效率較低,而且設備復雜,成本代價高,很難滿足不斷發(fā)展的工業(yè)需求。然而,利用機器學習方法,可以快速挖掘催化材料的結構與活性之間的關系,發(fā)現新型催化材料[45]。Huang 等[46]利用人工神經網絡方法模擬催化劑組分和催化性能之間關系,提出一種混合遺傳算法進行全局優(yōu)化,獲得最優(yōu)的多組分催化劑。這種設計方法已經應用于甲烷氧化偶聯反應,最優(yōu)催化劑的C2 烴產率達到27.78%,實現了當時最高產率。Madaan 等[47]研究丁烷氧化脫氫制1,3-丁二烯反應,利用數據驅動方法建立特征描述符,預測1 711 種混合金屬氧化物催化劑的性能,并從中篩選出6 種具有應用前景的雙金屬混合氧化物,通過實驗合成驗證該模型的準確性。以上工作表明,相比于繁瑣耗時的實驗和量子化學計算方法,機器學習方法在發(fā)現高性能多相催化材料[48]方面展示出極大優(yōu)勢,提高了產率。值得注意的是,機器學習方法不僅適用于多相催化材料,在均相催化劑方面也占據重要作用。例如,Janet 等[49]開發(fā)了預測自旋態(tài)有序性等過渡金屬復合物的電子性質的機器學習模型。模型研究了不同的機器學習模型,包括人工神經網絡、支持向量回歸和核嶺回歸3 種方法。結果表明,人工神經網絡模型的預測性能最佳,該模型將為有效篩選過渡金屬復合物催化材料提供有力保證。
機器學習在材料科學中的應用是計算機科學和材料科學的深度融合。它在研究復雜數據之間的關聯性方面具有較高的靈活性、泛化性以及準確性。目前,已被廣泛應用于發(fā)光材料、催化材料等各類功能材料研究領域。需要指出的是,機器學習方法仍然存在一定的局限性。首先,它是一種基于數據驅動的方法,對數據的依賴程度較高。而在材料科學研究領域,大量數據的獲取成本較高且分布不均。利用少量數據訓練模型則會導致過擬合問題,這將直接影響模型預測效果。另外,雖然機器學習已被應用于材料性質預測以及新材料發(fā)現,但是所預測的結果仍需實驗驗證,所蘊含的物理化學規(guī)律仍需深入研究。雖然,機器學習方法無法替代傳統的計算和實驗研究,但是隨著理論和方法的進一步完善,機器學習方法將會在材料科學領域獲得更加廣泛和深入的應用,為材料科學研究提供新思路、新方法。