Zi-Kui Liu
Department of Materials Science and Engineering, Pennsylvania State University, University Park, PA 16802, USA
在最近的一篇文章[1]中,針對不斷增長的計算能力和大量的在線數(shù)據(jù)存儲庫,筆者對“數(shù)據(jù)?!边@一概念進行了深入探討。這些新的發(fā)展需要一種全新的計算框架范式,用以連接各種數(shù)據(jù)存儲庫、整合機器學(xué)習(xí)、循環(huán)使用現(xiàn)有數(shù)據(jù),以及為新的計算和實驗工作提供參考,從而創(chuàng)建一種由數(shù)據(jù)和工具所組成的“可持續(xù)生態(tài)系統(tǒng)”(sustainable ecosystem)。筆者希望最近公開的一些開源代碼能夠促進各個數(shù)據(jù)存儲庫與“數(shù)據(jù)海”之間的低障礙交換路徑的開發(fā),同時,我們期待與“數(shù)據(jù)?!钡臄?shù)據(jù)交換能夠提高每個獨立的數(shù)據(jù)存儲庫中的數(shù)據(jù)的用途和價值,如圖1 [1]所示。
熱力學(xué)是一門研究系統(tǒng)與環(huán)境相互作用時的狀態(tài)(包括穩(wěn)定、亞穩(wěn)定以及不穩(wěn)定狀態(tài))的科學(xué)。Gibbs[2,3]提出的熱力學(xué)第一定律和第二定律的結(jié)合,將系統(tǒng)的外部和內(nèi)部緊密聯(lián)系起來。盡管Gibbs關(guān)注的是非均相物質(zhì)的平衡[2,4],但是熱力學(xué)第一定律和第二定律的結(jié)合亦將系統(tǒng)的平衡態(tài)和非平衡態(tài)包含在其中[5,6]。
基于相圖計算(CALPHAD)方法[6–9]的熱力學(xué)建模可以在系統(tǒng)外部和內(nèi)部變量的整個空間中建立各個相的吉布斯能量,并且涵蓋了每個相的穩(wěn)定區(qū)、亞穩(wěn)定區(qū)和不穩(wěn)定區(qū)。事實上,對于純元素的穩(wěn)定結(jié)構(gòu)與非穩(wěn)定結(jié)構(gòu)之間的能量差的定義是CALPHAD建模的基礎(chǔ),Kaufman將其稱為“晶格穩(wěn)定性”(lattice stability),Kaufman是開創(chuàng)CALPHAD方法的先驅(qū),亦是該方法的命名者[10,11]?!熬Ц穹€(wěn)定性”概念的提出以及人們對一組“晶格穩(wěn)定性”值的普遍接受使得多組分數(shù)據(jù)庫得以發(fā)展并涵蓋20多個元素,這些數(shù)據(jù)庫已經(jīng)成為集成計算材料工程(ICME)[12]和材料基因組計劃(MGI)[13]的基礎(chǔ)。
在2000年之前,CALPHAD建模幾乎完全依賴于實驗信息和一些相對簡單的理論預(yù)測,其與基于密度泛函理論(DFT)的第一性原理得出的計算結(jié)果的集成相當有限[14]。計算方法和軟件工具的不斷發(fā)展,特別是維也納ab-initio模擬軟件包(VASP)[16–18]的出現(xiàn),促進了CALPHAD建模中廣泛應(yīng)用DFT的第一性原理計算的結(jié)果,以及多學(xué)科信息技術(shù)研究(ITR)項目,即“多組分材料設(shè)計的計算工具”(Computational Tools for Multicomponent Materials Design)在2002年的啟動,該項目得到了美國國家科學(xué)基金會(NSF)的支持。這項信息技術(shù)研究項目通過相場模擬及有限元法[19]將DFT和CALPHAD方法相結(jié)合,這一靈感來源于人類基因組計劃[20]以及NSF支持的名為“計算熱力學(xué)、計算動力學(xué)和材料設(shè)計的綜合教育計劃”(An Integrated Education Program on Computational Thermodynamics, Kinetics, and Materials Design)項目[21],后者啟發(fā)筆者在2002年創(chuàng)造了“材料基因”(materials genome)這一術(shù)語和概念[22,23]。
圖1 .參考文獻[1]所描繪的ESPEI數(shù)據(jù)的“可持續(xù)生態(tài)系統(tǒng)”示意圖,圖中顯示了各種數(shù)據(jù)存儲庫(湖泊)、互聯(lián)(河流)、私有數(shù)據(jù)(滲流)、數(shù)據(jù)處理(蒸發(fā))、數(shù)據(jù)收集(海洋)、數(shù)據(jù)循環(huán)使用(冷凝與降水)。ESPEI:可擴展的、自我優(yōu)化的相平衡基礎(chǔ)設(shè)施。
2009年,筆者回顧了熱力學(xué)的第一性原理計算和CALPHAD建模的新發(fā)展[24]。筆者的團隊創(chuàng)立了可擴展的、自我優(yōu)化的相平衡基礎(chǔ)設(shè)施(ESPEI)概念[25–27],該框架使用來自第一性原理計算的各個相的熱化學(xué)數(shù)據(jù)進行CALPHAD建模,并使用實驗相平衡數(shù)據(jù)完善模型參數(shù)。ESPEI概念的重要性體現(xiàn)在3個方面:①第一性原理計算提供的能量值是內(nèi)部自由度的函數(shù),即每個單獨相的內(nèi)部非平衡構(gòu)型,該構(gòu)型難以從實驗中直接獲得,因為實驗數(shù)據(jù)往往來自多種構(gòu)型的混合物[28–32];② ESPEI建立了一種機制,該機制可以有效地評估模型參數(shù)、數(shù)據(jù)的不確定性以及計算性能中的不確定性傳播[27,33];③ ESPEI數(shù)據(jù)基礎(chǔ)結(jié)構(gòu)集成了基于CALPHAD建模中的原始數(shù)據(jù)和處理后的數(shù)據(jù),從而可以有效地循環(huán)使用原始數(shù)據(jù),并有效地更新和維護處理后的數(shù)據(jù)和數(shù)據(jù)庫。在美國,隨著越來越多的關(guān)于第一性原理計算的出版物面市,加之高性能計算工具逐漸普及以及諸如材料項目[34]、開放量子材料數(shù)據(jù)庫[35]和材料發(fā)現(xiàn)自動流程[36]等大型在線數(shù)據(jù)庫的發(fā)展,筆者相信基于DFT的第一性原理計算中的熱化學(xué)數(shù)據(jù),將在各種材料的CALPHAD建模中發(fā)揮越來越關(guān)鍵的作用,特別是在新材料的發(fā)現(xiàn)與設(shè)計中。
Olson系統(tǒng)地開發(fā)了基于CALPHAD數(shù)據(jù)庫、熱力學(xué)計算和動力學(xué)模擬的系統(tǒng)材料設(shè)計,以開發(fā)新材料并改進現(xiàn)有材料[37,38]。這種系統(tǒng)材料設(shè)計方法將加工過程中的可控參數(shù)與使用微觀結(jié)構(gòu)屬性的可測量的數(shù)量屬性聯(lián)系起來。在眾多微觀結(jié)構(gòu)屬性中,最關(guān)鍵的基礎(chǔ)變量是形成的相,這與CALPHAD方法中的單相建模概念完全一致。CALPHAD方法也已經(jīng)運用了一系列其他屬性。表1例舉了本研究小組計算的一些性能[28–32,39–69]。此外還應(yīng)特別注意的是,能量對其自然變量的二階導(dǎo)數(shù)代表了許多物理量,如圖2、圖3 [6,13,70]所示,其中,一些正在開發(fā)的臨時術(shù)語條目被劃歸至圖2中最后一列和最后一行,包括圖3中的壓縮熱。
材料設(shè)計是材料生命周期的第一步。設(shè)計完成后,材料被制造出來并投入使用,制造與使用過程會產(chǎn)生新的原始數(shù)據(jù),從而豐富現(xiàn)有的原始數(shù)據(jù)和處理后的數(shù)據(jù),或?qū)⒍哌M行對比。此外,材料回收對于環(huán)境和材料成本變得越來越重要。由于材料的回收通常會涉及多種材料的混合,因此與單獨設(shè)計每一種材料所用的原始數(shù)據(jù)以及處理后的數(shù)據(jù)相比,回收材料的化學(xué)成分可能會更復(fù)雜。這些新的原始數(shù)據(jù)可能需要額外的第一性原理計算,已有的模型亦需要進一步修訂和擴展[71]。如圖4 [25–27,72–74]所示,這個連接對于可持續(xù)數(shù)據(jù)生態(tài)系統(tǒng)而言至關(guān)重要,但這并不是一件容易的事情,因為目前的熱力學(xué)數(shù)據(jù)庫可包含20多個元素,而這些非常多的外部和內(nèi)部變量的多維空間中的原始數(shù)據(jù)是有限的[75–77]。我們希望在開發(fā)開元軟件包方面所做出的努力,如DFTTK [78]、pycalphad [72,73]、ESPEI[25–27,74]和最近的SIPFENN深層神經(jīng)網(wǎng)絡(luò)機器學(xué)習(xí)?? Krajewski, A. M. & Liu, Z. K. SIPFENN: Structure-Informed Prediction of Formation Energy using Neural Networks. 2020. Available from: https://phaseslab.com/sipfenn.等能夠激勵業(yè)界進行新工具的開發(fā),以進一步推動科學(xué)與計算驅(qū)動的材料研究范式的發(fā)展[79]。
表1 計算和建模屬性的實例
圖2. 與內(nèi)部能量關(guān)于其自然變量的二階導(dǎo)數(shù)相關(guān)的物理量[6,13]。
圖3. 與吉布斯能量關(guān)于其自然變量的二階導(dǎo)數(shù)相關(guān)的物理量[70]。
其他挑戰(zhàn)主要在于材料在長度和時間尺度上的多層次復(fù)雜性,以及與信息如何在尺度之間傳遞以產(chǎn)生微觀和宏觀行為有關(guān)[19]。我們最近的研究證明,下列熵等式有希望通過熵實現(xiàn)材料性質(zhì)和信息的多尺度集成[80]。
圖4. 數(shù)據(jù)生態(tài)系統(tǒng)示意圖,包括原始數(shù)據(jù)(實驗、第一性原理計算和機器學(xué)習(xí))、處理后的數(shù)據(jù)(建?!褂胮ycalphad [72,73]和ESPEI[25–27,74]的CALPHAD)、材料制造、材料服役和材料回收。
等式(1)表示系統(tǒng)的總熵S,可根據(jù)k尺度的系統(tǒng)構(gòu)型計算得出。其中pk表示系統(tǒng)構(gòu)型k∈{1, ...,m}的概率,且pk=1,Sk表示尺度k中每個構(gòu)型的熵,而kB表示玻爾茲曼常量。需要注意的是,系統(tǒng)的熵包含了所考量尺度上的熵加上每個單獨構(gòu)型的熵,每個單獨構(gòu)型的概率與所有構(gòu)型的自由能有關(guān)。每個單獨的構(gòu)型都由其另外的一組內(nèi)部的構(gòu)型組成,因此Sk可以用其自身的構(gòu)型以與等式(1)相同的形式表達。這種拆分可以持續(xù)進行,直到所有的重要尺度都被納入考量范圍,并且這種多尺度的集成不止限于一個方向,可以是雙向的[80]。材料科學(xué)與工程領(lǐng)域的研究重點是相的形成,原子構(gòu)型代表了占主導(dǎo)地位的尺度,而電子和聲子的密度則代表其子尺度[39],同時外界宏觀的制約可以改變材料內(nèi)部相的形成和形貌。
在等式(2)中,dS表示系統(tǒng)的熵變化;dQ表示系統(tǒng)從周圍環(huán)境接收(> 0)或釋放(< 0)的熱量;Sj表示組分j在環(huán)境或系統(tǒng)中的偏摩爾熵;dNj表示系統(tǒng)接收(dNj> 0)或釋放(dNj< 0)到周圍環(huán)境中的組分j的量;T表示溫度;dIPS是由于獨立的內(nèi)部過程(IP)產(chǎn)生的熵。等式右邊的第一項通常代表熵的概念如何被引入材料熱力學(xué),相對而言第二項則很少被討論,其常被隱沒在將化學(xué)勢直接引入熱力學(xué)第一定律和第二定律的過程中。第三項的細節(jié),即熵的產(chǎn)生,通常被認為是動力學(xué)或者不可逆熱力學(xué)的部分。由于我們的研究往往只考慮平衡態(tài),因此第三項的內(nèi)容在熱力學(xué)中通常沒有涉及。值得注意的是,熱力學(xué)第一定律和第二定律中的熵包含了等式(2)中的三個項,盡管通常對此不作特別說明[80]。
等式(3)表明,通過將內(nèi)部過程定義為IP系統(tǒng),由內(nèi)部過程產(chǎn)生的熵也可以用類似于等式(2)的形式表示[80]。該IP系統(tǒng)可能會消耗一些偏熵為Sjn的養(yǎng)分(dNjn)以及產(chǎn)生部分偏熵為Slw的廢物(dNlw)和熱量(dIPQ),并重組其構(gòu)型以產(chǎn)生一定的信息量(dIPI)。然后通過等式(1)可得到如下等式:
式中,下標f和i代表IP系統(tǒng)最終和初始的構(gòu)型。對于自發(fā)或不可逆的內(nèi)部過程,根據(jù)熱力學(xué)第二定律,由式(3)表示的熵產(chǎn)生必須為正。然而,dIPI的符號可以是正(信息生成過程),亦可以是負(信息擦除過程)。參考文獻[80]對各種設(shè)想的實驗展開探討。應(yīng)該注意的是,等式(2)與等式(3)中的符號約定是相反的,等式(2)中的正號表示系統(tǒng)從環(huán)境中接收熱量與質(zhì)量,而等式(3)中的正號則表示IP系統(tǒng)隨著熵的增加而釋放熱量與質(zhì)量。
事實證明,基于單個相的屬性的CALPHAD建模是計算材料科學(xué)和工程的基礎(chǔ)。為了進一步提高基于CALPHAD方法的預(yù)測能力,筆者建議在相應(yīng)尺度上將構(gòu)型納入考量范疇,如等式(1)所示,所以在預(yù)測過程中,不同尺度的屬性可作為外部條件的一個函數(shù),這樣單個構(gòu)型之間的競爭就有可能導(dǎo)致系統(tǒng)產(chǎn)生單個構(gòu)型所不具備的突現(xiàn)行為。當溫度對熵的導(dǎo)數(shù)從穩(wěn)定的正值逐漸接近零時,系統(tǒng)穩(wěn)定性極限的極端突現(xiàn)行為可被觀察到[6]。由于溫度和熵是熱力學(xué)組合定律中的共軛變量,即熵變發(fā)散,所以熵對溫度的導(dǎo)數(shù)變?yōu)檎裏o窮大,這是由等式(1)所示的穩(wěn)定和亞穩(wěn)定構(gòu)型之間的競爭所引起的。應(yīng)該指出的是,當系統(tǒng)的熵發(fā)散的時候,單個構(gòu)型的熵并不發(fā)散,這適合于系統(tǒng)所有的摩爾量。也就是說,系統(tǒng)的每一個摩爾量都會在穩(wěn)定性達到極限時發(fā)散,而單個構(gòu)型的摩爾量并不發(fā)散。此外,當用體積對溫度的導(dǎo)數(shù)表示熱膨脹時,系統(tǒng)的熵可能呈現(xiàn)負發(fā)散狀態(tài),因為體積和溫度不是熱力學(xué)組合定律中的共軛變量[6]。就熱膨脹而言,我們已經(jīng)證明了鈰的發(fā)散為正,而Fe3Pt的發(fā)散為負[28–30]。同時,由于麥克斯韋關(guān)系[6],體積對溫度的導(dǎo)數(shù)等于熵對壓力(我們稱之為“壓縮熱”)的導(dǎo)數(shù)的負值,因此,圖2與圖3中的量是對稱的。