王 卓 朱 虹 許 斌 顏達(dá)鵬 杜 華 羅 亮 崔予文,4
(1.中南大學(xué)輕合金研究院,湖南 長(zhǎng)沙 410083;2.成都材智科技有限公司,四川 成都 610041;3.中國(guó)核動(dòng)力研究設(shè)計(jì)院核反應(yīng)堆系統(tǒng)設(shè)計(jì)技術(shù)重點(diǎn)實(shí)驗(yàn)室,四川 成都 610213;4.南京工業(yè)大學(xué),江蘇 南京 210009)
自1954年第一座核電站在蘇聯(lián)建成至今已過去60多年,核能作為高效、清潔、安全的能源備受國(guó)際社會(huì)的關(guān)注,核電技術(shù)也隨之不斷發(fā)展、完善,更新到了第四代,展現(xiàn)出廣闊的應(yīng)用前景。隨著我國(guó)經(jīng)濟(jì)水平和綜合國(guó)力的不斷提升,對(duì)能源的需求也呈現(xiàn)遞增態(tài)勢(shì),導(dǎo)致能源短缺問題日漸突出[1-3]。因此,核能作為目前唯一能達(dá)到大規(guī)模商用的替代能源,其發(fā)展可有效提高國(guó)家能源安全保障能力。我國(guó)核電工業(yè)發(fā)展大致經(jīng)歷了起步、適度發(fā)展和快速發(fā)展等3個(gè)階段,逐步形成了完整的研發(fā)設(shè)計(jì)、工程建造、運(yùn)行維護(hù)、燃料保障、設(shè)備配置、生產(chǎn)制造等全產(chǎn)業(yè)鏈體系,同時(shí)安全高效地發(fā)展核能成為我國(guó)能源電力發(fā)展戰(zhàn)略的重要組成部分[4-7]。
核電結(jié)構(gòu)材料的設(shè)計(jì)研發(fā)作為核電技術(shù)發(fā)展的關(guān)鍵,同樣也是核電站使用壽命和安全運(yùn)行的重要影響因素。福島核事故之后,國(guó)際對(duì)核電技術(shù)發(fā)展的安全性提出了更高要求,亟待尋找各項(xiàng)性能更具競(jìng)爭(zhēng)力的新核電結(jié)構(gòu)材料來進(jìn)一步優(yōu)化核電效能,提高其壽命周期[8-10]。目前,我國(guó)在建和使用的核電結(jié)構(gòu)材料主要包括鎳基合金、奧氏體不銹鋼、低合金鋼和碳鋼等,其測(cè)試及服役常在高溫、高壓、強(qiáng)輻射等苛刻條件下進(jìn)行,性能數(shù)據(jù)獲取十分不易。然而,傳統(tǒng)材料開發(fā)方式步驟繁瑣,研發(fā)到應(yīng)用周期冗長(zhǎng)且達(dá)不到預(yù)期性能效果,僅靠人力更無法挖掘材料特征與性能之間的深層聯(lián)系[11-12]。因此,在材料理論研究的發(fā)展過程中,人們將試驗(yàn)與計(jì)算模擬產(chǎn)生的數(shù)據(jù)整合形成一定規(guī)模的數(shù)據(jù)庫(kù),在材料數(shù)據(jù)庫(kù)的基礎(chǔ)上,進(jìn)一步采用機(jī)器學(xué)習(xí)方法針對(duì)核電結(jié)構(gòu)材料的各項(xiàng)屬性建立代理模型(surrogate model),從而實(shí)現(xiàn)對(duì)材料性能的快速預(yù)測(cè),例如Wicker等[13]采用支持向量機(jī)器學(xué)習(xí)算法預(yù)測(cè)了分子材料的結(jié)晶度;Stanev等[14]通過機(jī)器學(xué)習(xí)模型得到了模擬超導(dǎo)體的臨界溫度;Voyles等[15]通過機(jī)器學(xué)習(xí)算法提高了材料顯微鏡數(shù)據(jù)的質(zhì)量,以進(jìn)一步深挖材料信息。以上示例說明機(jī)器學(xué)習(xí)已在多行業(yè)多領(lǐng)域有了重要應(yīng)用,因此通過機(jī)器學(xué)習(xí)構(gòu)建核電結(jié)構(gòu)材料數(shù)據(jù)庫(kù),不僅可以加快材料的設(shè)計(jì)進(jìn)程,縮短研發(fā)周期,還可為實(shí)現(xiàn)對(duì)材料目標(biāo)屬性或性能定制打開新的藍(lán)圖[16-17]。
本文對(duì)機(jī)器學(xué)習(xí)方法的主要思想和基本步驟進(jìn)行了概述,介紹了機(jī)器學(xué)習(xí)應(yīng)用平臺(tái)及其系統(tǒng)功能模塊和流程結(jié)構(gòu),展示了機(jī)器學(xué)習(xí)系統(tǒng)通過模型構(gòu)建和應(yīng)用包裝兩種途徑對(duì)核電結(jié)構(gòu)材料性能進(jìn)行預(yù)測(cè)的步驟,對(duì)進(jìn)一步研究機(jī)器學(xué)習(xí)方法在核電結(jié)構(gòu)材料性能預(yù)測(cè)乃至新材料的發(fā)現(xiàn)方面具有參考意義。
機(jī)器學(xué)習(xí)(machine learning)是由模式識(shí)別、人工智能計(jì)算學(xué)習(xí)理論為基礎(chǔ)所轉(zhuǎn)變的一類計(jì)算機(jī)科學(xué)分支,其目的是根據(jù)大數(shù)據(jù)和歷史情況來訓(xùn)練模型[18-19]。一方面機(jī)器學(xué)習(xí)能夠在不明確潛在物理機(jī)制或沒有物理模型的情況下,從可用數(shù)據(jù)中獲取性能和預(yù)測(cè)發(fā)展趨勢(shì);另一方面,已經(jīng)建立的機(jī)器學(xué)習(xí)模型可反過來用于材料的發(fā)現(xiàn)和性能設(shè)計(jì)。因此,作為人工智能核心之一的機(jī)器學(xué)習(xí)方法,現(xiàn)已在材料科學(xué)領(lǐng)域取得了一系列應(yīng)用成果,其中包括預(yù)測(cè)鋼疲勞強(qiáng)度、金屬催化活性、合金的物理機(jī)械性質(zhì)和光伏材料的鑒定等,成為材料發(fā)展的一種創(chuàng)新模式[20-23]。目前,可選擇不同的機(jī)器學(xué)習(xí)算法對(duì)大量材料數(shù)據(jù)集進(jìn)行性能參數(shù)的預(yù)測(cè),不同算法對(duì)不同材料數(shù)據(jù)集中數(shù)據(jù)的敏感度也不同,需要對(duì)樣本數(shù)據(jù)進(jìn)行有針對(duì)性的選擇,然后再通過相對(duì)應(yīng)的性能評(píng)估手段進(jìn)行比較和評(píng)估。機(jī)器學(xué)習(xí)的性能預(yù)測(cè)模型工作流程如圖1所示。在建立模型之前,將原始材料數(shù)據(jù)集按比例劃分為訓(xùn)練集和測(cè)試集(如80%為訓(xùn)練集,20%為測(cè)試集),通過訓(xùn)練集中的數(shù)據(jù)對(duì)算法模型進(jìn)行訓(xùn)練,再利用訓(xùn)練后的模型對(duì)測(cè)試集中的數(shù)據(jù)進(jìn)行預(yù)測(cè),最終得到模擬結(jié)果。
圖1 機(jī)器學(xué)習(xí)性能預(yù)測(cè)模型工作流程圖Fig.1 Workflow chart of machine learning prediction model
目前,在建立模型時(shí)可用到的算法主要有隨機(jī)森林、支持向量回歸和神經(jīng)網(wǎng)絡(luò)等。
隨機(jī)森林(random forest)回歸算法是由Breiman于2001年提出的,其基本思想源于統(tǒng)計(jì)學(xué)理論[24]。隨機(jī)森林是由決策樹組合成的算法,用隨機(jī)方式建立很多決策樹而組成森林,決策樹間并沒有關(guān)聯(lián),利用bootstrap[25](又稱為自助法,用于估計(jì)或修正統(tǒng)計(jì)估計(jì)值的偏差或方差信息)在訓(xùn)練集中隨機(jī)抽取N個(gè)樣本,假設(shè)每個(gè)樣本構(gòu)造決策樹,通過所有決策樹預(yù)測(cè)值的平均值計(jì)算得出最終預(yù)測(cè)值。
支持向量機(jī)(support vector machine)是運(yùn)用支持向量機(jī)來解決回歸問題的方法,其基本思想是建立在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上,通過一個(gè)非線性映射φ,將數(shù)據(jù)x映射到高維特征空間F,在這個(gè)空間進(jìn)行線性回歸,其優(yōu)勢(shì)是可以解決小樣本數(shù)據(jù)集、非線性及高維模式識(shí)別,可以推廣至函數(shù)擬合等其他機(jī)器學(xué)習(xí)問題中[26]。
神經(jīng)網(wǎng)絡(luò)(neural network)算法是一種模仿生物神經(jīng)網(wǎng)絡(luò)(動(dòng)物的中樞神經(jīng)系統(tǒng),特別是大腦)的結(jié)構(gòu)和功能的數(shù)學(xué)模型或計(jì)算模型,用于對(duì)函數(shù)進(jìn)行估計(jì)或近似。神經(jīng)網(wǎng)絡(luò)由大量的人工神經(jīng)元聯(lián)結(jié)進(jìn)行計(jì)算,由輸入層、隱藏層(即中間層)和輸出層3層結(jié)構(gòu)組成[18],其中輸入、輸出層的神經(jīng)元個(gè)數(shù)是根據(jù)具體問題來確定的,而中間層則通常由經(jīng)驗(yàn)確定,確定好結(jié)構(gòu)后可對(duì)其通過輸入輸出樣本集及逆行訓(xùn)練,網(wǎng)絡(luò)經(jīng)過訓(xùn)練后,輸入輸出的映射關(guān)系得以實(shí)現(xiàn),設(shè)輸入1個(gè)訓(xùn)練樣本Xn,輸出層的神經(jīng)元為:
式中:I為隱藏層神經(jīng)元個(gè)數(shù);N為訓(xùn)練樣本組數(shù);J為輸出層神經(jīng)元個(gè)數(shù);w為輸入層與輸出層間權(quán)值?;瘮?shù)為高斯函數(shù)時(shí),可表示為:
式中:σi為高斯函數(shù)方差;tim為基函數(shù)的中心;M為輸入層神經(jīng)元個(gè)數(shù)。
通常采用均方誤差MSE(mean squared error)、均方根誤差RMSE (root mean squared error)、平均絕對(duì)誤差MAE(mean absolute error)作為學(xué)習(xí)器的泛化性能評(píng)價(jià)指標(biāo),校正決定系數(shù)R2(adjusted R-square)則用以衡量預(yù)測(cè)值與實(shí)際值的吻合程度,計(jì)算公式為:
式中:m為樣本數(shù)量;yi為真實(shí)值;為預(yù)測(cè)值。前3個(gè)指標(biāo)根據(jù)不同的業(yè)務(wù)有不同的值,不具有可讀性,最后可根據(jù)R2的取值來判斷模型的優(yōu)劣,其取值范圍是[0,1],如果是0,說明擬合效果很差,如果是1,說明模型準(zhǔn)確預(yù)測(cè)。
核電結(jié)構(gòu)材料在核電站的建設(shè)應(yīng)用中扮演著重要角色,其中合金占絕大部分,而且合金材料具有化學(xué)元素的多樣性。理論上這類材料的數(shù)據(jù)達(dá)上萬種,因此可作為機(jī)器學(xué)習(xí)預(yù)測(cè)材料性能甚至到設(shè)計(jì)新材料的理想應(yīng)用體系。本文選擇通過構(gòu)建機(jī)器學(xué)習(xí)平臺(tái)實(shí)現(xiàn)模型訓(xùn)練和模型應(yīng)用的雙功能,模型方面主要針對(duì)專業(yè)用戶,以工作流的方式實(shí)現(xiàn)用戶自定義算法、評(píng)價(jià)方法及數(shù)據(jù)預(yù)處理過程,完成機(jī)器學(xué)習(xí)模型的構(gòu)建,可重復(fù)進(jìn)行模型訓(xùn)練;應(yīng)用部分則可支持將模型配置成操作簡(jiǎn)單的應(yīng)用供普通用戶直接使用,方便其完成機(jī)器學(xué)習(xí)預(yù)測(cè),并得到性能預(yù)測(cè)結(jié)果和可視化分析。圖2是材料數(shù)據(jù)機(jī)器學(xué)習(xí)系統(tǒng)的基礎(chǔ)建設(shè)框架層級(jí)圖,以B/S架構(gòu)來構(gòu)建整個(gè)系統(tǒng),從底層數(shù)據(jù)資源到應(yīng)用層面總共劃分為4個(gè)層級(jí),應(yīng)用層面可滿足不同業(yè)務(wù)場(chǎng)景需求。
圖2 機(jī)器學(xué)習(xí)系統(tǒng)整體架構(gòu)圖Fig.2 Overall architecture diagram of machine learning system
材料數(shù)據(jù)機(jī)器學(xué)習(xí)系統(tǒng)的功能概覽如圖3所示,系統(tǒng)由首頁(yè)、數(shù)據(jù)源、模型及配置和應(yīng)用部分構(gòu)成。首頁(yè)可以直觀地顯示收藏的應(yīng)用和新發(fā)布的應(yīng)用,可支持搜索應(yīng)用;數(shù)據(jù)源部分主要包含用于材料數(shù)據(jù)機(jī)器學(xué)習(xí)的數(shù)據(jù)來源,支持連接外部數(shù)據(jù)源作為訓(xùn)練數(shù)據(jù),可預(yù)覽其中每張表的數(shù)據(jù),同時(shí)也支持結(jié)合前處理方法及算法訓(xùn)練數(shù)據(jù)模型;在模型及配置部分通過模型構(gòu)建器進(jìn)行模型構(gòu)建,在系統(tǒng)中能夠?qū)δP瓦M(jìn)行管理,控制模型發(fā)布和權(quán)限處理;最后到應(yīng)用部分,將配置好的模型包裝成界面美觀、操作簡(jiǎn)單的應(yīng)用,可方便用戶閱覽并使用模型,對(duì)其產(chǎn)生的結(jié)果還可以進(jìn)行可視化分析?;诤辖鸩牧蠑?shù)據(jù)集,可通過機(jī)器學(xué)習(xí)平臺(tái)對(duì)其性能進(jìn)行預(yù)測(cè),系統(tǒng)流程及演示將在下文進(jìn)行詳細(xì)描述。
圖3 材料數(shù)據(jù)機(jī)器學(xué)習(xí)系統(tǒng)功能概覽Fig.3 Overview of the material data machine learning system functions
系統(tǒng)支持連接包括Excel、MySQL、iDataCenter在內(nèi)的多種數(shù)據(jù)庫(kù),用戶登錄系統(tǒng)后點(diǎn)擊數(shù)據(jù)源Tab頁(yè)可管理當(dāng)前賬號(hào)下所有的材料合金數(shù)據(jù)庫(kù)及數(shù)據(jù)表,點(diǎn)擊數(shù)據(jù)庫(kù)右側(cè)即可出現(xiàn)數(shù)據(jù)庫(kù)詳情,可查看該數(shù)據(jù)庫(kù)類型、賬號(hào)密碼、配置信息及當(dāng)前更新時(shí)間等。用戶可以點(diǎn)擊新建數(shù)據(jù)連接,填寫參數(shù)后進(jìn)行測(cè)試,最后完成數(shù)據(jù)連接新建,系統(tǒng)操作界面及演示示例如圖4所示。
圖4 合金材料數(shù)據(jù)機(jī)器學(xué)習(xí)平臺(tái)數(shù)據(jù)連接演示示例Fig.4 Demonstration example of alloy material data connection on material data machine learning platform
模型功能是針對(duì)專業(yè)用戶配置的功能模塊,用于訓(xùn)練模型,可查看當(dāng)前賬號(hào)下已有模型或直接進(jìn)行模型編輯。如圖5所示,專業(yè)用戶登錄系統(tǒng)后,可點(diǎn)擊模型Tab頁(yè)進(jìn)入我的模型列表,也可切換至模型倉(cāng)庫(kù),頂部按鈕為新建模型,可進(jìn)行模型新建;右側(cè)可進(jìn)行篩選;最右側(cè)可進(jìn)行模型搜索;下面每一條對(duì)應(yīng)一個(gè)模型,從左到右依次是創(chuàng)建人、創(chuàng)建時(shí)間、訓(xùn)練進(jìn)度條和操作按鈕(包括發(fā)布、追加數(shù)據(jù)、參數(shù)修改和刪除)。模型建好后可直接點(diǎn)擊發(fā)布到模型倉(cāng)庫(kù),也可追加數(shù)據(jù)對(duì)模型進(jìn)行迭代,追加數(shù)據(jù)時(shí)可選擇數(shù)據(jù)源的某一張表,系統(tǒng)會(huì)自動(dòng)根據(jù)名字匹配特征列與字段,用戶還可以進(jìn)行手動(dòng)調(diào)整,等待該模型狀態(tài)變?yōu)榇\(yùn)行,即可重新使用。用戶點(diǎn)擊新建模型后,系統(tǒng)進(jìn)入新建模型,操作界面將顯示出一個(gè)類似于工作流的界面,前3個(gè)步驟可進(jìn)行基本信息、數(shù)據(jù)源和特征目標(biāo)的選擇,之后可進(jìn)行數(shù)據(jù)預(yù)處理或算法選擇。特征列、目標(biāo)列選擇后右側(cè)自動(dòng)出現(xiàn)相關(guān)性分析圖表,分析方法默認(rèn)為最大信息系數(shù)(maximal information coefficient,MIC),其后有選取相關(guān)性靠前字段選項(xiàng),分為前5、前10、前15、前x,點(diǎn)擊某個(gè)按鈕左側(cè)特征會(huì)自動(dòng)取消選擇相關(guān)性不在該范圍內(nèi)的字段。數(shù)據(jù)預(yù)處理后進(jìn)行算法選擇,系統(tǒng)有線性回歸、BP(back propagation)神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林回歸、支持向量機(jī)回歸等算法可供選擇。
圖5 合金材料數(shù)據(jù)機(jī)器學(xué)習(xí)系統(tǒng)模型演示示例Fig.5 Demonstration example of alloy material data machine learning system model
如圖6所示,模型建立后進(jìn)入模型詳情頁(yè),進(jìn)行模型訓(xùn)練,模型訓(xùn)練流程每一個(gè)節(jié)點(diǎn)右側(cè)均有標(biāo)識(shí)提示該步驟是否成功,失敗會(huì)顯示原因,后續(xù)步驟選項(xiàng)變灰。訓(xùn)練完成后可顯示模型概覽,包括模型基本信息、當(dāng)前狀態(tài)、MAE與R2評(píng)價(jià)結(jié)果以及評(píng)價(jià)數(shù)據(jù)量,最下方為實(shí)際值與測(cè)試值的偏差圖。
圖6 合金材料數(shù)據(jù)機(jī)器學(xué)習(xí)系統(tǒng)模型訓(xùn)練演示示例Fig.6 Demonstration example of alloy material data machine learning system model training
系統(tǒng)支持將模型配置為方便直接使用的模型應(yīng)用,同時(shí)支持在系統(tǒng)中測(cè)試應(yīng)用,發(fā)布后的應(yīng)用即可在模型應(yīng)用服務(wù)系統(tǒng)中供用戶使用。如圖7所示,普通用戶登陸系統(tǒng)后,點(diǎn)擊應(yīng)用Tab頁(yè)進(jìn)入應(yīng)用倉(cāng)庫(kù),此處可顯示該賬戶下所有應(yīng)用及基本信息,單擊標(biāo)題進(jìn)入應(yīng)用使用界面,可收藏應(yīng)用方便篩選使用。專業(yè)用戶進(jìn)入應(yīng)用列表頁(yè)可顯示創(chuàng)建的應(yīng)用包含已發(fā)布和未發(fā)布的應(yīng)用,還可以進(jìn)行應(yīng)用新建。進(jìn)入應(yīng)用新建界面后有3個(gè)步驟,分別是填入基本配置信息、選擇模型和輸入規(guī)范,完成后生成1個(gè)未發(fā)布的應(yīng)用,點(diǎn)擊發(fā)布按鈕后完成用戶使用權(quán)限的選擇,確定后發(fā)布應(yīng)用成功,也可取消發(fā)布。在應(yīng)用使用界面,可選擇數(shù)據(jù)輸入方式,支持單條輸入和多條輸入,無論什么輸入方式均在右側(cè)對(duì)特征值進(jìn)行實(shí)時(shí)校驗(yàn),提醒輸入數(shù)據(jù)是否符合要求,沒有錯(cuò)誤后可進(jìn)行實(shí)時(shí)計(jì)算,計(jì)算完成后跳轉(zhuǎn)回結(jié)果頁(yè)。結(jié)果頁(yè)可顯示預(yù)測(cè)結(jié)果,有簡(jiǎn)略與詳細(xì)兩種模式,可手動(dòng)切換。
圖7 合金材料數(shù)據(jù)機(jī)器學(xué)習(xí)系統(tǒng)模型應(yīng)用演示示例Fig.7 Demonstration example of alloy material data machine learning system model application
核電站堆型種類多樣,其中采用普通水作為冷卻劑和慢化劑的壓水堆應(yīng)用最為廣泛,該類型核電站的大部分部件采用鋼鐵材料,由于高溫和強(qiáng)輻射服役環(huán)境的限制對(duì)核電用鋼的性能要求非常嚴(yán)苛,鋼材制備研發(fā)也需模擬實(shí)際環(huán)境進(jìn)行,試驗(yàn)難度大、危險(xiǎn)系數(shù)高,試驗(yàn)數(shù)據(jù)來之不易。因此,可借助機(jī)器學(xué)習(xí)算法構(gòu)建模型并對(duì)其進(jìn)行訓(xùn)練,訓(xùn)練后包裝成應(yīng)用供用戶直接使用,可達(dá)到基于材料數(shù)據(jù)預(yù)測(cè)核電用鋼某種性能的效果。如圖8所示,通過機(jī)器學(xué)習(xí)系統(tǒng)建模訓(xùn)練后,得到核電用鋼疲勞強(qiáng)度預(yù)測(cè)值與實(shí)際值的對(duì)比圖,可見每組樣品的預(yù)測(cè)準(zhǔn)確度相對(duì)較高,說明簡(jiǎn)單高效的模型構(gòu)建和訓(xùn)練可以針對(duì)不同材料的不同性能進(jìn)行預(yù)測(cè),從而有效降低試驗(yàn)成本,便于科學(xué)家們選材用材。
圖8 核電用鋼疲勞強(qiáng)度性能預(yù)測(cè)值與實(shí)際值的對(duì)比Fig.8 Comparison of predicted and actual values of fatigue strength properties of nuclear power steels
數(shù)據(jù)驅(qū)動(dòng)與人工智能的結(jié)合成為科學(xué)的第四范式,作為核心技術(shù)之一的機(jī)器學(xué)習(xí)的應(yīng)用與發(fā)展已經(jīng)完全改變了材料研究的理念,并在該領(lǐng)域取得了一定的進(jìn)展,朝著快速準(zhǔn)確地預(yù)測(cè)材料的各種性質(zhì)目標(biāo)邁出了重要一步,利用數(shù)據(jù)幫助人們發(fā)現(xiàn)、設(shè)計(jì)和優(yōu)化新材料,成為重要的材料數(shù)據(jù)分析工具[28]。本文基于機(jī)器學(xué)習(xí)算法對(duì)核電結(jié)構(gòu)材料性能預(yù)測(cè)進(jìn)行深入研究,該過程摒棄傳統(tǒng)材料研發(fā)設(shè)計(jì)周期長(zhǎng)且成本高昂的缺點(diǎn),在材料科學(xué)與工程領(lǐng)域展現(xiàn)出了與傳統(tǒng)研究方式不一樣的視角。
本文通過多源異構(gòu)數(shù)據(jù)、非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)的結(jié)構(gòu)化處理技術(shù),針對(duì)跨尺度的核電合金結(jié)構(gòu)材料數(shù)據(jù)庫(kù),主要介紹了機(jī)器學(xué)習(xí)平臺(tái)的建設(shè)思路和主要功能模塊構(gòu)成,總結(jié)了該機(jī)器學(xué)習(xí)系統(tǒng)對(duì)核電合金性能預(yù)測(cè)的基本步驟流程和具體演示示例。結(jié)果表明:通過對(duì)核電合金材料數(shù)據(jù)進(jìn)行整理和有效利用,挖掘數(shù)據(jù)中的潛在信息對(duì)材料的某一目標(biāo)性能進(jìn)行預(yù)測(cè),可以不經(jīng)過傳統(tǒng)試驗(yàn)和第一性原理計(jì)算獲得相對(duì)可靠的性能,充分發(fā)揮機(jī)器學(xué)習(xí)系統(tǒng)對(duì)研發(fā)人員的助力作用;文中配置的機(jī)器學(xué)習(xí)平臺(tái)操作頁(yè)面簡(jiǎn)潔美觀,易于用戶理解使用,面對(duì)不同類型的用戶可提供不同的模式包括模型訓(xùn)練和應(yīng)用創(chuàng)建,可有效減少研發(fā)人員的工作量;以上均對(duì)材料性能預(yù)測(cè)乃至新材料的研發(fā)具有一定實(shí)用價(jià)值。
雖然材料數(shù)據(jù)機(jī)器學(xué)習(xí)系統(tǒng)的構(gòu)建可以讓科研人員不再依賴反復(fù)試驗(yàn)或數(shù)據(jù)計(jì)算,有效預(yù)測(cè)材料的特征性質(zhì)并開發(fā)尋找新的高性能材料。但總的來說,機(jī)器學(xué)習(xí)是一種數(shù)據(jù)驅(qū)動(dòng)的方法,其應(yīng)用對(duì)數(shù)據(jù)依賴性很強(qiáng),對(duì)核電材料的性能預(yù)測(cè)需要從相關(guān)文獻(xiàn)和數(shù)據(jù)庫(kù)中獲取特征性能參數(shù),這種方式在數(shù)據(jù)量有限的情況下和具有上百萬數(shù)據(jù)量的圖像識(shí)別等領(lǐng)域相比,會(huì)導(dǎo)致機(jī)器學(xué)習(xí)模型的過擬合,從而降低機(jī)器學(xué)習(xí)方法的泛化能力。因此為了提高數(shù)據(jù)量,一方面需要進(jìn)一步通過高通量的計(jì)算來增加材料理論數(shù)據(jù),另一方面針對(duì)文獻(xiàn)中試驗(yàn)數(shù)據(jù)可以開發(fā)智能讀取系統(tǒng),從先進(jìn)文獻(xiàn)及出版物中讀取訪問可靠的試驗(yàn)數(shù)據(jù)。此外,機(jī)器學(xué)習(xí)向其他重要領(lǐng)域的發(fā)展仍然處于起步階段,還需要不斷地進(jìn)行完善和改進(jìn),通過發(fā)掘可解釋性的描述符將機(jī)器學(xué)習(xí)的黑盒子模型變得可解釋也是具有發(fā)展前景的方向之一??傊诳深A(yù)見的未來,隨著高新技術(shù)的發(fā)展,機(jī)器學(xué)習(xí)方法不僅可以助力于研發(fā)人員設(shè)計(jì)制備高性能的新型材料,還可能為其提供理論依據(jù),一定也會(huì)在其他材料科學(xué)領(lǐng)域大放異彩。