• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      材料屬性知識圖譜的建設與發(fā)展淺析

      2021-12-24 09:30:28鄧永和張宇文譚恒博文大東
      關(guān)鍵詞:材料科學數(shù)據(jù)庫材料

      劉 濤,鄧永和,高 明,張宇文,譚恒博,文大東

      (1.吉首大學 物理與機電工程學院,吉首 416000;2.湖南工程學院 計算科學與電子學院,湘潭 411104)

      0 引言

      隨著經(jīng)濟的快速發(fā)展和制造業(yè)競爭日趨激烈,新一輪全球工業(yè)革命推動了材料科學的研究與開發(fā),以滿足工業(yè)領域?qū)Ω咝阅懿牧系男枨螅?].進入大數(shù)據(jù)時代,數(shù)據(jù)挖掘、機器學習等技術(shù)在材料研發(fā)平臺建設和基于大數(shù)據(jù)的材料分析預測等方面應用日益廣泛,并迅速成為材料設計與開發(fā)的有力工具.在新材料方面,機器學習算法已應用于許多關(guān)鍵材料的研究中,如新能源材料、軟材料、聚合物電介質(zhì)、鈣鈦礦材料、壓電材料、催化劑、感光材料等,并且取得了顯著成就[2].20世紀90年代末,數(shù)據(jù)挖掘方法已廣泛應用于材料科學研究和生產(chǎn)控制過程中,如材料性能預測與優(yōu)化、新材料設計與開發(fā)、生產(chǎn)過程監(jiān)控等[3].機器學習方法結(jié)合大量材料數(shù)據(jù),加速了新材料的設計和研發(fā)的進程,此方法引起了國內(nèi)外更多材料科學研究者的關(guān)注[2].在材料科學研究中,信息技術(shù)主要應用于材料數(shù)據(jù)庫的建設.2011年,美國總統(tǒng)奧巴馬提出了將材料數(shù)據(jù)庫作為三大基礎平臺之一的“材料基因組計劃”,并在2014年將其提升為美國的“國家戰(zhàn)略”.隨后,歐盟、日本和印度等國家也加入此類研究的行列,都爭取在新的材料革命時代中搶占先機.2015年中國也啟動了“材料基因工程關(guān)鍵技術(shù)與支撐平臺”重點專項(簡稱“材料基因工程重點專項”),在廣大材料科研工作者的共同努力下,該領域的研究取得了顯著的進展[4].

      1 材料屬性知識圖譜建設方法

      知識圖譜是由節(jié)點和關(guān)系構(gòu)成的圖,可直觀地模擬現(xiàn)實世界中的每一幕場景.通過不同知識間的關(guān)聯(lián)生成網(wǎng)絡知識結(jié)構(gòu),對于機器來說就是一張地圖.一個節(jié)點代表一個實體或概念,一個邊包含一個屬性或關(guān)系.知識圖譜生成過程的實質(zhì)就是讓機器形成認知能力,從而更好地理解世界.以“實體-關(guān)系-實體”三要素構(gòu)成知識圖譜的基本單位,這也是知識圖譜的核心.

      如圖1所示,材料屬性知識圖譜的架構(gòu)流程主要包括6個環(huán)節(jié):知識建模、知識存儲、知識抽取、知識融合、知識計算以及知識應用,可用于探索網(wǎng)絡間基本材料屬性之間的關(guān)系,指導多功能材料的設計.通過利用這些連接的模塊組織結(jié)構(gòu),可以把現(xiàn)有數(shù)據(jù)庫內(nèi)的隱藏性能聯(lián)系起來,為進行材料科學實驗或建立派生材料數(shù)據(jù)庫提供了便捷而高效的途徑[10].

      圖1 材料屬性知識圖譜的架構(gòu)流程示意圖

      2 材料數(shù)據(jù)庫概述

      “材料基因工程”項目為材料數(shù)據(jù)庫提供了新的發(fā)展方向,使材料數(shù)據(jù)庫的建設得到高速發(fā)展,因此開發(fā)各類數(shù)據(jù)共享平臺和計算工具至關(guān)重要.世界各地的材料科學研究者們都在積極建設材料數(shù)據(jù)庫[1].目前,國外較為著名的材料信息數(shù)據(jù)庫有Materials Project(MP)開放性數(shù)據(jù)庫[6]、AFLOW計算材料開放數(shù)據(jù)庫[7]等.與國外相比,國內(nèi)的材料科學數(shù)據(jù)庫建設相對較晚.但在“十三五”國家重點研發(fā)計劃專項的支持下,我國材料科學數(shù)據(jù)庫平臺逐步建成,如中國科學院金屬研究所開發(fā)的材料數(shù)據(jù)庫查詢系統(tǒng)[8]、國家材料科學數(shù)據(jù)共享網(wǎng)[9]、材料基因工程專用數(shù)據(jù)庫(MGED)、國家先進材料網(wǎng)絡和信息中心建立的材料信息網(wǎng)等,這些都是優(yōu)質(zhì)的材料科研平臺.

      2.1 國外研究情況

      2011年,由美國勞倫斯伯克利國家實驗(LBNL)和麻省理工學院(MIT)聯(lián)合開發(fā)的開放性數(shù)據(jù)庫—Material Project(MP)(https://www.materialsproject.org/),是美國“材料基因組計劃”的一大產(chǎn)物.此數(shù)據(jù)庫已經(jīng)存儲八十多萬條數(shù)據(jù),包括能帶結(jié)構(gòu)、彈性張量、壓電張量等性能的數(shù)據(jù).如圖2所示,該數(shù)據(jù)庫涉及了無機化合物、納米孔隙材料、嵌入型電極材料和轉(zhuǎn)化型電極材料等八大體系,其存儲的數(shù)據(jù)大多來自無機晶體結(jié)構(gòu)數(shù)據(jù)庫(Inorganic Crystal Structure Database,簡稱ICSD),其中所收錄的數(shù)據(jù)準確性非常高.在MP平臺上,通過部署各類專用計算軟件,它可在線預測未知材料的性能,這從很大程度上減少了科研人員的實驗量,也加快了各類材料的開發(fā)速度,使材料研究蓬勃發(fā)展[11].

      圖2 MP數(shù)據(jù)庫數(shù)據(jù)統(tǒng)計量

      2011年,由杜克大學開發(fā)的開放性AFLOW計算材料數(shù)據(jù)庫(http://www.aflowlib.org/),同樣是美國“材料基因組計劃”的一大產(chǎn)物,此數(shù)據(jù)庫中的數(shù)據(jù)大多也是通過第一性原理計算所得.目前,該數(shù)據(jù)庫存儲的數(shù)據(jù)涉及有3種無機化合物、312種二元合金和125種多元合金材料化合物,并分別有超過566,373,375個計算屬性,其中的絕大多數(shù)的數(shù)據(jù)都是預測得出的,是含量最大的數(shù)據(jù)庫,如圖3所示.與MP數(shù)據(jù)庫相似,二者皆運用了基于密度泛函理論(DFT)的高通量第一性原理計算、信息學數(shù)據(jù)挖掘和進化結(jié)構(gòu)篩選策略,并取得了良好的計算性能.AFLOW數(shù)據(jù)庫有12種應用程序可以有效地對材料的結(jié)構(gòu)、性能等進行篩選.此外,AFLOW數(shù)據(jù)庫中的AFLOWML模塊簡化了數(shù)據(jù)庫機器學習方法,使得普通用戶也可正常操作,并提供了一個開放式的API接口,不斷更新算法能夠保證各種工作流程的正常運行,助力材料科學研究人員更好地預測材料性能,推動機器學習在材料研究中的應用[12].

      圖3 AFLOW數(shù)據(jù)庫數(shù)據(jù)統(tǒng)計量

      此外,在材料領域中還有其他具有影響力的數(shù)據(jù)庫,如由美國國家標準與技術(shù)研究所NIST開發(fā)的數(shù)據(jù)庫https://www.nist.gov/srd/,這些數(shù)據(jù)庫是具有參考標準的數(shù)據(jù)庫系列.其中材料類的數(shù)據(jù)庫有材料性能數(shù)據(jù)庫與晶體結(jié)構(gòu)數(shù)據(jù)庫等.日本國立材料科學研究所開發(fā)的MatNavi數(shù)據(jù)庫(https://mits.nims.go.jp/)、歐洲卓越中心(European Centre of Excellence)開發(fā)的NOMAD(https://www.nomad-coe.eu/)、1995年日本科學技術(shù)公司(JST)與瑞典物相數(shù)據(jù)系統(tǒng)(MPDS)共同開發(fā)的PAULINGFILE數(shù)據(jù)庫(http://www.paulingfile.com/)、美國佛羅里達大學Hennig課題組創(chuàng)建和管理的Materials Web(https://www.materialsweb.org/)數(shù)據(jù)庫等[13].

      2.2 國內(nèi)研究情況

      1987年,中國科學院牽頭正式啟動科學數(shù)據(jù)資源建設,現(xiàn)在運行的是全新的中國科學院數(shù)據(jù)云門戶網(wǎng)站(http://www.csdb.cn/),此網(wǎng)站是在2019年更新后投入使用的.目前,該數(shù)據(jù)庫中共有1270個數(shù)據(jù)集,用戶數(shù)多達了1800萬,下載量達2352 TB.金屬研究所創(chuàng)建的“材料學科領域基礎科學數(shù)據(jù)庫”(http://www.matsci.csdb.cn/),其涉及的主要材料有金屬材料、無機非金屬材料、閃爍材料、碳化硅材料、納米材料和有機高分子材料等.目前材料科學類的數(shù)據(jù)總量7萬余條,包括了材料的熱學、力學和電學等各種物理特性,其中金屬材料數(shù)據(jù)共計6萬余條,無機非金屬材料數(shù)據(jù)共計1萬余條.此數(shù)據(jù)來源主要是手冊和期刊文獻數(shù)據(jù),它是國內(nèi)最全面的材料科學數(shù)據(jù)庫之一,極大地促進了新技術(shù)與材料學科領域的融合發(fā)展[14].

      2015年,科技部啟動了材料基因工程關(guān)鍵技術(shù)與支撐平臺“重點專項”(簡稱“材料基因工程重點專項”),該專項計劃開展材料基因工程基礎理論、關(guān)鍵技術(shù)與裝備、驗證性示范應用的研究,布局了示范性創(chuàng)新平臺的建設.該專項共設立了45個項目開展研究,在實施過程中強調(diào)要將材料高效計算、高通量實驗和大數(shù)據(jù)技術(shù)的研發(fā)、應用和融合作為研究任務的核心.由湖南大學牽頭湖南工程學院參與的“高通量多尺度材料模擬與性能優(yōu)化設計”和中南大學牽頭“高通量塊體材料制備新方法、新技術(shù)與新裝備”為材料數(shù)據(jù)庫的建設與應用奠定了基礎.預計到2025年有望實現(xiàn)“中國制造2025”計劃,使得新的材料設計和模擬方法得到優(yōu)化,新材料數(shù)據(jù)庫逐步完善[15].

      依托于2001年國家科技部“材料科學數(shù)據(jù)共享與服務平臺建設”重點項目的國家材料科學數(shù)據(jù)共享網(wǎng)(http://www.materdata.cn/),共整合了全國各地30余家科研單位的數(shù)據(jù)資源.其中包含的高質(zhì)量數(shù)據(jù)多達11萬條,涉及3000多種鋼鐵材料及其他材料基礎,將材料體系數(shù)據(jù)庫劃分為12個大類,包含材料基礎、天然材料及制品、有色金屬材料及特種合金、黑色金屬材料、復合材料、有機高分子材料、無機非金屬材料、信息材料、能源材料、生物醫(yī)學材料、建筑材料和道路交通材料,為材料領域的研究提供了數(shù)據(jù)共享服務與應用支撐.

      材料基因工程專用數(shù)據(jù)庫(MGED)(http://www.mgedata.cn/)是一個對材料的組分和結(jié)構(gòu)進行設計的一體化系統(tǒng)平臺,該數(shù)據(jù)庫包含結(jié)構(gòu)材料與功能材料以及各類材料的微觀結(jié)構(gòu)、熱力學性能和動力學數(shù)據(jù)的總量達70多萬條,該平臺涉及的材料有催化材料、鐵性材料、特種合金、生物醫(yī)用材料,還包含材料熱力學和動力學設計及性能數(shù)據(jù)庫等.到目前為止,該平臺累計訪問量達2萬多次.該平臺還包含了材料高通量第一性原理在線計算軟件和基于融合數(shù)據(jù)庫的材料數(shù)據(jù)挖掘計算網(wǎng)絡平臺以及論文信息輔助提取軟件,在該平臺上科研人員可以使用該軟件提取所閱讀的論文當中的實驗數(shù)據(jù),也可把材料數(shù)據(jù)填充在該平臺的材料數(shù)據(jù)庫中.平臺中的在線數(shù)據(jù)挖掘系統(tǒng)可以批量地實現(xiàn)自動生成作業(yè)、處理、解析和計算數(shù)據(jù)的全過程,還可以采用數(shù)據(jù)挖掘和機器學習的方法對該平臺上直接調(diào)用數(shù)據(jù)庫中的數(shù)據(jù)進行分析.

      此外,很多專項數(shù)據(jù)庫也已趨于成熟,如納米研究專業(yè)數(shù)據(jù)庫、國家材料環(huán)境腐蝕科學數(shù)據(jù)中心、高分子材料科學數(shù)據(jù)資源節(jié)點等,各主要數(shù)據(jù)庫的對比如表1所示[1].隨著基礎材料數(shù)據(jù)庫的不斷發(fā)展,用戶不但可能直接從數(shù)據(jù)庫中獲得材料的原始數(shù)據(jù),還可以利用數(shù)據(jù)庫中的軟件直接對數(shù)據(jù)進行組合和分析,并以圖像、列表、曲線等直觀的形式呈現(xiàn),這將大大節(jié)省研究者的時間成本,并實現(xiàn)數(shù)據(jù)庫從數(shù)字到功能應用的轉(zhuǎn)化.

      表1 主要數(shù)據(jù)庫的對比

      3 材料屬性知識圖譜的分析與利用

      “大數(shù)據(jù)”時代,免費的在線計算和實驗衍生材料數(shù)據(jù)庫推動了材料信息學蓬勃發(fā)展.但是,目前這些資源是不能聯(lián)系在一起的,通常只顯示直接計算或測量的數(shù)據(jù),很少有物理相關(guān)的屬性可以搜索.然而材料的屬性是內(nèi)在相互關(guān)聯(lián)的,物理屬性之間存在聯(lián)系,如表2所示.例如,材料的電子結(jié)構(gòu)與它的化學性質(zhì)和幾何結(jié)構(gòu)有關(guān),這影響它的能量吸收能力、折射率和介電擊穿強度.

      表2 物理屬性表舉例

      從整體上來看,材料科學知識可以描述為一個關(guān)系網(wǎng)絡.通過連接一定范圍內(nèi)的組織結(jié)構(gòu),可以洞察出數(shù)據(jù)之間的隱藏聯(lián)系.運用此方法,可以達到增加衍生材料性能,檢查性能關(guān)系,量化改善不同模型之間的不確定性,以及推斷之前未知物理相關(guān)性能.通過以一種簡單的序列化格式(如YAML格式)建立編碼規(guī)范及材料屬性關(guān)系.

      本文通過引入一個開源python包propnet,它以程序方式編寫并可應用于材料科學知識任何方面.其核心是一個不斷增長的材料屬性、適當?shù)膯卧蛯傩躁P(guān)系目錄,可用擴展的通用格式存儲.除了簡單的方程和基本屬性外,propnet還可以存儲并用python編程表達各種屬性及其關(guān)系,如晶體維度、材料成本和其他復雜輸入操作的關(guān)系.截至2019年7月,propnet該目錄包含115種材料屬性和69種關(guān)系.這些屬性和關(guān)系聯(lián)系在一起可以形成一個有向數(shù)據(jù)結(jié)構(gòu)圖,如圖4所示,能夠表示任意復雜的屬性關(guān)系,包括單向和雙向的屬性關(guān)系.propnet的用途在于從圖遍歷算法提供的輸入信息中派生出一組增強的材料屬性.如一些數(shù)據(jù)庫報告了一個計算的帶隙,但沒有使用這個帶隙來分析材料的折射率.而利用propnet可以自動生成估算的折射率.

      圖4 有向數(shù)據(jù)結(jié)構(gòu)圖

      propnet除了有擴展數(shù)據(jù)集的核心功能外,由propnet生成的數(shù)據(jù)集生成物理驅(qū)動的特征向量.這些矢量對于改進材料設計中的機械智能模型具有重要意義.使用propnet,可以評估屬性關(guān)系的準確性,并創(chuàng)建性能優(yōu)于任何單一模型的物理模型集合[5].propnet應用的材料數(shù)據(jù)庫是一個公開且數(shù)據(jù)量快速增長的計算材料屬性庫,其中包含超過120,000種不同的材料.材料數(shù)據(jù)庫主要來源于第一性原理,提供每個條目至少四個基本屬性,包括晶格常數(shù)及其基礎、計算帶隙、密度泛函理論(DFT)中Perdew-Burke-Ernzerhof(PBE)功能或PBE+U計算材料的總能量.并提供了其他與結(jié)構(gòu)相關(guān)的特性,包括化學公式、原子密度、質(zhì)量密度、單元格體積和每個原子體積.目前,材料子集的數(shù)量達1000~15000個,如介電、彈性、壓電和振動等特性也已經(jīng)被計算在表面能之外.這些張量特性包含的大量信息都被propnet用來最大程度地增加每種材料可用的信息量.

      使用propnet可以擴展每種材料的數(shù)據(jù)集,并且可以產(chǎn)生大約30種不同的標量特性.為了確定標量性質(zhì)之間的相關(guān)程度,軟件使用最大信息系數(shù)(MIC)分數(shù)來測量相關(guān)性.MIC得分范圍為0~1,0表示兩個變量之間沒有關(guān)系,1表示強烈的線性相關(guān)關(guān)系.當提供數(shù)據(jù)集時,propnet可以使用MIC評分或各種其他相關(guān)指標(包括Pearson相關(guān)、Spearman秩相關(guān)和Theil-Sen回歸)自動執(zhí)行相關(guān)分析,如表3所示.

      “圖形距離”作為屬性連接性的度量,可用于突出顯示未預期的屬性之間的相關(guān)性.將兩個屬性之間的圖形距離定義為派生這兩個屬性的最小輸入集的大小.圖上的距離越大,知識圖上的這些屬性的聯(lián)系就越“困難”.如果其中一個屬性沒有被任何模型連接到propnet知識圖上,則認為圖形距離是未定義的.測試結(jié)果顯示許多與高MIC分數(shù)相關(guān)的屬性都有較低的圖形距離.但是,如果兩個屬性都是從一個屬性中衍生出來的,它們的圖形距離為1個單位,圖形距離和MIC分數(shù)如表3所示.

      表3 材料屬性關(guān)系的圖形距離和MIC分數(shù)舉例

      4 材料屬性知識圖譜的發(fā)展趨勢

      隨著“材料基因工程”項目的提出與發(fā)展,材料信息數(shù)據(jù)庫的建設刻不容緩,要加快重要領域的數(shù)據(jù)庫建設,優(yōu)先建立國家重點科技項目數(shù)據(jù)庫,保護知識產(chǎn)權(quán)的同時加大數(shù)據(jù)共享力度,嚴格把握數(shù)據(jù)格式和數(shù)據(jù)來源,為數(shù)據(jù)分類制定標準化文件.大力培養(yǎng)優(yōu)秀的專業(yè)數(shù)據(jù)庫管理人員,保障數(shù)據(jù)的收集、維護和運用.為國內(nèi)材料科學的研究提供更加便攜的方式和更加完備的材料設計平臺,從數(shù)據(jù)庫的類別、分布式網(wǎng)絡存儲、材料數(shù)據(jù)挖掘算法及其關(guān)聯(lián)性算法與大數(shù)據(jù)技術(shù)相結(jié)合進行深入細致的探索是非常必要的.

      猜你喜歡
      材料科學數(shù)據(jù)庫材料
      中海油化工與新材料科學研究院
      材料科學與工程學科
      土木工程材料的認識和應用
      福建工程學院材料科學與工程學科
      新材料贏得新未來
      商周刊(2018年18期)2018-09-21 09:14:44
      《材料科學與工藝》2017年優(yōu)秀審稿專家
      最美材料人
      數(shù)據(jù)庫
      財經(jīng)(2017年2期)2017-03-10 14:35:35
      材料
      數(shù)據(jù)庫
      財經(jīng)(2016年15期)2016-06-03 07:38:02
      松潘县| 五常市| 博客| 财经| 西乡县| 潼关县| 千阳县| 芮城县| 潍坊市| 赫章县| 富阳市| 温州市| 凤翔县| 丰县| 万宁市| 兴义市| 海阳市| 邵阳市| 乌兰察布市| 南陵县| 齐齐哈尔市| 屏东市| 西充县| 宁远县| 合作市| 曲靖市| 确山县| 喀喇沁旗| 孝感市| 安庆市| 龙州县| 海晏县| 疏附县| 安多县| 台东市| 贵溪市| 无为县| 什邡市| 封开县| 禹州市| 永济市|