蘇大鵬
摘 要:眾所周知,大數(shù)據(jù)平臺是以海量數(shù)據(jù)存儲為基礎(chǔ),通過分布式實時計算引擎、在線數(shù)據(jù)分析以及離線批處理引擎提供數(shù)據(jù)的計算分析,通過大數(shù)據(jù)和人工智能技術(shù),幫助用戶實現(xiàn)海量數(shù)據(jù)分析的任務(wù)。隨著工業(yè)互聯(lián)網(wǎng)的完善,工業(yè)大數(shù)據(jù)作為一種大數(shù)據(jù)的應(yīng)用生態(tài),得到了廣泛重視。然而,在工業(yè)互聯(lián)網(wǎng)環(huán)境下,如何從用戶角度出發(fā),設(shè)計出技術(shù)細(xì)節(jié)透明、交互操作簡單、高效的工業(yè)大數(shù)據(jù)平臺及其上層應(yīng)用,成為工業(yè)大數(shù)據(jù)開發(fā)和應(yīng)用中的關(guān)鍵問題。
關(guān)鍵詞:工業(yè)大數(shù)據(jù);結(jié)構(gòu);應(yīng)用
工業(yè)大數(shù)據(jù)是指工業(yè)領(lǐng)域相關(guān)的海量數(shù)據(jù),包括信息化數(shù)據(jù)、物聯(lián)網(wǎng)數(shù)據(jù)以及跨界數(shù)據(jù),已成為新工業(yè)革命的核心動力。工業(yè)大數(shù)據(jù)是指在工業(yè)領(lǐng)域中,圍繞整個工業(yè)產(chǎn)品全生命周期所產(chǎn)生的各類數(shù)據(jù)以及相關(guān)技術(shù)和應(yīng)用的總稱,分為企業(yè)信息化數(shù)據(jù)、工業(yè)物聯(lián)網(wǎng)數(shù)據(jù)和外部跨界數(shù)據(jù)等幾類,涵蓋工業(yè)產(chǎn)品研發(fā)過程中的設(shè)計資料、產(chǎn)品生產(chǎn)過程中的監(jiān)控與管理、產(chǎn)品銷售與服務(wù)過程的經(jīng)營和維護數(shù)據(jù),具有數(shù)據(jù)量大、類型豐富、實時性強。
一、工業(yè)大數(shù)據(jù)的特點
工業(yè)大數(shù)據(jù)本身不僅具有廣義大數(shù)據(jù)的 3V 或4V 特點,還呈現(xiàn)出“多模態(tài)”、“強關(guān)聯(lián)”特點。
1、多模態(tài)。所謂多模態(tài),是指非結(jié)構(gòu)化類型工程數(shù)據(jù),包括設(shè)計制造階段的概念設(shè)計、詳細(xì)設(shè)計、制造工藝、包裝運輸?shù)却箢悩I(yè)務(wù)數(shù)據(jù),以及服務(wù)保障階段的運行狀態(tài)、維修計劃、服務(wù)評價等14大類數(shù)據(jù)。例如,在運載火箭研制階段,將涉及氣動力數(shù)據(jù)、氣動力熱數(shù)據(jù)、載荷與力學(xué)環(huán)境數(shù)據(jù)、彈道數(shù)據(jù)、控制數(shù)據(jù)、結(jié)構(gòu)數(shù)據(jù)、總體試驗數(shù)據(jù)等。
2、強關(guān)聯(lián)。所謂強關(guān)聯(lián),一方面是指產(chǎn)品生命周期的設(shè)計、制造、服務(wù)等不同環(huán)節(jié)的數(shù)據(jù)之間需要進行關(guān)聯(lián),即把設(shè)計制造階段的業(yè)務(wù)數(shù)據(jù)正向傳遞到服務(wù)保障階段,同時將服務(wù)保障階段的數(shù)據(jù)反饋到設(shè)計制造階段;另一方面,在產(chǎn)品生命周期的統(tǒng)一階段會涉及到不同學(xué)科、不同專業(yè)的數(shù)據(jù)。例如,民用飛機預(yù)研過程中會涉及總體設(shè)計方案數(shù)據(jù),總體需求數(shù)據(jù),氣動設(shè)計及氣動力學(xué)分析數(shù)據(jù),聲學(xué)模型數(shù)據(jù)及聲學(xué)分析數(shù)據(jù),飛機結(jié)構(gòu)設(shè)計數(shù)據(jù),零部件及組裝體強度分析數(shù)據(jù),多電系統(tǒng)模型數(shù)據(jù),多電系統(tǒng)設(shè)計仿真數(shù)據(jù),各個航電系統(tǒng)模型仿真數(shù)據(jù),導(dǎo)航系統(tǒng)模型仿真數(shù)據(jù),系統(tǒng)及零部件健康模型數(shù)據(jù),系統(tǒng)及零部件可靠性分析數(shù)據(jù)等,這些數(shù)據(jù)需要進行關(guān)聯(lián)。
二、工業(yè)大數(shù)據(jù)體系結(jié)構(gòu)
工業(yè)大數(shù)據(jù)平臺包含數(shù)據(jù)采集、存儲、加工、處理、分析等方面的功能,在很多應(yīng)用場合中,還設(shè)置了數(shù)據(jù)分析及控制系統(tǒng),以充分發(fā)揮大數(shù)據(jù)在預(yù)測、控制方面的作用,更好實現(xiàn)以大數(shù)據(jù)技術(shù)提高工藝精度或良品率的目的,工業(yè)大數(shù)據(jù)體系結(jié)構(gòu),決策與控制子系統(tǒng)采用數(shù)據(jù)挖掘、預(yù)測分析手段實現(xiàn)對生產(chǎn)的精確控制,是上層決策和控制的技術(shù)基礎(chǔ),是實現(xiàn)智能制造的核心部分。數(shù)據(jù)建模聚焦于為工藝、設(shè)備、用戶等建立分析模型,設(shè)計并部署不同的應(yīng)用系統(tǒng),挖掘出特定的模式和知識,最終生成決策指令,實現(xiàn)生產(chǎn)流程的優(yōu)化與產(chǎn)品生產(chǎn)的智能化。一般來講,工業(yè)大數(shù)據(jù)的來源涵蓋了生產(chǎn)、銷售、管理、市場等方面的數(shù)據(jù),應(yīng)根據(jù)數(shù)據(jù)來源的不同,在組建工業(yè)互聯(lián)網(wǎng)的基礎(chǔ)上,設(shè)計合適的數(shù)據(jù)采集與交換系統(tǒng)。目前,由于已經(jīng)有了較為成熟的數(shù)據(jù)采集與數(shù)據(jù)預(yù)處理及存儲技術(shù),工業(yè)大數(shù)據(jù)的主要技術(shù)難點在于如何準(zhǔn)確采集數(shù)據(jù),準(zhǔn)確處理結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù),如何設(shè)計和實現(xiàn)成熟的挖掘算法,這是工業(yè)大數(shù)據(jù)走向成熟、實現(xiàn)其應(yīng)用價值的關(guān)鍵。此外,與企業(yè)已有的 ERP 系統(tǒng)進行互聯(lián),充分整合和利用現(xiàn)有各類系統(tǒng)的數(shù)據(jù),也是工業(yè)大數(shù)據(jù)平臺的一個重要功能。
三、工業(yè)大數(shù)據(jù)的功能
工業(yè)大數(shù)據(jù)是配置和利用大數(shù)據(jù)這一資源的平臺及其應(yīng)用系統(tǒng),其功能主要表現(xiàn)在如下方面:促進工業(yè)大數(shù)據(jù)應(yīng)用。構(gòu)建工業(yè)大數(shù)據(jù)平臺來推動數(shù)據(jù)的融合和應(yīng)用,有利于通過工業(yè)大數(shù)據(jù)來分析和預(yù)測市場需求,整合產(chǎn)業(yè)鏈和價值鏈,為用戶提供定制化產(chǎn)品和服務(wù),實現(xiàn)工業(yè)生產(chǎn)模式和服務(wù)體系的創(chuàng)新。挖掘工業(yè)大數(shù)據(jù)的潛在價值,實現(xiàn)工業(yè)大數(shù)據(jù)增值,促進工業(yè)大數(shù)據(jù)的應(yīng)用。工業(yè)大數(shù)據(jù)應(yīng)用服務(wù)平臺通過對企業(yè)生產(chǎn)過程的優(yōu)化,引導(dǎo)企業(yè)認(rèn)識和利用數(shù)據(jù),逐步培養(yǎng)企業(yè)的數(shù)據(jù)利用意識,不但能夠促使企業(yè)深入挖掘自身積累的工業(yè)數(shù)據(jù),而且可以充分利用其它企業(yè)的大數(shù)據(jù)來推進企業(yè)自身發(fā)展,增強企業(yè)應(yīng)用大數(shù)據(jù)的動力。通過大數(shù)據(jù)采集、存儲、分析、交易過程中的一系列專業(yè)化服務(wù),將有效拓展大數(shù)據(jù)產(chǎn)業(yè)的市場容量,有利于培育出一批專業(yè)化的大數(shù)據(jù)開發(fā)和服務(wù)公司,吸引第三方數(shù)據(jù)服務(wù)商向工業(yè)大數(shù)據(jù)領(lǐng)域聚焦,更好地體現(xiàn)出工業(yè)大數(shù)據(jù)的應(yīng)用價值。
提升工業(yè)大數(shù)據(jù)配置效率。很多企業(yè)由于規(guī)模、資金、人才等方面的原因,缺乏充分利用大數(shù)據(jù)的技術(shù)手段和交易平臺,導(dǎo)致對自身擁有的數(shù)據(jù)采集、存儲、分析等處于較低水平。工業(yè)大數(shù)據(jù)平臺能夠通過提供數(shù)據(jù)采集、清洗、確權(quán)、產(chǎn)品開發(fā)等服務(wù),使數(shù)據(jù)得以資產(chǎn)化,讓其價值得到充分體現(xiàn)。
四、工業(yè)大數(shù)據(jù)關(guān)鍵技術(shù)
1、多時間尺度數(shù)據(jù)綜合分析,與傳統(tǒng)商務(wù)智能BI應(yīng)用場景不同,工業(yè)大數(shù)據(jù)包括秒/小時尺度的機器工況數(shù)據(jù)、天/周尺度的車間調(diào)度數(shù)據(jù)和月/年尺度的管理決策數(shù)據(jù),在工業(yè)大數(shù)據(jù)應(yīng)用中不同時間尺度的工業(yè)數(shù)據(jù)需要綜合使用才能驅(qū)動智慧企業(yè)。例如,智慧礦山企業(yè)需要根據(jù)跨界數(shù)據(jù)預(yù)測礦石品質(zhì)需求,依據(jù)品質(zhì)需求生成裝備作業(yè)計劃,根據(jù)裝備作業(yè)計劃實時控制裝備操作。
2、專業(yè)分析算法與構(gòu)件。針對時間序列、時空等弱結(jié)構(gòu)化數(shù)據(jù),應(yīng)提供豐富的特征模板庫,方便對典型物理事件如風(fēng)速平穩(wěn)時段、發(fā)電機轉(zhuǎn)速快速下降、環(huán)境溫度逐漸上升等進行描述;另外,還應(yīng)提供豐富的時間序列、時空模式、序列模式的深度挖掘算法庫,提升工業(yè)數(shù)據(jù)分析的建模效率。
3、實時交互分析。工業(yè)大數(shù)據(jù)分析必須能夠滿足大規(guī)模、分散控制和交互迭代等需求。在實時處理上,傳統(tǒng)的商業(yè)數(shù)據(jù)分析系統(tǒng)不能有效支持面向大規(guī)模數(shù)據(jù)狀態(tài)下的低等待時間復(fù)雜事件檢測。在離線分析上,查詢檢索與分析建模應(yīng)緊密協(xié)同,同時前臺探索展現(xiàn)與工業(yè)大數(shù)據(jù)平臺要無縫整合,支持大數(shù)據(jù)集上的交互挖掘。
4、遺留算法并行化。針對重要的應(yīng)用需求,工業(yè)企業(yè)通常具有一定的分析工具和科學(xué)計算軟件積累,然而這些工具通常沒有考慮大數(shù)據(jù)架構(gòu)。如何有效重用這些分析算法工具,是工業(yè)大數(shù)據(jù)分析應(yīng)用不能回避的技術(shù)問題。
5、領(lǐng)域知識自動化。工業(yè)大數(shù)據(jù)中存在著大量的非結(jié)構(gòu)化數(shù)據(jù),將當(dāng)前深度學(xué)習(xí)、自然語言處理等人工能力融入到工業(yè)大數(shù)據(jù)分析中來,可以有效輔助把專家知識進行有效的沉淀、萃取和自動化。
總之,我國不僅是制造大國更是使用大國,在裝備應(yīng)用過程中產(chǎn)生的海量機器數(shù)據(jù)正是工業(yè)大數(shù)據(jù)的主體,為我國智能制造創(chuàng)新發(fā)展提供了獨特而豐富的戰(zhàn)略資源;同時,對于國計民生息息相關(guān)的裝備制造業(yè)而言,工業(yè)大數(shù)據(jù)更是事關(guān)國家安全與主權(quán)。工業(yè)大數(shù)據(jù)是一個正在發(fā)展的學(xué)科領(lǐng)域,在內(nèi)涵外延、模型理論、技術(shù)方法及其實施策略等方面,我國和國際巨頭處在同一起跑線上。必須緊密結(jié)合中國國情認(rèn)真實踐,加大投入,快速研發(fā),走出中國工業(yè)大數(shù)據(jù)自主發(fā)展之路,實現(xiàn)國產(chǎn)化工業(yè)大數(shù)據(jù)技術(shù)。
參考文獻:
[1] 賀紅燕. 基于大數(shù)據(jù)的智能電網(wǎng)關(guān)鍵技術(shù)研究[J]. 電源技術(shù), 2016,40(8):14.
[2] 冉亮,李煒,孫向聚. 基于大數(shù)據(jù)技術(shù)的智能電網(wǎng)系統(tǒng)應(yīng)用研 究[J].自動化與儀器儀表,2017,(9): 13.
[3] 孟祥萍,周 來,王 暉. 云計算技術(shù)在未來智能電網(wǎng)信息處 理平臺中的應(yīng)用[J].計算機測量與控制,2017,23(10).