肖楠,阮大智,宋凱華
(工業(yè)互聯(lián)網(wǎng)創(chuàng)新中心(上海)有限公司,上海 200232)
工業(yè)互聯(lián)網(wǎng)數(shù)據(jù)中心可將來自不同傳感器的信息整合成統(tǒng)一的數(shù)據(jù)包,并將多種不同類型數(shù)據(jù)信息參量匯總,以供網(wǎng)絡主機的直接調(diào)取與利用。在工業(yè)互聯(lián)網(wǎng)中,上述處理流程被稱為“數(shù)據(jù)融合”。在網(wǎng)絡主機作用下,已被挑選的數(shù)據(jù)信息參量可與知識庫中存儲的文件自行匹配,一方面輔助故障診斷模塊確定用戶端主機是否連接,另一方面也可將信息反饋至既定數(shù)據(jù)庫主機中[1-2]。由于數(shù)據(jù)融合算法的出現(xiàn),工業(yè)互聯(lián)網(wǎng)主機中的存儲信息能夠自發(fā)向下級客戶端傳輸,且信息與信息之間的連接映射關系也不會受到任何協(xié)議文件的影響。
隨著工業(yè)互聯(lián)網(wǎng)運行時間的不斷延長,一部分信息參量會表現(xiàn)出異常傳輸行為,從而導致信息參量之間的相對偏差值水平不斷增大。為避免上述情況的發(fā)生,需要準確分辨互聯(lián)網(wǎng)主機所接收到的數(shù)據(jù),再借助AOP 程序提取與監(jiān)控數(shù)據(jù)傳輸行為[3]。然而,此系統(tǒng)對于異常信息參量的監(jiān)控準確性并不能達到標準,導致工業(yè)互聯(lián)網(wǎng)運行數(shù)據(jù)之間的相對偏差值水平高于理想化數(shù)值。為解決此問題,引入數(shù)據(jù)融合技術,并以此為基礎,設計一種新的工業(yè)互聯(lián)網(wǎng)運行異常監(jiān)控系統(tǒng)。
工業(yè)互聯(lián)網(wǎng)運行異常監(jiān)控系統(tǒng)的硬件由異常識別模塊、多節(jié)點負載均衡模塊、數(shù)據(jù)存儲模塊三部分組成。
異常識別模塊存在于工業(yè)互聯(lián)網(wǎng)核心監(jiān)控主機與數(shù)據(jù)庫存儲主機之間,在分析數(shù)據(jù)監(jiān)控任務可行性的同時,將既定指令文件反饋至相關應用元件中,一方面能夠?qū)⒏黝愋彤惓P袨檫M行區(qū)分,另一方面可實現(xiàn)數(shù)據(jù)信息融合行為的識別[4-5]。異常識別模塊結(jié)構如圖1 所示。
圖1 異常識別模塊結(jié)構示意圖
通常情況下,異常識別模塊的主體應用結(jié)構能夠同時對數(shù)據(jù)信息融合行為、工業(yè)互聯(lián)網(wǎng)運行行為、異常行為指標進行識別,且隨著模塊連接時間的增加,數(shù)據(jù)庫主機中存儲的監(jiān)控信息量也會不斷增多。
在工業(yè)互聯(lián)網(wǎng)運行異常監(jiān)控系統(tǒng)中,多節(jié)點負載均衡模塊能夠直接執(zhí)行數(shù)據(jù)融合指令,并可根據(jù)信息參量指標存儲量的不同,確定系統(tǒng)主機所處的運行階段,從而避免運行數(shù)據(jù)偏差值不斷增大[6-7]。整個模塊以monit 元件作為核心結(jié)構,向下則分別連接task 任務主機與load 結(jié)構。
由于工業(yè)互聯(lián)網(wǎng)運行異常行為的表現(xiàn)狀態(tài)有所不同,因此在每一個load 結(jié)構下端附屬兩個work 監(jiān)控設備。其中一個監(jiān)控設備負責記錄數(shù)據(jù)融合指令的運行狀態(tài),另一個監(jiān)控設備能感知互聯(lián)網(wǎng)運行信息的傳輸形式[8]。多節(jié)點負載均衡模塊結(jié)構如圖2所示。
圖2 多節(jié)點負載均衡模塊示意圖
圖2 中,task 任務主機直接與融合數(shù)據(jù)寄存器設備相連,可對工業(yè)互聯(lián)網(wǎng)運行異常數(shù)據(jù)進行初步采集,并將滿足傳輸要求的信息參量反饋至下級應用元件中。
數(shù)據(jù)存儲模塊與工業(yè)互聯(lián)網(wǎng)運行異常監(jiān)控系統(tǒng)的數(shù)據(jù)庫存儲主機直接相連,可根據(jù)數(shù)據(jù)融合指令的運行狀態(tài),將已存儲的信息參量整合成多個結(jié)構主體,便于核心監(jiān)控主機的直接調(diào)取與利用[9-10]。一般來說,能夠由模塊主機直接存儲的數(shù)據(jù)信息主要包含EsAggregateData、EsProcessData、EsMethodData三種命名形式,每種數(shù)據(jù)信息的具體字段長度及所屬類型如表1 所示。
表1 數(shù)據(jù)存儲模塊的信息命名機制
為使工業(yè)互聯(lián)網(wǎng)運行異常數(shù)據(jù)得到準確監(jiān)控,存儲模塊中所有信息參量字段長度需要保持一致。
在系統(tǒng)硬件支持下,按照SEP 路由協(xié)議連接、異常信息剔除、相似度矩陣加權值計算流程,實現(xiàn)系統(tǒng)軟件設計,完成基于數(shù)據(jù)融合的工業(yè)互聯(lián)網(wǎng)運行異常監(jiān)控系統(tǒng)設計。
SEP 路由協(xié)議是執(zhí)行數(shù)據(jù)融合指令時遵循的唯一信息編碼條件。在工業(yè)互聯(lián)網(wǎng)運行異常監(jiān)控系統(tǒng)中,該協(xié)議定義模式越完善,系統(tǒng)主機對數(shù)據(jù)的編碼能力越強。在不考慮其他干擾條件下,SEP 路由協(xié)議編碼指令的命名行為同時受到數(shù)據(jù)信息傳輸系數(shù)、工業(yè)互聯(lián)網(wǎng)運行異常行為特征的直接影響[11-12]。
數(shù)據(jù)信息傳輸系數(shù)長表示為λ,該項物理指標的取值區(qū)間存在一定局限,其起始值必須大于自然數(shù)“1”,而終止值則必須小于自然數(shù)“e”。
工業(yè)互聯(lián)網(wǎng)運行異常行為特征存在最大值rmax和最小值rmin,由其值決定單位時間內(nèi)數(shù)據(jù)信息的平均融合能力。聯(lián)立上述物理量,可將SEP 路由協(xié)議的編碼條件表示為:
式中,y表示工業(yè)互聯(lián)網(wǎng)運行異常數(shù)據(jù)的常規(guī)融合權限,表示待融合數(shù)據(jù)的檢測特征值,d表示特定的融合數(shù)據(jù)標記系數(shù)。
在數(shù)據(jù)融合約束下,所有待剔除的異常信息需要滿足SEP 路由協(xié)議的編碼的要求。
異常信息剔除是執(zhí)行數(shù)據(jù)融合算法的執(zhí)行環(huán)節(jié),可在已知數(shù)據(jù)參量傳輸目的的前提下,確定監(jiān)控主機與核心融合信息之間的傳輸距離,避免不必要傳輸指令的出現(xiàn),從根本上控制數(shù)據(jù)融合算法的執(zhí)行時長[13-14]。在數(shù)據(jù)融合指令單位執(zhí)行時間ΔT內(nèi),工業(yè)互聯(lián)網(wǎng)運行權限指征χ的取值結(jié)果越小,則表示待剔除的異常信息數(shù)據(jù)越多,反之則越少。
設a表示互聯(lián)網(wǎng)異常運行指令的執(zhí)行系數(shù),在實際應用過程中,該項指標的最小取值為1。在上述物理量的支持下,聯(lián)立式(1),可將監(jiān)控系統(tǒng)主機所遵循的異常信息剔除原則表示為:
式中,w、c表示兩個不同的數(shù)據(jù)信息融合深度指標,I表示與工業(yè)互聯(lián)網(wǎng)運行異常行為相關的監(jiān)控指令執(zhí)行系數(shù)項。對于工業(yè)互聯(lián)網(wǎng)運行異常監(jiān)控系統(tǒng)而言,數(shù)據(jù)庫主機中存儲的所有信息參量需要滿足異常信息剔除的要求。
相似度矩陣加權值計算是工業(yè)互聯(lián)網(wǎng)運行異常監(jiān)控系統(tǒng)構建中的重要環(huán)節(jié),可在數(shù)據(jù)融合算法支持下,分辨兩個監(jiān)控信息參量之間的相似性,不僅滿足數(shù)據(jù)庫主機對于傳輸數(shù)據(jù)參量的實時需求,也可避免異常運行數(shù)據(jù)對系統(tǒng)監(jiān)控指令傳輸中出現(xiàn)的問題[15-16]。
設X1、X2表示兩個不同的相似度量指標,若考慮數(shù)據(jù)融合算法的作用能力,則X1≠X2的不等式條件恒成立。?表示數(shù)據(jù)融合矩陣中已知信息參量的相似度量系數(shù),在選取作為加權標準值的情況下,可將工業(yè)互聯(lián)網(wǎng)運行異常監(jiān)控系統(tǒng)中的相似度矩陣加權值計算結(jié)果表示為:
式中,c表示互聯(lián)網(wǎng)運行異常信息在數(shù)據(jù)融合矩陣中的偏移系數(shù)項。
為驗證工業(yè)互聯(lián)網(wǎng)運行主機對異常數(shù)據(jù)信息的提取與監(jiān)控能力,設計如下對比實驗。具體實驗步驟如下:
步驟一:以配置數(shù)據(jù)融合算法的互聯(lián)網(wǎng)運行主機作為實驗組研究對象,以配置多源異構應用系統(tǒng)的互聯(lián)網(wǎng)運行主機作為對照組研究對象;
步驟二:同時閉合實驗組、對照組的互聯(lián)網(wǎng)主機元件,通過人工干預方式,令運行數(shù)據(jù)實時傳輸速率保持一致;
步驟三:確定互聯(lián)網(wǎng)運行數(shù)據(jù)偏差指標的理想數(shù)值變化情況;
步驟四:分別對比實驗組、對照組偏差指標數(shù)值與理想數(shù)值。
互聯(lián)網(wǎng)運行數(shù)據(jù)偏差指標的理想數(shù)值變化情況如表2 所示。隨著實驗時間的變化,互聯(lián)網(wǎng)運行數(shù)據(jù)偏差值均呈現(xiàn)不斷增大的數(shù)值變化趨勢。就數(shù)據(jù)信息橫向傳輸行為而言,其偏差值指標的上升幅度相對較大,實驗初始值與最終取值之間的物理數(shù)值差為0.15%;就數(shù)據(jù)信息縱向傳輸行為而言,其偏差值指標的數(shù)值水平在40~60 min 的實驗時間內(nèi),始終保持相對穩(wěn)定的狀態(tài),實驗最終取值與初始值之間的物理數(shù)值差為0.07%。
表2 互聯(lián)網(wǎng)運行數(shù)據(jù)偏差的理想數(shù)值
在橫向傳輸情況下,實驗組、對照組運行數(shù)據(jù)偏差指標的實驗數(shù)值變化結(jié)果如圖3 所示。
圖3 運行數(shù)據(jù)偏差的實驗數(shù)值(橫向傳輸)
分析圖3 可知,在數(shù)據(jù)信息保持橫向傳輸行為的情況下,實驗組運行數(shù)據(jù)偏差指標在整個實驗過程中始終保持來回波動,當時間取值為30 min 時,其數(shù)據(jù)偏差指標達到最大值0.36%,與理想最大值0.50%相比,下降0.14%。除時間取值為40 min 的時間節(jié)點外,對照組運行數(shù)據(jù)偏差指標始終呈現(xiàn)不斷上升趨勢,當時間取值為80 min 時,其數(shù)據(jù)偏差指標達到最大值0.56%,與理想最大值0.50%相比上升了0.06%,遠高于實驗組的極大值。
縱向傳輸情況中,實驗組、對照組運行數(shù)據(jù)偏差指標的實驗數(shù)值結(jié)果如圖4 所示。
分析圖4 可知,在數(shù)據(jù)信息保持縱向傳輸行為的情況下,當時間取值處于0~50 min 的區(qū)間內(nèi)時,實驗組運行數(shù)據(jù)偏差呈現(xiàn)來回波動的變化態(tài)勢,而當時間取值處于50~80 min 的區(qū)間之內(nèi)時,實驗組運行數(shù)據(jù)偏差則始終保持連續(xù)上升變化狀態(tài),其全局最大值為0.35%,與理想極大值0.34%相比上升了0.01%。對照組運行數(shù)據(jù)偏差在整個實驗過程中則始終保持連續(xù)波動的數(shù)值變化狀態(tài),當時間取值為80 min 時,其全局最大值為0.40%,與理想極大值0.34%相比上升了0.06%,整體均值水平高于實驗組。
圖4 運行數(shù)據(jù)偏差的實驗數(shù)值(縱向傳輸)
在數(shù)據(jù)融合算法作用下,互聯(lián)網(wǎng)運行數(shù)據(jù)偏差的數(shù)值水平在信息橫向傳輸、縱向傳輸情況下,均能得到較好控制,其平均值始終低于理想數(shù)值水平,這在實現(xiàn)對異常信息參量的準確提取與監(jiān)控方面,能夠起到較好的作用。
與多源異構型應用系統(tǒng)相比,新型工業(yè)互聯(lián)網(wǎng)運行異常監(jiān)控系統(tǒng)以數(shù)據(jù)融合算法作為切入點,在異常識別模塊、多節(jié)點負載均衡模塊等多個硬件設備支持下,通過構建SEP 路由協(xié)議的方式,對異常信息參量進行剔除,實現(xiàn)對相似度矩陣加權值的準確計算。實驗結(jié)果顯示,工業(yè)互聯(lián)網(wǎng)運行數(shù)據(jù)之間的相對偏差值水平得到有效控制,符合準確提取并監(jiān)控互聯(lián)網(wǎng)運行異常的實際需求。