謝 磊,楊 鑫,楊 林
(1.山東核電有限公司,山東 海陽 265116) (2.國核自儀系統(tǒng)工程有限公司,上海 200241)
核電站網(wǎng)絡安全系統(tǒng)是核電站綜合安全系統(tǒng)的重要組成部分,因為單一節(jié)點宕機或其他網(wǎng)絡相關系統(tǒng)的故障造成的核電站整體儀控系統(tǒng)故障,可能導致儀控信號延遲,甚至造成操作指令延遲,最終釀成全系統(tǒng)的重大事故或隱患。
周振海等[1]為了增強企業(yè)網(wǎng)絡架構的彈性,使用智能彈性架構(intelligent resilient framework,IRF)虛擬化技術簡化網(wǎng)絡運行,降低了運營成本、擴展了帶寬容量和端口密度,使企業(yè)網(wǎng)絡具有更好的擴展性,但無法執(zhí)行人為干預。盛建平[2]通過具體案例分析了虛擬機抓取交換機端口鏡像數(shù)據(jù)包故障問題。黃冬燕[3]為了解決自動化系統(tǒng)改造過程中的聯(lián)調問題,提出使用交換機端口鏡像技術,不改變遠端主機配置,不影響舊調度自動化系統(tǒng)的實時數(shù)據(jù),縮短了聯(lián)調周期,提高了自動化系統(tǒng)的建設效率。潘瑞恩等[4]使用智能調度對電力調度數(shù)據(jù)網(wǎng)中數(shù)據(jù)的采集和儲存進行了改進,對電力調度數(shù)據(jù)網(wǎng)中的海量數(shù)據(jù)使用旁路無損采集技術進行采集;對數(shù)據(jù)和應用層內容進行解析,然后對具體的數(shù)據(jù)報文進行解析從而獲得結構化數(shù)據(jù),最后將得到的數(shù)據(jù)存入數(shù)據(jù)庫。金海峰[5]借助路由器、交換機等仿真設備,設計了數(shù)據(jù)通信模型,分析和驗證了TCP/IP數(shù)據(jù)封裝和傳輸過程,并得出研究結論。目前還沒有針對核電站儀控系統(tǒng)網(wǎng)絡安全系統(tǒng)防護體系的研究。
本文基于上述研究在核電站儀控系統(tǒng)中構建的鏡像接口(m-Uplink),通過多種神經(jīng)網(wǎng)絡算法對數(shù)據(jù)進行整合優(yōu)化,再通過系統(tǒng)運算分析,實現(xiàn)各儀控系統(tǒng)的預警。
核電站儀控系統(tǒng)中存在大量的物聯(lián)網(wǎng)設施,包括可編程邏輯控制器(programmable logic controller,PLC)系統(tǒng)、微控制器(microcontroller unit,MCU)系統(tǒng)和單片機微型計算機(single-chip microcomputer,SCM)系統(tǒng)。使用專業(yè)的工業(yè)網(wǎng)橋設備或中段數(shù)據(jù)采集系統(tǒng)將儀控系統(tǒng)信號轉化為通用信號后,進入儀控系統(tǒng)核心交換機的下行接口(PLC-Link),同時數(shù)據(jù)會經(jīng)過上行接口(Uplink)上傳到其他控制類數(shù)據(jù)分析系統(tǒng)。在網(wǎng)絡安全控制中,一般采用熱備份的方式使用2臺核心交換機控制2套工業(yè)控制網(wǎng)絡完成自主切換,自主切換過程通過交換機的RS-233接口連接心跳線,該線路通過交換機內部自主控制程序實現(xiàn)主動切換,無法執(zhí)行人為干預。但交換機的Uplink接口可以構建鏡像接口(m-Uplink),該系統(tǒng)通過對交換機m-Uplink接口的數(shù)據(jù)進行拆分分析,實現(xiàn)各儀控系統(tǒng)節(jié)點的預警分析。上述邏輯如圖1所示。
圖1中,通過m-Uplink接口采集的數(shù)據(jù),根據(jù)不同的數(shù)據(jù)報文端口號進行分割,未分割數(shù)據(jù)為全數(shù)據(jù),經(jīng)過分割的數(shù)據(jù)為單端口數(shù)據(jù)。將全數(shù)據(jù)和單端口數(shù)據(jù)分別執(zhí)行數(shù)據(jù)挖掘后,各自形成1個標識碼,即有n個監(jiān)測端口時,產(chǎn)生(n+1)個數(shù)據(jù)分析標識碼,將上述(n+1)個數(shù)據(jù)分析標識碼形成多列神經(jīng)網(wǎng)絡后,每列會產(chǎn)生一個預警值。其中數(shù)據(jù)提取任務和各個標識碼的分析任務,以及各預警分析任務,均采用獨立的浮點計算,并依照計算結果由主機系統(tǒng)執(zhí)行相關操作,其中計算主機之間根據(jù)圖1的連接方式形成數(shù)據(jù)硬件連接。計算主機之間配置獨立網(wǎng)卡,用于連接預警系統(tǒng)的獨立交換背板,即主要數(shù)據(jù)傳輸采用P2P專線連接,控制數(shù)據(jù)使用預警系統(tǒng)的獨立背板與交換機連接。
核電站的網(wǎng)絡安全故障及隱患的評價響應周期應足夠短,預警提前量應足夠大,所以其算法結構應足夠簡化。如果使用神經(jīng)網(wǎng)絡算法模型,則模型中的節(jié)點量應足夠小。核電站儀控系統(tǒng)一般包含數(shù)千個數(shù)據(jù)節(jié)點,網(wǎng)絡拓撲復雜度較高,網(wǎng)絡分析難度較大,即使其最小化的神經(jīng)網(wǎng)絡算法模型仍有很大的節(jié)點量,需要很大規(guī)模的算力硬件支持系統(tǒng)。而數(shù)據(jù)分析中,因為需要較高的敏感度,所以一方面應在節(jié)點量得到最大優(yōu)化的前提下最大限度提升數(shù)據(jù)挖掘深度,使用足夠的算力硬件確保其最短的評價響應周期,另一方面可以通過犧牲部分特異度指標換取更高的敏感度。該模型邏輯建構采用基于差值序列的超限學習機算法,用于提取數(shù)據(jù)的周期性特征,使用空間卷積算法強化數(shù)據(jù)特征,在與窗口數(shù)據(jù)合并后,采用基于六階多項式的通用模糊神經(jīng)網(wǎng)絡挖掘數(shù)據(jù)規(guī)律。超限學習機和模糊神經(jīng)網(wǎng)絡的輸出數(shù)據(jù),使用小節(jié)點量的對數(shù)神經(jīng)網(wǎng)絡實現(xiàn)數(shù)據(jù)整合的同時,對數(shù)據(jù)落點位置進行優(yōu)化重排,并將數(shù)據(jù)交由后續(xù)分析模塊做進一步數(shù)據(jù)挖掘。該算法邏輯如圖2所示。
圖2 虛擬機神經(jīng)網(wǎng)絡安全防護體系模型邏輯架構
圖2中,時序數(shù)據(jù)包含圖1中的全數(shù)據(jù)和單一端口數(shù)據(jù),單一端口數(shù)據(jù)中包含了PLC數(shù)據(jù)、MTU數(shù)據(jù)和SCM數(shù)據(jù),后續(xù)分析指圖1中針對特定節(jié)點狀態(tài)預警的分析模塊。
超限學習機模糊神經(jīng)網(wǎng)絡模塊的統(tǒng)計學意義是利用模糊神經(jīng)網(wǎng)絡對周期性數(shù)據(jù)進行分析,輸出1個包含數(shù)據(jù)特征的雙精度變量。因為核電站儀控系統(tǒng)采集的數(shù)據(jù)屬于周期型數(shù)據(jù),所以在核電站儀控系統(tǒng)相關的模糊神經(jīng)網(wǎng)絡設計中,使用超限學習機模塊。超限學習機的算法結構,首先對離散序列數(shù)據(jù)生成差值序列,然后在差值序列的基礎上采用三角周期函數(shù)實施深度迭代,最后進行回歸計算。
差值序列構建算法基函數(shù)如式(1)所示:
(1)
式中:S{tn′}為差值序列構建算法基函數(shù);tn′為差值序列的第n個值;tn為原始序列的第n個值;n為神經(jīng)網(wǎng)絡的節(jié)點數(shù);n′為差值序列神經(jīng)網(wǎng)絡的節(jié)點數(shù)。
在超限學習機中輸入式(1),得到式(2):
(2)
式中:y為神經(jīng)網(wǎng)絡節(jié)點的輸出值;i為指針變量;A,B,C,D為回歸變量;xi為上一層神經(jīng)網(wǎng)絡輸入的第i個變量。
多列模糊神經(jīng)網(wǎng)絡和用于參照變量生成的前置模糊神經(jīng)網(wǎng)絡均采用六階多項式深度迭代回歸函數(shù),其基函數(shù)如式(3)所示:
(3)
因為核電站儀控系統(tǒng)給出的原始數(shù)據(jù)為大宗數(shù)據(jù),所以使用前置卷積神經(jīng)網(wǎng)絡的方式對超限學習機和模糊神經(jīng)網(wǎng)絡的輸出數(shù)據(jù)進行歸一化處理,節(jié)點基函數(shù)使用對數(shù)深度迭代卷積公式:
(4)
針對各節(jié)點數(shù)據(jù)進行預警的模糊神經(jīng)網(wǎng)絡采用三段式設計,依次為對數(shù)模糊神經(jīng)網(wǎng)絡(對應的函數(shù)表達式為式(4))、六階多項式模糊神經(jīng)網(wǎng)絡(對應的函數(shù)表達式為式(3))、二值化神經(jīng)網(wǎng)絡。二值化神經(jīng)網(wǎng)絡的函數(shù)表達式如式(5)所示:
(5)
式中:e取近似值2.718 281 828。
上述算法邏輯中,共包含4種神經(jīng)元節(jié)點模式,分別為超限學習機節(jié)點、六階多項式模糊神經(jīng)網(wǎng)絡節(jié)點、對數(shù)模糊神經(jīng)網(wǎng)絡節(jié)點、二值化神經(jīng)網(wǎng)絡節(jié)點。其中,每個標識碼算法模塊(如圖2數(shù)據(jù)分析過程)的神經(jīng)元邏輯結構相同,每個數(shù)據(jù)預警單列神經(jīng)網(wǎng)絡模塊(如圖1預警過程)的神經(jīng)元邏輯結構相同,在相同的神經(jīng)元邏輯結構下,根據(jù)不同的數(shù)據(jù)分析需求分別進行訓練,使其分別收斂,最終形成機器自主學習成果。
神經(jīng)網(wǎng)絡的收斂程度根據(jù)二值化神經(jīng)網(wǎng)絡的收斂程度進行判斷,二值化神經(jīng)網(wǎng)絡的輸出值域為[0.000,1.000],其中絕大部分輸出數(shù)據(jù)在[0.000,0.005)和(0.995,1.000]內。當輸出數(shù)據(jù)落點位于[0.005,0.995]時,認為神經(jīng)網(wǎng)絡收斂不徹底,持續(xù)輸入隨機驗證數(shù)據(jù),當連續(xù)出現(xiàn)5倍訓練數(shù)據(jù)量的落點均脫離[0.005,0.995]時,可以認定神經(jīng)網(wǎng)絡已經(jīng)充分收斂。
在MATLAB下加載Simulink組件,以此構建仿真環(huán)境,實現(xiàn)對上述算法模型的仿真分析。在仿真環(huán)境中進行測試,原始數(shù)據(jù)來自某核電站2019年—2021年共3年的全年全系統(tǒng)數(shù)據(jù),之前儀控網(wǎng)絡安全監(jiān)測預警系統(tǒng)的預警結果數(shù)據(jù)作為本次分析的參照組,即為以下出現(xiàn)的舊系統(tǒng)數(shù)據(jù)。
比較方法采用SPSS數(shù)據(jù)分析軟件下的雙變量t檢驗,當對比結果t<10.000時認為數(shù)據(jù)之間存在統(tǒng)計學差異性,當t<0.001時認為數(shù)據(jù)具有絕對的差異性,當t>10.000時認為數(shù)據(jù)之間存在統(tǒng)計學一致性;P來自比較結果的Log值,當P<0.050時,認為比較結果位于置信空間內,當P<0.010時,認為比較結果具有顯著的統(tǒng)計學意義,當P<0.001時,認為比較結果具有絕對價值。通過仿真驗證分析,發(fā)現(xiàn)本系統(tǒng)與舊系統(tǒng)相比,具有一定優(yōu)勢。
電力系統(tǒng)控制和復雜系統(tǒng)控制配套的數(shù)據(jù)預警系統(tǒng),目前較為成熟的是Python工具集或MATLAB工具集中的曲線估計算法。曲線估計算法的數(shù)據(jù)預警提前量受制于原始數(shù)據(jù)量,當預警周期大于原始數(shù)據(jù)周期10%長度時,數(shù)據(jù)預警敏感度快速下降。由此可知,延長數(shù)據(jù)預警提前量能夠降低曲線估計算法的預警敏感度。舊系統(tǒng)采用的是曲線估計算法,在5 s提前量的目標下有較高的數(shù)據(jù)預警敏感度和特異度,但數(shù)據(jù)預警周期超過15 s時,數(shù)據(jù)預警敏感度和特異度均快速下降。但使用本文設計的算法模型后,增大數(shù)據(jù)預警提前量、延長數(shù)據(jù)預警周期并不會大幅降低數(shù)據(jù)預警的敏感度和特異度,詳見表1。
表1 新舊系統(tǒng)預警敏感度、特異度的對比結果
表1中,敏感度是指所有比較結果中所有預警結果中預警準確結果的比例,特異度是指所有比較結果中所有不預警結果中應該預警結果的比例。
5 s預警提前量的目標下,兩套系統(tǒng)的比較結果為t<10.000、P<0.050,具有可置信的統(tǒng)計學差異;15 s預警提前量的目標下,兩套系統(tǒng)的比較結果為t<10.000、P<0.010,具有顯著的統(tǒng)計學差異;60 s預警提前量的目標下,兩套系統(tǒng)的比較結果為t<0.001、P<0.001,具有絕對的統(tǒng)計學差異。
為了檢驗預警系統(tǒng)的穩(wěn)定性,對該系統(tǒng)和參照組進行比較分析。舊系統(tǒng)的數(shù)據(jù)延遲時間、計算響應周期比較長,丟包率為0.029%,宕機時間比也比較長。使用本文設計的預警系統(tǒng)后,降低了數(shù)據(jù)延遲時間、丟包率和計算響應周期,同時宕機時間比也有所減少,詳見表2。
表2 預警系統(tǒng)本身的穩(wěn)定性比較結果表
表2中,數(shù)據(jù)延遲指檢索或存儲數(shù)據(jù)包的時間;丟包率指測試中丟失的數(shù)據(jù)包數(shù)量與發(fā)送的總數(shù)據(jù)組的比率;計算響應周期指測試中從提交數(shù)據(jù)到數(shù)據(jù)返回的時間差;宕機時間比指機器出現(xiàn)故障停機時間與運行時間的比率。
在數(shù)據(jù)延遲時間、丟包率、計算響應周期和宕機時間比的比較中,兩套系統(tǒng)的比較結果為t<10.000、P<0.010,具有顯著的統(tǒng)計學差異。
本文開發(fā)的基于儀控系統(tǒng)的核電站網(wǎng)絡安全系統(tǒng)防護體系模型,通過基于差值序列的超限學習機算法,可以提高系統(tǒng)的敏感度、特異度和穩(wěn)定性,能夠提高核電站網(wǎng)絡安全系統(tǒng)防護體系的精確度。目前基于儀控系統(tǒng)的核電站網(wǎng)絡安全系統(tǒng)防護體系只是仿真系統(tǒng),還沒有進行商業(yè)化開發(fā),后期還需要做進一步開發(fā)。