亢利軍
摘要:為提高變電站遙視系統(tǒng)運行的可靠性,利用系統(tǒng)日志及時了解系統(tǒng)的運行狀態(tài)來發(fā)現(xiàn)和解決問題。通過日志提取、多線程處理、日志分類以及報警顯示等過程,實現(xiàn)對變電站遙視系統(tǒng)故障預(yù)警以及遠程準確定位故障原因的功能。結(jié)合專業(yè)工程師和檢修專家在日常工作實踐中積累的經(jīng)驗和事故案例,總結(jié)出一套故障預(yù)警機制,并研制了預(yù)警系統(tǒng)平臺。實踐證明,系統(tǒng)運行穩(wěn)定,信息處理及時,為維護和檢修人員快速處理故障提供有力支持。
關(guān)鍵詞:日志分析;遙視系統(tǒng);故障預(yù)警
中圖分類號:TP274文獻標志碼:A文章編號:1008-1739(2019)20-69-3
0引言
變電站的安全運行管理中,遙視系統(tǒng)起到重要作用,可以實現(xiàn)對變電站區(qū)域場景的遠程監(jiān)視、監(jiān)聽,監(jiān)視變電站內(nèi)重要設(shè)備的外觀運行及狀態(tài),實現(xiàn)關(guān)鍵部位防火、防盜和周邊報警聯(lián)動[1]。
遙視系統(tǒng)發(fā)生故障時,存在維護效率低、維修周期長的問題。主要有以下原因:①遙視系統(tǒng)多安裝在距離遠的無人變電站或少人的集控變電站,而維護技術(shù)人員遠在公司本部,到達現(xiàn)場后才能準確判斷故障原因,延長了維修所需的時間;②隨著地區(qū)變電站的不斷建設(shè),監(jiān)控點數(shù)量逐年增多,難以及時發(fā)現(xiàn)遙視系統(tǒng)故障,判斷故障原因和故障類型。
1總體方案
本文闡述一種基于對變電站遙視系統(tǒng)的運行日志進行遠程提取和分析的方法,目的是及時發(fā)現(xiàn)和準確定位系統(tǒng)運行中的各類故障[2],并在此基礎(chǔ)上建立了一套遙視系統(tǒng)故障預(yù)警系統(tǒng),不僅有利于及時對故障進行預(yù)警,也為維護人員制定系統(tǒng)維修計劃提供輔助決策,起到減少經(jīng)濟損失和提升工作效率的作用[3]。
1.1系統(tǒng)組成
系統(tǒng)由變電站端遙視設(shè)備、電力信息專網(wǎng)和監(jiān)控中心預(yù)警系統(tǒng)3個部分組成。所有變電站遙視系統(tǒng)都處于電力局域網(wǎng)的安全保護范圍,通過電力專用網(wǎng)絡(luò)通道與監(jiān)控中心連接。本方案在監(jiān)控中心建立預(yù)警系統(tǒng),實現(xiàn)日志提取、多線程處理、告警日志分析、預(yù)警顯示和數(shù)據(jù)存儲等功能。同時對多座變電站的所有遙視系統(tǒng)的運行狀態(tài)進行監(jiān)視和預(yù)警,最終實現(xiàn)遠程顯示故障原因的功能[4],系統(tǒng)總體框架如圖1所示。
1.2數(shù)據(jù)處理
基于系統(tǒng)日志的數(shù)據(jù)處理包括日志提取、清理、轉(zhuǎn)換、歸并、關(guān)聯(lián)和分析等步驟[5]。由于變電站監(jiān)控點數(shù)量眾多,為了實現(xiàn)實時數(shù)據(jù)處理,系統(tǒng)采用多線程并行處理技術(shù)進行故障分析,實現(xiàn)故障報警,為系統(tǒng)的維護提供決策支持。
遙視系統(tǒng)運行日志的提取選擇SDK軟件開發(fā)工具包,采用NET_DVR_SETLOGTOFILE方法,實現(xiàn)監(jiān)控設(shè)備的日志跟蹤和提取,獲取設(shè)備的控制信息、錯誤信息、調(diào)試信息和普通信息等。提取的過程包括監(jiān)控設(shè)備IP登錄連接、呼叫通道建立及啟動消息監(jiān)聽等,最終將日志信息存入數(shù)據(jù)文件和數(shù)據(jù)庫。
數(shù)據(jù)清理過程是消除噪音和不一致的數(shù)據(jù)。數(shù)據(jù)轉(zhuǎn)換的目的是將格式不同的各種日志表示為統(tǒng)一格式,然后進行數(shù)據(jù)歸并,將內(nèi)容重復(fù)或一致的日志進行歸并,本系統(tǒng)采用動態(tài)時間閾值歸并法。數(shù)據(jù)的關(guān)聯(lián)和分析過程是根據(jù)發(fā)生故障的現(xiàn)象與故障日志進行關(guān)聯(lián),分析二者之間的聯(lián)系和故障類型發(fā)生的概率,建立故障預(yù)警表,最終判斷故障發(fā)生原因并發(fā)出預(yù)警信號。
由于遙視監(jiān)控設(shè)備數(shù)量眾多,在數(shù)據(jù)處理過程中系統(tǒng)采用多線程處理技術(shù),通過Java Timer定時器調(diào)度任務(wù),采用Java多線程框架Executor技術(shù)實現(xiàn)日志數(shù)據(jù)并行處理,將數(shù)量眾多的監(jiān)控設(shè)備的日志數(shù)據(jù)存儲到數(shù)據(jù)庫中。有2種創(chuàng)建線程池的方法:public static ExecutorService newFixedThreadPool(int n Threads)創(chuàng)建固定數(shù)目線程的線程池;public static ExecutorService newCachedThreadPool()創(chuàng)建可緩存的線程池。系統(tǒng)采用前者,根據(jù)攝像頭的個數(shù),創(chuàng)建固定數(shù)目線程的線程池,每個攝像頭的SDK初始化就相當于開啟一個新的線程,并添加到線程池中,使得所有攝像頭同時處于監(jiān)聽狀態(tài),所有的線程共享代碼和數(shù)據(jù)空間,但每個線程有獨立的運行棧,向服務(wù)器的同一個端口發(fā)送監(jiān)聽到的信息。
1.3預(yù)警功能設(shè)計
1.3.1故障預(yù)警分析
為了更好地為遙視系統(tǒng)維護人員提供預(yù)警服務(wù),將處理后的日志信息分成紅色、黃色、藍色、黑色和綠色5個預(yù)警等級[6],并結(jié)合專業(yè)工程師及檢修專家在日常工作實踐中積累的經(jīng)驗和事故案例,總結(jié)出典型故障模型,包括故障類型、故障判斷、預(yù)警信號及概率等明確的故障預(yù)警表,如表1所示。
紅色預(yù)警:表示傳輸通道故障,報警顯示為紅色,包括IP通道IP地址沖突、IP通道接入模塊異常、網(wǎng)絡(luò)連接失敗等告警日志。
黃色預(yù)警:表示系統(tǒng)訪問故障,報警顯示為黃色,包括異常關(guān)機、SDK未初始化、攝像頭注冊失敗、啟動監(jiān)聽失敗、超過最大連接數(shù)和等待登錄返回超時等告警日志。
藍色預(yù)警:表示音視頻故障,報警顯示為藍色,包括視頻丟失、動態(tài)偵測、遮擋報警、I/O信號量報警和移動偵測等告警日志。
黑色預(yù)警:表示系統(tǒng)主機故障,報警顯示為黑色,包括硬盤滿、硬盤壞和錄像異常等告警日志。
綠色預(yù)警:表示電源故障,報警顯示為綠色,包括日志獲取失敗、網(wǎng)絡(luò)斷開及IP通道未連接等告警日志。
通過故障預(yù)警表的描述信息,預(yù)警系統(tǒng)將故障發(fā)生的時間、地點、設(shè)備編號及故障日志信息等內(nèi)容標注不同顏色,同時結(jié)合專家經(jīng)驗設(shè)定了各類故障發(fā)生的概率。對于相同地點、相同編號的同一個設(shè)備,維護人員根據(jù)預(yù)警系統(tǒng)產(chǎn)生的多種顏色的多條故障日志可以快速判斷故障原因,針對具體情況做出合理決策安排。
1.3.2系統(tǒng)功能
預(yù)警系統(tǒng)采用B/S模式運行,總體框架結(jié)構(gòu)由登錄模塊、日志提取模塊、預(yù)警處理模塊及系統(tǒng)管理模塊組成。
①登錄模塊:審核用戶登錄,同時對用戶行為進行審計留存。
②日志提取模塊:分為日志數(shù)據(jù)提取和數(shù)據(jù)預(yù)處理兩部分。通過SDK提取出實時運行日志后進行預(yù)處理,包括轉(zhuǎn)換、清理及歸并等步驟。最終將每類日志多余值和錯誤日志去除,保留與故障相關(guān)的告警日志,同時將某一時段相同的日志合并為一條日志。
③預(yù)警處理模塊:系統(tǒng)的核心模塊,將預(yù)處理完成的日志按照故障預(yù)警表描述的類型進行分類。根據(jù)分類進行相應(yīng)等級的預(yù)警,顯示故障發(fā)生的時間、地點及預(yù)警信號等,維護人員不僅可以看到發(fā)出警示的設(shè)備對應(yīng)的屬性值,還可以查看該故障近期發(fā)生的概率。
④系統(tǒng)管理模塊:包括監(jiān)控設(shè)備配置、用戶權(quán)限管理和統(tǒng)計輸出。監(jiān)控設(shè)備配置用來對監(jiān)控點的歸屬及地理位置等基本信息的管理;用戶權(quán)限管理用于用戶的注冊和權(quán)限分配;統(tǒng)計輸出的內(nèi)容包括監(jiān)測異常TOP統(tǒng)計、近1周的異常監(jiān)測統(tǒng)計、各類告警統(tǒng)計等。同時系統(tǒng)會將設(shè)備故障發(fā)出處理請求,生成缺陷處理單,并對處理過程、響應(yīng)時間和處理結(jié)果進行跟蹤統(tǒng)計,系統(tǒng)功能模塊如圖2所示。
2系統(tǒng)仿真
在使用過程中,系統(tǒng)運行穩(wěn)定、處理信息及時、提供有效的預(yù)警功能。通過本系統(tǒng),監(jiān)控中心的維護人員可以隨時查閱故障信息,實現(xiàn)了遠程實時監(jiān)控遙視運行情況。遙視預(yù)警系統(tǒng)主要界面如圖3所示。
3結(jié)束語
實現(xiàn)變電站遙視系統(tǒng)預(yù)知性維修,是電力系統(tǒng)檢修改革發(fā)展的必然趨勢。對站內(nèi)遙視系統(tǒng)進行實時狀態(tài)監(jiān)測,自動提取和分析遙視系統(tǒng)故障特征的日志信息,利用故障預(yù)警表判斷系統(tǒng)的故障原因,為維護和檢修人員快速處理故障提供了有力支持。目前由于實現(xiàn)故障預(yù)警的預(yù)警規(guī)則是人為分析總結(jié)制定,其精準性還需要在實踐中不斷地提升和優(yōu)化。
參考文獻
[1]郭嘉,韓宇奇,郭創(chuàng)新,等.考慮監(jiān)視與控制功能的電網(wǎng)信息物理系統(tǒng)可靠性評估[J].中國電機工程學(xué)報,2016,36(8): 2123-2130.
[2] Anderson J P.Computer Security Threat Monitoring and Surveillance[R].James P.Anderson Co.,F(xiàn)ort Washington,1980.
[3]王江亭,靳丹,俞俊,等.基于大數(shù)據(jù)的電力信息通信預(yù)警技術(shù)研究[J].電力信息與通信技術(shù),2017,15(9):64-69.
[4]王月,王濤.電網(wǎng)安全預(yù)警與應(yīng)急體系建設(shè)[J].電力安全技術(shù),2007,(12):28-31.
[5]李剛,陳怡瀟,黃沛爍,等.基于日志分析的信息通信網(wǎng)絡(luò)安全預(yù)警研究[J].電力信息與通信技術(shù),2018,16(12):1-8.
[6]李偉德.配電線路雷電監(jiān)測預(yù)警系統(tǒng)研究[J].電力信息與通信技術(shù),2016,14(12):107-111.