胡欣洋 王曉龍 劉嘉明
【摘 要】電量采集系統(tǒng)是非實時業(yè)務(wù)中的典型系統(tǒng),處在生產(chǎn)控制大區(qū)的II區(qū),它的主要功能是自動采集數(shù)字化變電站中各類電表的數(shù)據(jù),并提供給上級調(diào)度中心側(cè)電量采集系統(tǒng)主站進行數(shù)據(jù)分析和監(jiān)控。目前供電公司、變電站、電廠所應(yīng)用的電量采集系統(tǒng)大部分是由南京華瑞杰公司生產(chǎn)的COM3000系統(tǒng),廠站側(cè)采用MPE-V型終端。本文對目前常用的COM3000系統(tǒng)典型網(wǎng)絡(luò)故障進行分析,在工程實施中具有現(xiàn)實意義。
【關(guān)鍵詞】電量系統(tǒng) 網(wǎng)絡(luò)故障分析 采集系統(tǒng)
目前供電公司、變電站、電廠所應(yīng)用的電量采集系統(tǒng)大部分是由南京華瑞杰公司生產(chǎn)的COM3000系統(tǒng),廠站側(cè)采用MPE-V型終端。該設(shè)備通過485線纜連接各個電表,用于采集電表各類數(shù)據(jù)。每5分鐘采集一次,并將數(shù)據(jù)自動儲存在電量采集裝置中。具有多種上傳方式,如以太網(wǎng)、GPRS等。
在數(shù)字化變電站施工完成后或在后期的維護工作中,經(jīng)常會出現(xiàn)下級數(shù)字化變電站側(cè)到上級調(diào)度中心側(cè)業(yè)務(wù)不通的問題。包括實時業(yè)務(wù)、非實時業(yè)務(wù)等?,F(xiàn)在我將依照自己的工作經(jīng)驗,提出一種業(yè)務(wù)不通問題的解決方法。
當(dāng)某個調(diào)度中心側(cè)主站監(jiān)控系統(tǒng)發(fā)現(xiàn)有廠站業(yè)務(wù)不通后,我們需要對其進行分析和故障排除。比如某個變電站側(cè)的實時監(jiān)控系統(tǒng)實時數(shù)據(jù)無法上傳上級調(diào)度中心主站時,我們按步驟進行檢查:
(1)判斷該變電站的其他實時業(yè)務(wù)系統(tǒng)是否正常。比如在調(diào)度中心主站的交換機上用ping命令分別ping一下該變電站的實時監(jiān)控系統(tǒng)和PMU系統(tǒng)。實時監(jiān)控系統(tǒng)因為故障,可能會ping不通。如果PMU系統(tǒng)可以ping通,一般可以排除是調(diào)度數(shù)據(jù)網(wǎng)的問題。這時主要檢查實時監(jiān)控系統(tǒng)是否掉電,網(wǎng)關(guān)添加是否正確,是否設(shè)置了多個網(wǎng)關(guān)等問題。
(2)如果PMU等其他實時業(yè)務(wù)系統(tǒng)也無法ping通,那么懷疑是調(diào)度數(shù)據(jù)網(wǎng)出現(xiàn)故障。這時,我們ping一下變電站側(cè)的路由器和交換機,如果ping不通,可能是通訊通道故障或變電站側(cè)設(shè)備故障,需要檢查通訊通道以及現(xiàn)場設(shè)備。如果能ping通,說明主站、廠站之間的通訊通道正常,變電站側(cè)路由器、交換機也都在線運行,沒有發(fā)生掉電等情況。
(3)通過telnet命令登錄到現(xiàn)場路由器上,在路由器上用帶vpn參數(shù)的ping 命令進行同網(wǎng)段業(yè)務(wù)測試,如果ping不通實時監(jiān)控系統(tǒng),可能是交換機與實時監(jiān)控系統(tǒng)之間的網(wǎng)線故障或是實時監(jiān)控掉電或IP配置錯誤。如果能ping通,說明路由器到實時監(jiān)控系統(tǒng)之間連接正常,需要檢查路由器。
(4)因為已經(jīng)可以登錄到路由器上,因此排除通道原因。首先我們檢查BGP的狀態(tài),用dis bgp peer命令查看bgp鄰居的連接狀態(tài)。如果是Established狀態(tài),說明BGP協(xié)議建立成功,那么實時監(jiān)控系統(tǒng)業(yè)務(wù)不通的問題可能出現(xiàn)在BGP和MPLS的配置上。檢查BGP配置,查看ipv4-family vpnv4里是否peer了對端地址,ipv4-family vpn-instance vpn-rt里是否引入了靜態(tài)路由、直連路由等。如果以上配置都正確,再檢查E1接口下,是否配置了mpls協(xié)議以及mpls ldp,應(yīng)該能解決問題。如果bgp peer的狀態(tài)是Active,請仔細(xì)檢查廠站、主站路由器的BGP配置。如果確認(rèn)BGP配置都正確的情況下,進行下一步OSPF路由協(xié)議的檢查。
(5)當(dāng)廠站、主站BGP配置完全正確的情況下,BGP狀態(tài)仍然為Active,一般開始進行OSPF路由協(xié)議的檢查。用命令dis ospf peer查看ospf路由協(xié)議協(xié)商狀態(tài),如果什么都不顯示,說明OSPF主站、廠站路由器的OSPF協(xié)議配置上存在問題。最有可能的是OSPF的area對應(yīng)關(guān)系錯誤?;蛘呤莕etwork的網(wǎng)段錯誤。仔細(xì)檢查主站、廠站路由器OSPF路由協(xié)議的各種配置參數(shù)。確認(rèn)OSPF配置正確后,用命令dis ospf peer會發(fā)現(xiàn)顯示內(nèi)容中有對端的LOOPBACK地址或互聯(lián)地址,說明OSPF路由協(xié)議正常。這時,我們進入VRRP路由冗余協(xié)議的檢查。
(6)在兩臺變電站側(cè)路由器上分別用dis vrrp來查看vrrp協(xié)議狀態(tài)。正常的狀態(tài)應(yīng)該是第一臺路由器實時業(yè)務(wù)是Backup,非實時業(yè)務(wù)是Master;另一臺路由器的實時業(yè)務(wù)是Master,非實時業(yè)務(wù)是Backup。如果出現(xiàn)Initialize的初始狀態(tài),說明VRRP協(xié)議協(xié)商有問題。我們需要檢查兩臺路由器實時業(yè)務(wù)子接口的VRRP配置。首先檢查一下virtual-ip是否一致,優(yōu)先級是否一高一低,優(yōu)先級高的路由器是否配置了當(dāng)關(guān)聯(lián)接口故障后自動降低優(yōu)先級的功能。其次檢查一下VRRP的VRID號是否正確,是不是實時業(yè)務(wù)子接口的VRID配置成了非實時業(yè)務(wù)子接口的VRID。如果所有VRRP配置都正確,狀態(tài)依舊是Initialize的話,那么懷疑是路由器與交換機之間的連接問題。我們在第一臺路由器上用帶VPN參數(shù)的ping命令ping一下第二臺路由器的實時業(yè)務(wù)子接口的IP地址。Ping不通的話,我們需要檢查連接兩臺路由器與交換機的網(wǎng)線是否損壞,以及交換機與路由器連接的以太口trunk配置是否正確,有沒有允許實時業(yè)務(wù)VLAN 101通過。如果主站、廠站的路由器、交換機所有的配置都正確,網(wǎng)線連接也正確,實時業(yè)務(wù)依然無法由廠站上傳到主站的話,我們考慮是主站、廠站之間,處在縱向邊界的電力專用縱向加密認(rèn)證網(wǎng)關(guān)的問題。
(7)是否是縱向加密認(rèn)證網(wǎng)關(guān)出現(xiàn)故障的判斷方法很簡單。因為縱向加密認(rèn)證網(wǎng)關(guān)有一種旁路的功能,有些廠家生產(chǎn)的縱向加密認(rèn)證網(wǎng)關(guān)還支持關(guān)閉電源自動變成類似網(wǎng)線的功能,相對網(wǎng)絡(luò)來說是透明的。我們只需將縱向加密認(rèn)證網(wǎng)關(guān)變成旁路的工作模式或直接關(guān)閉掉。這時我們在調(diào)度中心主站側(cè)測試一下實時監(jiān)控的業(yè)務(wù),如果業(yè)務(wù)恢復(fù)正常了,說明是縱向加密認(rèn)證網(wǎng)關(guān)配置有錯誤。我們需要對縱向加密認(rèn)證網(wǎng)關(guān)的各項配置進行逐一檢查。包括是否導(dǎo)入了足夠的證書;IP配置是否正確;VLAN ID是否正確;填寫的路由器、交換機的IP地址、MAC地址是否正確;隧道是否成功建立;策略配置是否有阻擋等。一般在策略配置上出現(xiàn)問題的情況居多。
經(jīng)過以上的經(jīng)驗總結(jié),應(yīng)該可以初步判斷業(yè)務(wù)不通的原因了。電力二次系統(tǒng)網(wǎng)絡(luò)技術(shù)是一種多元化技術(shù),是需要長期研究的項目,本文提出的七種典型故障只是基礎(chǔ),供維護人員參考。