陳獻(xiàn)政
摘 要:IEC61850標(biāo)準(zhǔn)是電力系統(tǒng)自動化領(lǐng)域唯一的全球通用標(biāo)準(zhǔn),是變電自動化系統(tǒng)的發(fā)展最新趨勢。同時,IEC61850也是建設(shè)智能化變電站的主要技術(shù)。因為當(dāng)時技術(shù)條件和硬件系統(tǒng)發(fā)展不夠成熟,導(dǎo)致了大部分廠商對基于IEC61850的第一代建設(shè)的變電站網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計上存在局限性,進而在后期的工作中頻繁地出現(xiàn)網(wǎng)絡(luò)上的故障問題,因此,我們需要深入研究IEC61850變電站網(wǎng)絡(luò)頻繁中斷的原因,同時找到有效的解決方案。本文介紹了IEC61850監(jiān)控系統(tǒng)的構(gòu)成,探討了IEC61850變電站網(wǎng)絡(luò)頻繁中斷原因分析及解決方案。
關(guān)鍵詞:IEC61850變電站 網(wǎng)絡(luò)中斷 原因分析 解決方案
中圖分類號:TM63 文獻(xiàn)標(biāo)識碼:A 文章編號:1672-3791(2018)11(c)-0028-02
因為當(dāng)時的變電站是基于IEC61850標(biāo)準(zhǔn)而進行設(shè)計,又因為該技術(shù)當(dāng)時存在一定的不足,也就導(dǎo)致了監(jiān)控系統(tǒng)的穩(wěn)定性受到了很大的影響。其中最主要的影響就是流通大量的網(wǎng)絡(luò)報文而造成通信堵塞,或者是報文異常而導(dǎo)致了網(wǎng)絡(luò)的頻繁中斷。當(dāng)前,我們只能通過重啟或是漫長的等待恢復(fù)的過程才能夠使其恢復(fù)正常。所以說,當(dāng)務(wù)之急就是對網(wǎng)絡(luò)中斷的原因進行深入分析,找到與其對應(yīng)的解決辦法。
1 監(jiān)控系統(tǒng)構(gòu)成
早期的基于IEC61850技術(shù)標(biāo)準(zhǔn)進行設(shè)計的變電站的監(jiān)控系統(tǒng)所使用的是RCS-9700分散式微機監(jiān)控系統(tǒng),根據(jù)安裝的地點和功能的不同可以分為主控樓內(nèi)的站控層和室內(nèi)間隔層設(shè)備。其中網(wǎng)絡(luò)結(jié)構(gòu)則主要采用的是開放式分層和分布式結(jié)構(gòu)。站控層和間隔層的網(wǎng)絡(luò)構(gòu)造主要是由雙以太網(wǎng)組成的,其中站控層是按照全站終期規(guī)模進行設(shè)置裝備,間隔層則是利用具有接口的測控單元直接與網(wǎng)絡(luò)相連接,從而達(dá)到與站控層通訊的目的。
2 原因分析及處理方案
出現(xiàn)網(wǎng)絡(luò)中斷的原因有很多,對監(jiān)控系統(tǒng)中的信息傳輸進行分析,我們得知網(wǎng)絡(luò)通信頻繁掉線的原因主要有下面幾點:第一,系統(tǒng)內(nèi)一些裝置的MAC地址發(fā)生沖突,導(dǎo)致不能正常連接通信。第二,交換機網(wǎng)口和裝置網(wǎng)口的芯片使用時間過長,從而出現(xiàn)老化的情況。第三,網(wǎng)絡(luò)處于過負(fù)荷狀態(tài),CPU的處理速度慢。
2.1 MAC地址沖突現(xiàn)象分析
如果說MAC地址發(fā)生沖突,那么后臺就只能在同一時刻接受一臺設(shè)備傳輸?shù)膱笪模覀儾荒艽_定該傳輸?shù)膱笪氖欠袷俏覀冃枰?。對于傳輸中判斷為不需要的報文,則會直接被丟棄,這也就導(dǎo)致了網(wǎng)絡(luò)通信的中斷狀態(tài),直到正確的報文被接收,這時候才會重新聯(lián)接。于是這樣,在宏觀上就會造成頻繁出現(xiàn)網(wǎng)絡(luò)中斷和連接的現(xiàn)象。
2.1.1 MAC地址沖突異常查找
要想找出MAC地址沖突的原因,我們可以抓取傳輸?shù)膱笪倪M行分析,找出其中的原因是IP/Mac沖突還是A/B網(wǎng)絡(luò)被串聯(lián),因為理論上要想通信系統(tǒng)正常運行則要不同的網(wǎng)絡(luò)在物理層上分離開來。
2.1.2 MAC地址沖突處理方法
當(dāng)我們由上述方法找到MAC沖突的原因是IP/Mac沖突的話,解決的辦法很簡單,只需要將設(shè)備的MAC地址手動更改就可以恢復(fù)正常了。同時在后臺做靜態(tài)ARP綁定。如果MAC沖突是A/B網(wǎng)絡(luò)發(fā)生串聯(lián)造成的話,那就應(yīng)該找到串聯(lián)的地方,從而將其斷開。如果不是以上兩種情況的話,那我們可以直接排除MAC地址沖突導(dǎo)致網(wǎng)絡(luò)頻繁中斷的定論。
2.2 交換機網(wǎng)口芯片老化
2.2.1 交換機網(wǎng)口芯片老化現(xiàn)象
造成網(wǎng)絡(luò)頻繁中斷最重要的原因還是交換機網(wǎng)口芯片老化的問題,而交換機方面最重要的是主控室的核心交換機,當(dāng)這個部分的交換機的網(wǎng)口芯片出現(xiàn)老化問題,那就會導(dǎo)致后臺和遠(yuǎn)程設(shè)備都無法正常的接收發(fā)送的報文,也就出現(xiàn)了網(wǎng)絡(luò)的頻繁中斷。我們可以在后臺抓取傳輸中的報文,判斷是否出現(xiàn)頻繁的網(wǎng)絡(luò)報文重發(fā)現(xiàn)象,或者觀察交換機的運行指示燈和登錄交換機查看運行情況。
2.2.2 交換機網(wǎng)口芯片老化處理方法
如果是交換機老化問題,因為其會影響到對通信報文的處理,因此需要進行及時的更換,如果發(fā)現(xiàn)并不是該問題造成的中斷問題,那就說明是最后一種的可能性極大。
2.3 網(wǎng)絡(luò)負(fù)荷增加導(dǎo)致裝置CPU處理通信報文速度變慢
網(wǎng)絡(luò)出現(xiàn)頻繁中斷的最后一種情況就是網(wǎng)絡(luò)負(fù)荷增加導(dǎo)致設(shè)備的CPU處理速度變慢。眾所周知,設(shè)備的CPU不僅有處理報文的能力,而且還需要進行采樣和邏輯運算等工作。如果說站內(nèi)的通信報文突然增多的話,就會導(dǎo)致CPU處理不過來,造成網(wǎng)絡(luò)堵塞。
3 現(xiàn)場排查情況及采取方案
3.1 站內(nèi)報文類型
利用一些抓取報文的軟件對變電站內(nèi)的報文進行抓取分析,深入研究可以知道網(wǎng)絡(luò)報文主要有以下類型:一是采用點對點傳輸方式的報文,包括MMS、TCP等,其特點是只對特定的裝置起作用;二是采用組播或廣播傳輸方式的報文,包括APR、UDP和GOOSE等,其特點一般是數(shù)據(jù)量大或者涉及的裝置比較多。
3.2 站內(nèi)報文分析及處理方案
當(dāng)變電站的監(jiān)控系統(tǒng)運行穩(wěn)定時,所測量的值只會發(fā)生很小的變化。在這種狀況下,從后臺的一段網(wǎng)絡(luò)中抓取部分報文。從圖1、圖2可知,第138.786~138.806s、139.786~139.806s的兩段20ms間隔中,出現(xiàn)了10幀ARP。從以往的工作經(jīng)驗得知,這種規(guī)模的ARP報文在設(shè)備的正常處理范圍內(nèi),不會造成通信的異常。若在很多個連續(xù)的500ms時間段內(nèi)出現(xiàn)了至少40幀的ARP報文,使后臺發(fā)送來的MMS命令報文得不到及時的處理,這也在一定程度上提高了通信異常的概率。如果此時再有APR、UDP和GOOSE遙信/遙測量報文增加,并持續(xù)一段時間,裝置很容易出現(xiàn)通信“通/斷”現(xiàn)象。
ARP報文的影響解決很簡單,只需要在后臺采用“靜態(tài)ARP綁定”方案即可。如今,隨著一系列技術(shù)的發(fā)展,我國的變電站中已經(jīng)運用了該方案,并且與以往的情況相比較,可以很明顯地發(fā)現(xiàn)ARP報文出現(xiàn)的頻率和數(shù)量得到了很大的改善。
4 結(jié)語
對我國早期的變電站分析,發(fā)現(xiàn)網(wǎng)絡(luò)報文量的迅速增加是導(dǎo)致網(wǎng)絡(luò)頻繁中斷的主要原因,并根據(jù)報文特點采取相應(yīng)的方法限制報文流量,從而達(dá)到解決變電站中出現(xiàn)網(wǎng)絡(luò)頻繁中斷的問題。對早期的變電站結(jié)構(gòu)設(shè)計進行分析和探討,能夠有助于變電站的發(fā)展,對變電站的完善和創(chuàng)新上有很大的幫助。如今,上述的問題已經(jīng)得到了很好的解決,有關(guān)的技術(shù)也得到了也得到改進,變電站內(nèi)的監(jiān)控系統(tǒng)的穩(wěn)定性也得到了很大的提高。
參考文獻(xiàn)
[1] 陳安偉,朱松林,樂全明,等.IEC61860在變電站中的工程應(yīng)用[M].北京:中國電力出版社,2012.
[2] 樊陳,倪益民,竇仁輝,等.智能變電站過程層組網(wǎng)方案分析[J].電力系統(tǒng)自動化,2011,35(18):67-71.