李均強(qiáng),李鐵成,李宣義,栗會(huì)峰,王獻(xiàn)志,王亞軍
(1.國網(wǎng)河北省電力有限公司電力科學(xué)研究院,河北 石家莊 050021;2.國網(wǎng)河北省電力有限公司,河北 石家莊 050021)
遠(yuǎn)動(dòng)裝置是電力調(diào)度自動(dòng)化系統(tǒng)的關(guān)鍵設(shè)備,其穩(wěn)定可靠運(yùn)行對(duì)于電網(wǎng)調(diào)度自動(dòng)化信號(hào)準(zhǔn)確上送有著極重要作用[1-4]。目前,遠(yuǎn)動(dòng)裝置廠家、型號(hào)較多,軟件版本管理無序,易導(dǎo)致家族性缺陷的發(fā)生[5]。
家族性缺陷對(duì)電網(wǎng)安全運(yùn)行帶來很大的隱患,當(dāng)故障發(fā)生時(shí),必須要采取有效措施避免類似問題重復(fù)發(fā)生。
2019年,河北省南部電網(wǎng)多個(gè)變電站遠(yuǎn)動(dòng)裝置在省調(diào)前置切換通道后不能建立鏈接,同時(shí)面板顯示CPU使用率99%,重啟遠(yuǎn)動(dòng)裝置后通道切換正常,運(yùn)行一段時(shí)間(2~3個(gè)月)后相同問題會(huì)再次發(fā)生。經(jīng)查,這些變電站均采用同一型號(hào)的遠(yuǎn)動(dòng)裝置,并采用同一軟件版本,此次缺陷認(rèn)定為家族性缺陷。
針對(duì)缺陷開展分析定位,首先靶向搭建離線測(cè)試環(huán)境,在測(cè)試環(huán)境中對(duì)家族性缺陷現(xiàn)象進(jìn)行復(fù)現(xiàn),然后根據(jù)缺陷測(cè)試進(jìn)一步分析,提出程序修改意見。完成新軟件版本開發(fā)后對(duì)新軟件版本進(jìn)行離線測(cè)試,若新版本測(cè)試不合格,需進(jìn)一步分析原因,對(duì)程序進(jìn)一步優(yōu)化,直到問題解決。新程序經(jīng)離線測(cè)試合格后,選取1~2個(gè)變電站進(jìn)行試運(yùn)行。經(jīng)試一段時(shí)間試運(yùn)行無問題,在管轄區(qū)域內(nèi)相同型號(hào)設(shè)備進(jìn)行推廣,流程示意見圖1。
經(jīng)分析,遠(yuǎn)動(dòng)裝置程序中建立104規(guī)約通道鏈接的線程中,存在一個(gè)線程鎖的解鎖機(jī)制,而對(duì)應(yīng)的上鎖操作在104規(guī)約主線程中,該線程鎖操作機(jī)制不夠完善。遠(yuǎn)動(dòng)機(jī)在多次切換通道后,有一定機(jī)率出現(xiàn)線程死鎖并無法繼續(xù)進(jìn)行報(bào)文通信,同時(shí)CPU利用率達(dá)到99%的問題。
圖1 家族性缺陷處理流程示意
對(duì)本次家族性缺陷搭建模擬環(huán)境,見圖2。設(shè)置模擬主站地址為172.20.40.1~172.20.40.8(A電腦)、172.20.50.1~172.20.50.8(B電腦),配置上把172.20.40.N與172.20.50.N的地址設(shè)為主備配置,例如把172.20.40.1與172.20.50.1作為主備配置,設(shè)置遠(yuǎn)動(dòng)裝置通信地址為172.20.70.2。
圖2 模擬測(cè)試環(huán)境架構(gòu)示意
在模擬測(cè)試環(huán)境下,對(duì)存在家族性缺陷的原始程序進(jìn)行測(cè)試,實(shí)現(xiàn)缺陷的復(fù)現(xiàn)。
3.3.1 多主站IP地址單主模式下的104斷鏈性能測(cè)試(單電腦模擬)
測(cè)試步驟為:電腦A綁定172.20.50.1~8的8個(gè)地址;啟動(dòng)104主站模擬軟件;順序或隨機(jī)啟動(dòng)模擬主站軟件配置的8路地址的104鏈接;順序或隨機(jī)斷開模擬主站軟件配置的8路地址的104鏈接;快速重復(fù)啟動(dòng)、停止100次。
表1為選取的2019年12月15日啟、停2路(172.20.50.1~2)104鏈接部分日志情況。
表1 啟、停104鏈接部分日志
測(cè)試結(jié)論:遠(yuǎn)動(dòng)裝置的104程序能正確鏈接或斷開。
3.3.2 多主站IP地址主備模式下的104鏈接原理測(cè)試(雙電腦模擬)
測(cè)試步驟為:電腦A綁定172.20.50.1~8的8個(gè)地址并啟動(dòng)104主站模擬工具;電腦B綁定172.20.40.1~8的8個(gè)地址并啟動(dòng)104主站模擬工具;啟動(dòng)電腦A/B的模擬主站配置的1~8路地址的104鏈接;啟動(dòng)電腦B/A的模擬主站配置的對(duì)應(yīng)1~8路備用地址的104鏈接。
測(cè)試結(jié)論:遠(yuǎn)動(dòng)裝置無法同時(shí)鏈接互為主備的主站IP(例如172.20.40.1與172.20.50.1),先與遠(yuǎn)動(dòng)裝置建立鏈路的會(huì)被后啟動(dòng)鏈接的鏈路代替,也就是互為主備的主站IP,永遠(yuǎn)一路運(yùn)行一路備用。
3.3.3 多主站IP地址主備模式下的104通道切換測(cè)試(雙電腦模擬)
a.啟動(dòng)電腦A/B的模擬主站軟件配置的8路地址的104鏈接;
b.啟動(dòng)電腦B/A的模擬主站軟件配置的8路地址的104鏈接;
c.循環(huán)進(jìn)行步驟a、b。
測(cè)試結(jié)論:當(dāng)循環(huán)30余次時(shí)出現(xiàn)某幾路104通道不再鏈接情況,異常現(xiàn)象如圖3、圖4所示,出現(xiàn)問題與故障現(xiàn)場(chǎng)一致,裝置CPU使用率99%,異常104通道不再鏈接,已鏈接的104通道保持正常。
圖3 遠(yuǎn)動(dòng)裝置資源異?,F(xiàn)象
圖4 模擬主站104報(bào)文異?,F(xiàn)象
優(yōu)化程序處理機(jī)制,把104鏈接的線程中的線程鎖操作機(jī)制改成查詢方式。
根據(jù)程序修改意見,在存在家族性缺陷的原始程序基礎(chǔ)上進(jìn)行完善,保證版本迭代升級(jí),避免處理完此問題,又出現(xiàn)其他問題現(xiàn)象發(fā)生,實(shí)現(xiàn)軟件版本有效管理。
a.多主站IP地址單主模式下的104斷鏈性能測(cè)試(單電腦模擬),測(cè)試方法同缺陷復(fù)現(xiàn),查看遠(yuǎn)動(dòng)裝置事件得出:遠(yuǎn)動(dòng)裝置的104程序能正確鏈接或斷開。
b.多主站IP地址主備模式下的104鏈接原理測(cè)試(雙電腦模擬),測(cè)試方法同缺陷復(fù)現(xiàn),查看遠(yuǎn)動(dòng)裝置事件得出:遠(yuǎn)動(dòng)裝置互為主備的主站IP,永遠(yuǎn)一路運(yùn)行一路備用,功能正常。
c.多主站IP地址主備模式下的104通道切換測(cè)試(雙電腦模擬),測(cè)試方法同缺陷復(fù)現(xiàn),選取的2019年12月16日104通道切換部分日志情況,通道切換測(cè)試日志見表2。
經(jīng)過幾天數(shù)千次的切換測(cè)試,遠(yuǎn)動(dòng)裝置無現(xiàn)場(chǎng)的異?,F(xiàn)象出現(xiàn),主備地址可以正常切換,CPU使用率正常。
其他常規(guī)功能測(cè)試情況見表3。
通過測(cè)試,發(fā)現(xiàn)遠(yuǎn)動(dòng)裝置新程序解決了遠(yuǎn)動(dòng)裝置104通道鏈接異常問題,且其他功能也滿足要求。
表2 通道切換測(cè)試日志
表3 遠(yuǎn)動(dòng)裝置常規(guī)功能測(cè)試情況
選擇發(fā)生缺陷的2個(gè)變電站的遠(yuǎn)動(dòng)裝置進(jìn)行新版本程序升級(jí)。試運(yùn)行一個(gè)月后,各遠(yuǎn)動(dòng)裝置未發(fā)生異常。
遠(yuǎn)動(dòng)裝置程序升級(jí)后,經(jīng)過多次的切換測(cè)試,各個(gè)通道地址均可以正常切換,CPU使用率正常,其他功能正常,河北省南部電網(wǎng)共有70個(gè)變電站采用此型號(hào)遠(yuǎn)動(dòng)裝置,在新版本程序試運(yùn)行穩(wěn)定情況下,可以進(jìn)行推廣,將70個(gè)變電站的軟件版本都進(jìn)行更新。
在其他廠站的推廣,解決了此次遠(yuǎn)動(dòng)裝置104通道鏈接異常家族性缺陷。家族性缺陷給電網(wǎng)安全穩(wěn)定運(yùn)行帶來很大危害,及時(shí)發(fā)現(xiàn)并采取有效措施消除家族性缺陷對(duì)電網(wǎng)安全穩(wěn)定運(yùn)行具有重要意義。