張思齊,李志遠,李 磊,鄒洪森,王宏麗
(1.國網(wǎng)寧夏電力公司檢修公司,寧夏 銀川 750011;2.國網(wǎng)寧夏電力公司寧東供電公司,寧夏 銀川 750411)
換流站時鐘及服務(wù)器對時異常故障分析
張思齊1,李志遠2,李 磊1,鄒洪森1,王宏麗1
(1.國網(wǎng)寧夏電力公司檢修公司,寧夏 銀川 750011;2.國網(wǎng)寧夏電力公司寧東供電公司,寧夏 銀川 750411)
針對銀川東換流站主時鐘及服務(wù)器對時異常問題,通過對主時鐘和服務(wù)器對時工作原理進行分析,提出了主時鐘增加裝置容錯機制及內(nèi)部時鐘守時機制,服務(wù)器系統(tǒng)增加對時抗干擾機制的解決方案。應(yīng)用結(jié)果表明:該方案有效提升了主時鐘及服務(wù)器抗外部信號干擾的能力,大大提高了站內(nèi)設(shè)備運行的穩(wěn)定性。
時鐘同步;標準時鐘;主時鐘;服務(wù)器;對時異常
2016年7月12日1時0分,銀川東換流站按照功率曲線進行降功率操作,由3.5GW降至3.3GW操作正常。1時5分20秒,后臺報出“35小室GPS-B碼同步時鐘屏失步告警”,瞬時復(fù)歸。1時6分0秒起,后臺頻繁報出:事件處理系統(tǒng)與服務(wù)器1、事件處理系統(tǒng)與服務(wù)器2、極1極控系統(tǒng)與服務(wù)器1、極1極控系統(tǒng)與服務(wù)器2等各裝置與服務(wù)器之間通訊故障報文,均短時復(fù)歸。1時7分30秒起,后臺再次頻繁報出:直流站控系統(tǒng)分脈沖故障,極1極控系統(tǒng)裝置對時故障,極1直流極保護系統(tǒng)A、B、CHCM200軟件告警,極1直流濾波器保護系統(tǒng)A、B HCM200軟件告警等對時異常報文,亦短時復(fù)歸。
交流站控、直流站控、極保護裝置在發(fā)生告警時相應(yīng)屏柜報警紅燈亮,報警復(fù)歸后紅燈滅。對GPS主時鐘屏GPS主機及擴展裝置進行檢查,未發(fā)現(xiàn)異常?,F(xiàn)場運維人員檢查服務(wù)器1、2上的對象、歷史、前置、對時進程,發(fā)現(xiàn)上述程序頻繁刷新在線/離線信息?,F(xiàn)場人員初步分析為GPS對時異常導致服務(wù)器進程頻繁在線/離線,現(xiàn)場立即對服務(wù)器2對象、歷史、前置、對時進程進行關(guān)閉操作。2時55分,經(jīng)多次嘗試后,服務(wù)器1、2相關(guān)進程關(guān)閉成功。
由于服務(wù)器1、2上的對象、歷史、前置、對時進程頻繁刷新在線/離線信息,膠東站發(fā)出主控站切換請求命令,銀川東站無法進行主控站釋放操作,同時OWS顯示設(shè)備狀態(tài)同步在無效狀態(tài)和有效狀態(tài)頻繁轉(zhuǎn)換。
為避免GPS對時異常再次導致服務(wù)器進程紊亂,現(xiàn)場僅啟動服務(wù)器2對象、歷史、前置進程。為保證直流功率升降可靠,08:00功率升降完畢后,銀川東換流站申請將銀東直流銀川東站系統(tǒng)層控制級別由系統(tǒng)主控站切換至系統(tǒng)從站,隨后將服務(wù)器1對象、歷史、前置進程啟動成功,OWS監(jiān)視系統(tǒng)數(shù)據(jù)狀態(tài)正常。
通過對銀川東換流站GPS對時故障進行分析,發(fā)現(xiàn)該故障是因為主時鐘對時異常及服務(wù)器對時異常而導致的,需對主時鐘及服務(wù)器對時進行改進,避免該故障再次發(fā)生影響銀東直流安全穩(wěn)定運行。
目前常用的時鐘同步源有無線電授時、衛(wèi)星授時、網(wǎng)絡(luò)授時[1],后兩種方式常用于電力系統(tǒng)的時鐘同步,而目前站內(nèi)自動化設(shè)備對時方式常用的有:脈沖對時(硬接點)、串口報文對時、時間編碼對時(B碼對時)、網(wǎng)絡(luò)對時(SNTP對時)[2]。
針對銀川東換流站主時鐘對時異常及服務(wù)器對時異常的現(xiàn)狀,本文對目前常用的對時方式、主時鐘及服務(wù)器時鐘同步的原理及其所發(fā)生的異常情況進行分析。
1.1主時鐘同步原理及異常分析
時間同步裝置[3]主要由接收單元、時鐘單元和輸出單元3部分組成。接收單元以接收的無線和有線時間基準信號作為外部時間基準(主要接收GPS、北斗衛(wèi)星信號和IRIG-B碼),接收單元含有內(nèi)部時鐘源(晶體鐘或原子鐘)。時鐘單元從接收單元獲取時間源,并按優(yōu)先級選擇一路時間源為當前使用時間源。時鐘單元使用選中的時間源對內(nèi)部時鐘源對時,使內(nèi)部時鐘源與外部源同步,然后以內(nèi)部時鐘控制輸出單元輸出信號。輸出單元輸出各類時間同步信號和時間信息。
為查找銀川東換流站主時鐘故障原因,自7月12日晚間開始,現(xiàn)場采用英國Time&Frequency Solutions公司生產(chǎn)的精密時鐘監(jiān)測裝置TIMEACC-001對銀川東站上海泰坦TIMEDA2000裝置及擴展裝置輸出時鐘信號監(jiān)測,其監(jiān)測原理如圖1所示。
圖1 時鐘監(jiān)測原理
由國網(wǎng)寧夏電科院采用專用測試儀對交換機上所獲得的NTP時鐘信號進行監(jiān)測,表1為截取的部分報文。TIMEACC-001裝置測得擴展時鐘IRIG-B信號發(fā)生+3 s跳變,第三幀報文本應(yīng)為第16 s,但測量值為第19 s,即被測量擴展時鐘輸出的B碼時間發(fā)生+3 s的跳變(見表1)。
表1 B碼信號跳變記錄
同時,國網(wǎng)寧夏電科院測試儀在交換機處同樣測得交換機上時鐘發(fā)生3 s跳變,顯示NTP信號的秒級偏差為+3 s,跳變時間持續(xù)6 min左右。TIMEACC-001裝置測得擴展時鐘IRIG-B信號再次發(fā)生+3 s跳變。
同樣,國網(wǎng)寧夏電科院測試儀在交換機處同樣測得交換機上時鐘再次發(fā)生3 s跳變,顯示NTP信號的秒級偏差為+3 s,時間反復(fù)持續(xù)跳變36min左右。
對2個設(shè)備的測量數(shù)據(jù)進行了比對,以上2個時間段的時間異常跳變現(xiàn)象基本一致。
對許繼服務(wù)器日志文件進行對應(yīng)時間檢查,發(fā)現(xiàn)在同一個時間段內(nèi),許繼服務(wù)器日志文件記錄時間也出現(xiàn)跳變,異常報文為:
10:37:22ND_rcll xntpd[5099]:synchronisation
10:37:22ND_rcll abovemessage repeats2 times……
10:54:47ND_rcllxntpd[5099]:synchronized to 192. 168.100.99,still
10:54:47ND_rcllxntpd[5099]:synchronized to192. 168.101.99,still
通過調(diào)取TIMEACC-001精密時鐘監(jiān)測裝置內(nèi)部日志文件發(fā)現(xiàn)輸出的多條告警日志均顯示接收模塊接收的異常信號來自空中、衛(wèi)星接收模塊無法識別的異常信號,時間點與后臺報文、服務(wù)器日志一致,可判斷當時外部衛(wèi)星信號存在干擾。
經(jīng)排查發(fā)現(xiàn)距離銀川東換流站直線距離7 km處330 kV甜水河變電站在同一時段主時鐘(BD/ GPS)也出現(xiàn)對時信號丟失現(xiàn)象,進一步驗證了當時外部衛(wèi)星信號存在干擾。
由于發(fā)生的故障情況及后臺報文與故障時現(xiàn)象一致,經(jīng)初步分析時間輸出異常的原因為:上海泰坦TIMEDA2000裝置時鐘因外部輸入信號源干擾導致主時鐘對時異常,由于軟件針對此類干擾的過濾機制不完善,輸出信號出現(xiàn)時間跳變,影響到后端對時設(shè)備的正常運行,干擾源由于技術(shù)手段限制暫無法查明。
由此可知,上海泰坦時鐘同步裝置容錯機制不足,當外部信號存在異常時錯誤輸出時鐘信號,導致站內(nèi)極控系統(tǒng)、保護裝置及OWS監(jiān)控系統(tǒng)等裝置發(fā)生對時異常,影響了直流功率控制及系統(tǒng)穩(wěn)定性。
1.2服務(wù)器對時工作原理及異常分析
1.2.1 SNTP協(xié)議工作原理
SNTP協(xié)議[4]采用客戶端/服務(wù)器工作方式,時鐘服務(wù)器通過接收GPS信號或自帶的原子鐘作為系統(tǒng)的時間基準,客戶機通過定期訪問服務(wù)器提供的時間服務(wù)獲得準確的時間信息,并調(diào)整自己的系統(tǒng)時鐘,達到網(wǎng)絡(luò)時間同步的目的??蛻舳伺c服務(wù)器的通訊采用TCP協(xié)議,端口為123。如圖2所示,擴展裝置與GPS主時鐘同步后,通過網(wǎng)口輸出時鐘信號至交換機,交換機上所連的服務(wù)器等設(shè)備配置為SNTP對時后即可實現(xiàn)與主時鐘的同步。
圖2監(jiān)控服務(wù)器與遠動服務(wù)器NTP對時網(wǎng)絡(luò)
1.2.2 前置通信通道重連機制
為保證通信數(shù)據(jù)的完整性,在前置通信和控制保護主機之間的數(shù)據(jù)報文存在確認機制[5],只有收到上位機確認的報文中的數(shù)據(jù),控制保護主機才認為是已經(jīng)成功發(fā)送,否則會重新發(fā)送上一次的數(shù)據(jù),直到收到確認為止。如圖3所示,控制保護主機在收到10號報文的確認報文后,開始發(fā)送下一幀報文(11號報文),由于未收到前置機11號報文的確認報文,控保主機持續(xù)發(fā)送11號報文直至收到該報文的確認報文。
圖3典型數(shù)據(jù)確認流程
異常判斷機制如下:前置通信程序在每個通道的連接過程中,會一直不停地判斷通道是否正常,正常的依據(jù)是“在一定時間周期內(nèi)接收到有效數(shù)據(jù)幀,并且數(shù)據(jù)幀的序號正確”。前置通信程序會在以下兩種情況下認為通信已經(jīng)斷開,重新初始化通訊鏈路后發(fā)起連接請求,重新建立連接:
(1)序號錯誤。在通信過程中,只有3種數(shù)據(jù)幀序號是正確的,一種是和上一幀序號一致(報文確認未成功,重發(fā)報文);第二種是上一幀序號+1(一幀新的報文);第3種是0(序號已滿,重新計數(shù))。在去除以上3種情況下的報文幀序號,認為是錯誤的序號,如圖4所示下一幀報文不是21,比較報文序號錯誤。
(2)接收超時。經(jīng)檢查,在銀川東換流站的前置通信程序中,設(shè)置的超時時間是10 s,即在10 s時間內(nèi),如果一直沒有接收到正確的數(shù)據(jù),則認為該鏈路通信異常。
其中接收超時的判斷依據(jù)是:上一幀有效接收數(shù)據(jù)的時間到服務(wù)器當前時間的差值,大于10 s。如圖4所示。
圖4典型的數(shù)據(jù)序號異常判斷流程
典型的接收超時異常判斷流程如圖5所示。(以當前序號20為例)
圖5典型的數(shù)據(jù)序號接收超時異常判斷流程
服務(wù)器在程序出現(xiàn)異常信息時,會按照事件發(fā)生的先后順序?qū)⑿蛱?、服?wù)器系統(tǒng)時標、異常信息記錄到日志文件中。在時鐘正常情況下,順序記錄的日志時標應(yīng)該一直向前;但通過查詢服務(wù)器運行日志記錄,發(fā)現(xiàn)系統(tǒng)時標發(fā)生多次回跳現(xiàn)象,服務(wù)器1與服務(wù)器2運行日志中均有時標回跳記錄。
服務(wù)器1中的異常信息“2016-7-12 1:25:8 Update node state with time exception(later<previous)(100Times)!”和時間跳變有關(guān)。該信息記錄了計算機節(jié)點向?qū)ο蠓?wù)注冊時,檢測到本次注冊時間比上一次注冊時間還要早,即出現(xiàn)了時間回跳現(xiàn)象。服務(wù)器2記錄中的異常信息“2016-7-12 2:16:21 SER事件(serType=102,status=130485)報送順序異?!睘楸敬蜸ER的時標比上一次同一個事件的時間(2016-7-12 2:18:8)還早,也是出現(xiàn)了時間回跳現(xiàn)象。
當GPS時鐘發(fā)生時間跳變時,由于服務(wù)器的對時程序沒有進行時間濾波,引起服務(wù)器的時標跟隨跳變;同時前置服務(wù)的通道接收數(shù)據(jù)有超時判斷條件,即上一次接收數(shù)據(jù)的時間和服務(wù)器當前系統(tǒng)時間有差值。當時間跳變時,會導致前置通信判定通道接收超時,當前鏈路會斷開,數(shù)據(jù)置為無效,然后重新建立連接,連接建立成功后,數(shù)據(jù)恢復(fù)正常。持續(xù)的時間跳變又會引起接收超時,導致鏈路初始化,引起的現(xiàn)象就是通信時斷時續(xù)。
由此可知,許繼服務(wù)器及控制保護主機過度依賴外部時鐘源,對時方式采用的是SNTP協(xié)議客戶端,該協(xié)議沒有時間濾波功能,即對于GPS時鐘輸出不穩(wěn)定的時間時,不能完成時間過濾和停止對時功能,會引起站控系統(tǒng)服務(wù)器的時間不穩(wěn)定現(xiàn)象發(fā)生,導致站內(nèi)無法進行功率升降等運行操作,嚴重影響了系統(tǒng)的安全穩(wěn)定運行。
通過上述分析可知,主時鐘裝置作為全站所有二次裝置的時鐘來源,其時鐘輸出精度及誤差率將影響全站對時準確性。由于上海泰坦公司時鐘同步裝置容錯機制不足,當外部信號存在異常時錯誤輸出時鐘信號,導致了全站二次裝置對時異常。
針對該問題,本文采用外部衛(wèi)星時鐘與內(nèi)部時鐘相結(jié)合的方式進行時鐘輸出,對主時鐘裝置對外部衛(wèi)星信號進行抗干擾處理,即初始化時將外部衛(wèi)星時鐘信號同步至自身內(nèi)部時鐘,使二者保持一致。
正常運行時,將接收到的衛(wèi)星時鐘與內(nèi)部時鐘進行對比,當二者誤差在100μs以內(nèi),則認為外部時鐘信號無誤,輸出該衛(wèi)星時鐘,并將內(nèi)部時鐘與之同步;當二者誤差大于100μs,則認為外部時鐘信號存在干擾,則輸出內(nèi)部時鐘,并記錄該“異常時鐘”;僅當該“異常時鐘”連續(xù)多次穩(wěn)定、可靠、準確的遞增時,則判斷為時鐘有效,重新輸出該時鐘,并與內(nèi)部時鐘同步。另外,要求時鐘裝置采用內(nèi)部時鐘時,符合規(guī)范要求,守時誤差10min內(nèi)應(yīng)小于4μs。
通過以上分析可知服務(wù)器對時采用SNTP協(xié)議,該協(xié)議使用前置通信通道重連機制,在本次故障發(fā)生時,主時鐘輸出的GPS時鐘時間發(fā)生了跳變,以時間跳躍10min為例還原。如當前時間是1:10:05為例,下一次對時正確的時間應(yīng)為1:10:15,實際時間跳變?yōu)?:20:15,如圖6所示,當前置機接收到1:20:15的報文時,誤認為接收時間大于10 s,判為接收超時,鏈路中斷,重新進行連接,導致通信鏈路時通時斷。
圖6 GPS時鐘跳變前置通信重連流程
許繼服務(wù)器及控制保護主機采用SNTP協(xié)議對時,該協(xié)議沒有時間濾波功能,當時鐘信號出現(xiàn)故障時誤判為接收超時,重啟鏈路,導致通信時斷時續(xù)。
針對該問題,本文以服務(wù)器對時功能優(yōu)化鏈路超時為判斷依據(jù),增加定時器及計數(shù)器,將超時判斷依據(jù)由原來的計算時間差改為定周期計數(shù),當一定周期內(nèi)接收不到正確數(shù)據(jù)時,報告前置服務(wù)的通道接收數(shù)據(jù)異常信息,并重新復(fù)位通道。這樣判定條件就與系統(tǒng)時標無關(guān),保證系統(tǒng)的正常運行,在時間過濾方面留有一定的裕度,避免因過度依賴對時系統(tǒng)造成OWS系統(tǒng)出現(xiàn)異常。
通過對主時鐘及服務(wù)器對時進行改進后,將銀川東換流站服務(wù)器裝置進行升級。并對該服務(wù)器進行了運行監(jiān)視,北京時間9月11日20時14分,上海泰坦公司時鐘裝置上報了“BD/GPS衛(wèi)星信號異?!眻笪?,時間持續(xù)4min,并通過TIME ACC-001裝置監(jiān)測到原主時鐘輸出時鐘再次發(fā)生時鐘跳變,但OWS服務(wù)器并未報出通信中斷報文。
試驗證明通過對服務(wù)器對時協(xié)議的升級,能夠?qū)ν獠枯斎霑r鐘進行濾波,當時鐘信號出現(xiàn)短時故障時不會出現(xiàn)服務(wù)器通信中斷,滿足運行穩(wěn)定性要求。
同時,對泰坦公司主時鐘裝置進行升級,增加了裝置容錯機制及內(nèi)部時鐘守時機制。接著,該主時鐘進行了運行監(jiān)視,北京時間9月28日04時33分,時間持續(xù)3min,上海泰坦時鐘裝置上報了“BD/GPS衛(wèi)星信號異?!眻笪模鳷IME ACC-001裝置并未監(jiān)測到對時裝置輸出時鐘信號異常,服務(wù)器及站內(nèi)裝置對時均未出現(xiàn)異常。
經(jīng)過長達6個月的跟蹤測試,期間發(fā)生多次GPS/BD衛(wèi)星信號異常,主時鐘輸出信號均正確,站內(nèi)服務(wù)器及直流裝置未發(fā)生對時異常情況。試驗證明,相對于之前主時鐘無法抗外部GPS/BD信號源干擾,服務(wù)器無法抗對時信號輸出異常干擾,裝置升級后,主時鐘及服務(wù)器在外部出現(xiàn)異常時,可100%對抗異常干擾。主時鐘能夠靠自身守時功能確保輸出時鐘信號正確無誤,滿足運行穩(wěn)定性要求。
(1)銀川東換流站主時鐘及服務(wù)器對時異常故障是由于換流站主時鐘及服務(wù)器對時存在容錯機制不足、中斷判據(jù)不合理等因素造成的。
(2)改進方案分別對主時鐘增加裝置容錯機制及內(nèi)部時鐘守時機制,服務(wù)器系統(tǒng)增加對時抗干擾機制,有效防止了由于外部GPS/BD時鐘信號干擾引起的主時鐘輸出信號異常,使服務(wù)器能夠有效抗對時信號異常、短時時鐘信號異常或中斷,保持服務(wù)器通信正常,滿足了運行穩(wěn)定性要求。
(3)該改進方案可用于同類型換流站增強主時鐘抗外部GPS/BD信號干擾及服務(wù)器抗對時信號異常能力,確保站內(nèi)裝置對時服務(wù)功能的穩(wěn)定性和可靠性。
[1] 張信權(quán),梁德勝,趙希才.時鐘同步技術(shù)及其在變電站中的應(yīng)用[J].電力系統(tǒng)保護與控制,2008,36(9):69-72.
[2] 于躍海,張道農(nóng),胡永輝,等.電力系統(tǒng)時間同步方案[J].電力系統(tǒng)自動化,2008,32(7):82-86.
[3] 張鵬.基于GPS的電力系統(tǒng)同步時間服務(wù)系統(tǒng)的研究與實現(xiàn)[D].華中科技大學,2005.
[4] 馬素剛,孟偉君.基于SNTP的網(wǎng)絡(luò)時鐘軟件設(shè)計與實現(xiàn)[J].西安郵電大學學報,2009,14(3):98-101.
[5] 楊春瑜.基于多組冗余控制器的高精度對時系統(tǒng)設(shè)計[J].自動化與儀器儀表,2015(8):53-56.
Faultanalysison GPS time synchronization abnormality of themaster clock and server in converter station
ZHANG Siqi1,LIZhiyuan2,LILei1,ZOU Hongsen1,WANG Hongli1
(1.Maintenance FilialeofStateGrid Ningxia Power Co.,Yinchuan Ningxia 750011,China; 2.Ningdong Power Supply FilialeofNingxia Power Co.,Yinchuan Ningxia 750411,China)
Aiming at the problem of time setting abnormality of the master clock and server in Yinchuan Eastern Converter Station,By analyzing the GPS time synchronization principle of the master clock and server,puts forward the solution scheme that to add device fault-tolerantmechanism and internal clock punctualitymechanism for themaster clock,to add time setting anti-interference mechanism for server system.The application result shows that the scheme effectively improves the anti-interference capability of the externalsignal for the themaster clock and server,at the same time improves the stability of theequipmentsoperation in the converterstation.
clock synchronization;standard clock;master clock;server;time settingabnormality
TM 76
A
1672-3643(2017)02-0018-05
10.3969/j.issn.1672-3643.2017.02.004
2016-12-11
張思齊(1988),女,工程師,從事變電站運維工作。
有效訪問地址:http://dx.doi.org/10.3969/j.issn.1672-3643.2017.02.004