董磊 星國龍 張春陽
【摘? 要】某核電站1號機組運行期間發(fā)生UPS(不間斷電源系統(tǒng))故障停機,導(dǎo)致核電站部分重要系統(tǒng)失去冗余電源,本文通過對現(xiàn)場故障記錄查詢及設(shè)備制造廠試驗,分析得到UPS故障停機的直接原因是中央控制卡件A070內(nèi)部芯片RAM1、RAM2損壞,導(dǎo)致A070卡件功能異常,導(dǎo)致UPS系統(tǒng)全面癱瘓,故障停機。為避免該類故障再次發(fā)生,本文提供了改善設(shè)備運行環(huán)境、更換制造品質(zhì)更高的控制芯片等改進方案。
【關(guān)鍵詞】不間斷電源;故障停機;中央控制卡件
2014年6月16日上午,核電站核島不間斷供電系統(tǒng)(LNG)因不明故障停運,母線失電,電氣調(diào)試部分重新啟動后系統(tǒng)無異常報警后恢復(fù)下游送電,未查出原因。6月17日再次出現(xiàn)同類故障,電站專家組討論后對LNG系統(tǒng)進行全面檢查,本文就該故障進行了分析。
1.UPS系統(tǒng)基礎(chǔ)介紹
LNG系統(tǒng)所使用的不間斷電源系統(tǒng)(UPS)設(shè)備由瑞士GUTOR廠家提供,該系統(tǒng)有兩路完全獨立的上游供電,且能實現(xiàn)兩路供電的無擾切換。該系統(tǒng)主要由逆變器001DL、旁路變壓器001TR、靜態(tài)切換開關(guān)EA/EN以及無擾切換開關(guān)501JS共同構(gòu)成。系統(tǒng)的基本結(jié)構(gòu)如圖一所示。
逆變器001DL將上游110V直流電通過IGBT模塊逆變?yōu)?20V交流電,旁路變壓器001TR將上游380V交流電降壓為220V交流電。逆變器和變壓器側(cè)各有一個靜態(tài)切換開關(guān)EA和EN,兩個靜態(tài)開關(guān)互為閉鎖,同一時刻僅有一個能夠?qū)ā?01JS系統(tǒng)狀態(tài)轉(zhuǎn)換開關(guān)有三個位置:AUTO、TEST、BYPASS,正常運行時處于AUTO位置,系統(tǒng)由逆變器帶載,同時旁路變壓器熱備用,通過EA/EN無擾切換供電方式;TEST和BYPASS位置時系統(tǒng)直接通過電纜硬接線由旁路變壓器帶載(如圖一通道3所示)。
2.LNG系統(tǒng)故障停機原因分析
經(jīng)查詢6 月17 日23:07 至23:11 之間的系統(tǒng)故障信息發(fā)現(xiàn),當(dāng)前報警(44、54、57、34、53、12)與正常狀態(tài)下直接關(guān)閉UPS報警的報警相同,系統(tǒng)從23:07 開始頻繁的報警和復(fù)位,最后一次報警后未復(fù)位成功,直接關(guān)機,系統(tǒng)顯示相關(guān)的報警。另外,從系統(tǒng)歷史運行狀態(tài)“60:MPU is reset”出現(xiàn)可初步判斷MPU 芯片重啟導(dǎo)致其他相關(guān)報警出現(xiàn),進而可以初步確定故障由于A070 卡件自身故障或A070 輸入輸出信號異常引起。
2.1 UPS系統(tǒng)A070卡件自身故障
直接導(dǎo)致A070 卡件MPU 芯片重啟的主要原因有MPU 芯片自身故障或供給MPU 的電源瞬時降低超過閾值,直接導(dǎo)致卡件芯片停止工作,A070卡件的自身的故障一般為強制性,無法進行自行復(fù)位,但現(xiàn)場UPS出現(xiàn)多次自動復(fù)位,可以排除卡件自身故障情況。
2.2 UPS系統(tǒng)輸入到A070的信號異常導(dǎo)致MPU芯片重啟失效
A070卡件作為UPS系統(tǒng)主控制卡,主要負責(zé)對獲取的信息進行處理,并通過運算得到輸出數(shù)據(jù),然后再通過其他端口發(fā)送至各個控制模塊,從而實現(xiàn)UPS的穩(wěn)定運行,如果一旦獲取的信號異常就可能導(dǎo)致MPU芯片運算異常,最終導(dǎo)致系統(tǒng)無法正常運行,A070主控卡的信號接口眾多,連接復(fù)雜。但輸入及信號異常都會觸發(fā)UPS系統(tǒng)出現(xiàn)通信錯誤報警,但現(xiàn)場查詢報警記錄未發(fā)現(xiàn)有通信故障報警,可以排除該類情況。
2.3 UPS系統(tǒng)A070卡件附屬芯片故障
UPS系統(tǒng)A070卡件是一塊多層電鍍的集成電路板,卡件上擁有眾多電子元器件,其中最為重要的是MPU芯片及其附屬芯片RAM1、RAM2,其中RAM1/2兩塊芯片主要用于暫存MPU處理得到的數(shù)據(jù),用于后續(xù)對整個系統(tǒng)的控制,如果附屬芯片RAM1/2出現(xiàn)故障,將會導(dǎo)致系統(tǒng)數(shù)據(jù)異常,最終引發(fā)程序紊亂,系統(tǒng)停機。申請制造廠家支持,將A070卡件寄回瑞士總部進行故障定位,廠家對A070卡件的數(shù)據(jù)端口進行分析,發(fā)現(xiàn)A070卡件在運行一段時間后會出現(xiàn)數(shù)據(jù)缺失,系統(tǒng)重新自檢的情況,進一步對MPU的數(shù)據(jù)端口進行采集,發(fā)現(xiàn)MPU與RAM1/2之間的數(shù)據(jù)傳輸出現(xiàn)亂碼,使用全新的RAM1/2芯片進行更換以后,發(fā)現(xiàn)故障消失,數(shù)據(jù)通訊正常,最終確定本次故障的原因就是RAM1/2芯片損壞,導(dǎo)致UPS系統(tǒng)紊亂,引發(fā)系統(tǒng)停機。
3.結(jié)論及改進措施
通過對現(xiàn)場故障記錄查詢及設(shè)備制造廠試驗,最終確定LNG系統(tǒng)UPS整盤失電的直接原因是系統(tǒng)主控制卡A070上的數(shù)據(jù)存儲芯片RAM1/2損壞,導(dǎo)致整個系統(tǒng)內(nèi)部數(shù)據(jù)紊亂,引發(fā)系統(tǒng)停機。
此類卡件故障為該電站首例,十分具有檢修參考價值。為避免該類故障再次發(fā)生,對此提出四項改進措施:1、聯(lián)系瑞士廠家,采購工藝等級更高的存儲芯片,提高系統(tǒng)穩(wěn)定性;2、設(shè)備說明書上建議控制卡件的運行環(huán)境溫度不得超過40℃,現(xiàn)場環(huán)境并不符合要求,建議在卡件運行的廠房加裝定向式空調(diào),用于降低環(huán)境溫度,提高卡件壽命;3、升版UPS系統(tǒng)主控制程序,增加數(shù)據(jù)檢測功能,在數(shù)據(jù)傳輸出現(xiàn)異?,F(xiàn)象時自動報警,并定位傳輸端口,便于及時發(fā)現(xiàn)芯片故障;4、增加存儲芯片冗余設(shè)計,建議設(shè)置RAM3芯片并長期處于熱備用狀態(tài),當(dāng)RAM1/2芯片出現(xiàn)異常故障時及時切換傳輸通道,保證系統(tǒng)不會出現(xiàn)故障停機的情況。同時,可制定UPS老化處理方案,在設(shè)備運行一定期限后對其進行更換,徹底解決此類故障。
參考文獻:
[1]付明星,李靜,許本福.全封閉式疊層母排技術(shù)在核電UPS中的應(yīng)用[J].大亞灣核電,2017,6(3):42-45.
[2]李廣環(huán).UPS電源設(shè)計與運用[J].山東工業(yè)技術(shù),2019,3(4):19-23.
[3]李士濤,李云冬,全利昆.UPS供電系統(tǒng)備份形式分析[J].機電信息,2019,1(3):81-84.
(作者單位:中廣核核電運營有限公司)