陳森 梁爽 陳晨 于士謙 侯俊飛
(許繼電氣股份有限公司,河南 許昌 461000)
目前,國內(nèi)電力生產(chǎn)運行、經(jīng)營管理所使用的繼電保護(hù)電力專用芯片依賴于進(jìn)口。隨著芯片和信息安全的重要性日益突出,一旦出現(xiàn)類似華為芯片禁令事件,就無法保證電網(wǎng)所需的繼電保護(hù)裝置等電力設(shè)備的正常供應(yīng)。為此,加快推進(jìn)國產(chǎn)化的自主可控新一代繼電保護(hù)裝置的研制進(jìn)度,并盡快成熟應(yīng)用,著力解決核心技術(shù)的“卡脖子”問題就顯得尤為重要[1]。
繼電保護(hù)裝置在電網(wǎng)系統(tǒng)或設(shè)備出現(xiàn)故障后,能及時反應(yīng)并發(fā)出故障信號,并以斷路器跳閘的方式將故障位置進(jìn)行隔離,從而對電網(wǎng)其他系統(tǒng)和設(shè)備進(jìn)行保護(hù)[2]。繼電保護(hù)裝置一旦投入正式運行,就要不間斷工作10 年以上,且要受到極端自然環(huán)境的考驗,極易導(dǎo)致繼電保護(hù)裝置出現(xiàn)功能受損等問題,從而引起電力系統(tǒng)的連鎖反應(yīng),因繼電保護(hù)裝置本身出現(xiàn)異?;蚬收蠈?dǎo)致系統(tǒng)無法正常運行,嚴(yán)重時會導(dǎo)致重大的財產(chǎn)損失和人員傷亡等[3]。
繼電保護(hù)裝置出現(xiàn)的故障有以下5種[4]。①繼電保護(hù)裝置供電電源輸出功率不穩(wěn)定,從而導(dǎo)致保護(hù)裝置判斷不準(zhǔn)確。②繼電保護(hù)裝置插件上的零部件損壞導(dǎo)致裝置出現(xiàn)故障,最終導(dǎo)致保護(hù)裝置失靈。③繼電保護(hù)裝置長期處于強(qiáng)電磁環(huán)境中,導(dǎo)致保護(hù)邏輯出現(xiàn)誤動作。④站用直流系統(tǒng)出現(xiàn)故障。如電壓降低將導(dǎo)致保護(hù)裝置異常,直流接地會導(dǎo)致保護(hù)裝置誤動或拒動等。⑤斷路器控制回路故障。如斷路器控制回路斷線造成斷路器無法正常分閘、合閘,從而出現(xiàn)故障不能切除、越級跳閘等問題。
某型號110 kV 變壓器保護(hù)裝置為自主可控新一代智能變電站的繼電保護(hù)裝置,該裝置從軟件到硬件已全部實現(xiàn)國產(chǎn)化。
繼電保護(hù)裝置在中試測試模擬現(xiàn)場發(fā)生低壓1分支復(fù)壓過流故障,保護(hù)裝置的低壓1 分支復(fù)壓過流保護(hù)可靠動作,但不出口。為了查看保護(hù)裝置的采樣值是否符合檢測標(biāo)準(zhǔn)的精度要求,通過繼電保護(hù)測試儀給該裝置施加穩(wěn)定的電壓和電流,分別查看裝置的就地保護(hù)板和啟動板的采樣值,發(fā)現(xiàn)保護(hù)板的采樣值均正常,但啟動板的低壓側(cè)電壓和電流采樣數(shù)據(jù)均為0,繼續(xù)查看零漂菜單,低壓側(cè)電壓電流零漂值均為非0。
發(fā)現(xiàn)問題后要及時向設(shè)計人員及項目負(fù)責(zé)人進(jìn)行反饋。為了便于查清問題產(chǎn)生的原因,采取保留問題現(xiàn)場的措施,未對問題裝置進(jìn)行斷電重啟、插拔插件等操作,決定在另一個同型號的裝置上復(fù)現(xiàn)該問題,驗證該問題是否與預(yù)想問題的產(chǎn)生原因一致,待故障現(xiàn)象復(fù)現(xiàn)后,才能對問題進(jìn)行正確的定位、解決以及驗證。
繼電保護(hù)裝置的硬件核心架構(gòu)的示意圖見圖1。
圖1 裝置硬件核心架構(gòu)示意圖
啟動CPU 插件和保護(hù)CPU 插件都擁有獨立的內(nèi)存、Flash、FPGA 及ADC 模塊,保護(hù)邏輯完全相同。2 套系統(tǒng)并行運行,啟動CPU 控制啟動繼電器,保護(hù)CPU 控制出口繼電器,啟動CPU 和保護(hù)CPU 的保護(hù)邏輯同時滿足的情況下才能出口跳閘,雙CPU架構(gòu)極大地提高繼電保護(hù)裝置的可靠性。
通過閱讀源碼程序、調(diào)試、實時仿真、日志分析等方法,首先排除該問題是因程序設(shè)計所導(dǎo)致的,最終確定有可能是硬件故障導(dǎo)致的。
該裝置在中試測試過程中,低壓1 分支復(fù)壓過流保護(hù)可靠動作但不出口的根本原因是啟動板采樣出現(xiàn)問題。因繼電保護(hù)的保護(hù)出口邏輯采用“啟動+跳閘”的串聯(lián)控制邏輯,只有啟動CPU、保護(hù)CPU 同時動作時,裝置才會動作。其中,啟動板所屬的低壓側(cè)電壓、電流采樣數(shù)據(jù)均為0,可進(jìn)一步推斷故障發(fā)生在啟動CPU 板上,尤其是啟動CPU 板上的相關(guān)采樣電路。由于故障過程中的采樣數(shù)據(jù)均為0,打開啟動CPU 板的硬件電路,其中FPGA 與AD 芯片示意圖見圖2。
由圖2 可知,啟動CPU 插件共有9 片AD7656(AD 芯片型號)。其中,1 片AD7656 用來采集5 V和2 組±15 V 電源,并用于電源的自檢,其余8 片用來采集模擬量,2 個±15 V 電源作為電源輸出模塊,分別為2 個4 片的AD7656 供電,且這4 片AD7656由同一個±15 V電源進(jìn)行供電。
圖2 FPGA與AD芯片示意圖
因低壓側(cè)采樣數(shù)據(jù)為0,極有可能是其中的4片AD 芯片無法采集到的模擬量,啟動CPU 插件的AD芯片供電部分,其原理圖見圖3、圖4。
圖3 1~24路供電部分原理圖
圖4 25~48路供電部分原理圖
通過測試分析,初步確定±15 V電源供電的AD芯片采集異常,使用萬用表分別測量1~24 路AD電源芯片供電電壓±15.0 VCC1 和25~48 路AD 電源芯片的供電電壓±15.0 VCC2。其中,+15.0 VCC2實測約為1.2 V、-15.0 VCC2 實測約為0.1 V,即25~48 路AD 電源芯片的供電電壓±15.0 VCC2 出現(xiàn)異常。將25~48 路AD 電源芯片L5 和L6 電感去掉,U14 的輸出±15 V 均正常,使用萬用表測量+15.0 VCC2、-15.0 VCC2之間的電阻,測量值為0。因此,初步判定是因為AD芯片或電容短路。
AD芯片的原理圖見圖5,將與±15.0 VCC2連接的電容C32、C33、C37、C38、C711、C712、C713、C714逐個去掉(其他電容保留),經(jīng)排查后發(fā)現(xiàn),將C714(0603-25 V-10 μF-X5R)電容去掉后,裝置出現(xiàn)的現(xiàn)象與問題現(xiàn)場保留的裝置現(xiàn)象完全一致。將更換新電容的啟動CPU插件插入裝置,給低壓側(cè)模擬量施加額定電壓和額定電流,啟動板的低壓側(cè)采樣數(shù)據(jù)恢復(fù)正常。由此最終確定采樣故障發(fā)生的原因。
圖5 AD芯片原理圖
對失效電容進(jìn)行失效分析,其中外觀檢查、紋波電壓測試、紋波電流測試等均正常,而電性能測試、破壞性物理分析(DPA)、電容溫度測試出現(xiàn)異常現(xiàn)象。
4.1.1 外觀檢查。未發(fā)現(xiàn)樣品的瓷體有裂紋、缺損等。
4.1.2 電性能測試。送檢電容型號為0603/25 V/10 μF、實驗室溫度為25.3 ℃、濕度為55%,使用HP 4284A LRC 電容器測試儀和HP 4239A 絕緣電阻測試儀對電容進(jìn)行電性能測試,測試條件為C/DF 為1 kHz、1.0V,IR 為25 V,測試時間為1 min。電性能測試結(jié)果見表1。
表1 常溫電性能測試結(jié)果
4.1.3 破壞性物理分析(DPA)。對失效電容進(jìn)行DPA 研磨,內(nèi)部存在過載擊穿現(xiàn)象,擊穿后裂紋向兩邊延伸,如圖6所示。
圖6 樣品研磨局部放大圖
經(jīng)外觀檢查、電性能測試和破壞性物理分析(DPA),并結(jié)合片式多層瓷介電容器典型失效模式、類似失效案例和積累的失效產(chǎn)品圖片資料,此次失效可能是電容器在使用或測試過程中遭受異常大電壓或大電流沖擊,從而導(dǎo)致電容器內(nèi)部被擊穿,擊穿后形成的裂紋向內(nèi)電極方向兩端延伸,并穿過內(nèi)電極,導(dǎo)致電容器絕緣電阻下降。
紋波電流或電壓是指電流中的高次諧波成分帶來的電流或電壓幅值的變化,可能會導(dǎo)致?lián)舸?。由于使用的是交流電,會在電容上發(fā)生耗散。如果電流的紋波成分過大,超過電容的最大容許紋波電流,會導(dǎo)致電容被燒毀。
4.2.1 紋波電壓測試。U40A(AD芯片AD7656)電源管腳VDD和VSS處電容C606、C608安裝了不同容值的電容(0603-25 V-10 μF-X5R、0603-50 V-1 μF-X7R),U40A 電源管腳VDD 和VSS 處的紋波電壓相差不大。U40A電源管腳如圖7所示。
4.2.2 紋波電流測試。將圖7 中與U40A 電源管腳相通的電容C608 的一個管腳直接與焊盤連接,另一個管腳經(jīng)導(dǎo)線與焊盤連接,瞬態(tài)電流僅為3 mA。將D16 去掉,改成導(dǎo)線連接,其紋波電流約為32 mA。流經(jīng)D29 的總電流(-15 VCC1)約為31 mA,其紋波電流約為5 mA。
圖7 U40A電源管腳
在電容溫度測試中,將智能IO 插件的11 路硬壓板開入接DC220V,為解決測試電容溫度時熱耦接觸不可靠問題,用北極銀導(dǎo)熱硅脂均勻涂抹在熱耦上,以盡可能接近電容本體溫度,電容本體溫度如圖8 所示。
圖8 電容本體溫度
從溫度測試結(jié)果可知,電容溫度最高可達(dá)84.4 ℃,接近運行工作溫度的上限,考慮到環(huán)境溫度和熱耦接觸緊密程度帶來的誤差,電容本體溫度可能超過85 ℃。
在未經(jīng)失效分析測試前,懷疑電容短路是由大電壓、大電流擊穿造成的,但通過紋波電流測試,AD啟動數(shù)模轉(zhuǎn)換所需的瞬態(tài)電流約為32 mA,此瞬態(tài)電流即使全部由電容(0603-25 V-10 μF-X5R,以下簡稱X5R)提供,也不足以損壞電容。因此,可初步排除大電流沖擊損壞,考慮是電壓擊穿。X5R 電容的工作溫度為-55~85 ℃。在85℃時,X5R 電容的額定電壓降額至70%,廠家推薦工作溫度不應(yīng)超過85 ℃,超過85 ℃后,電壓和溫度曲線不再是線性關(guān)系。其中,X5R 電容的電壓和溫度線性關(guān)系圖見圖9。
圖9 電壓和溫度線性關(guān)系圖
將啟動CPU插件上的AD電源回路中燒壞的電容(0603-25 V-10 μF-X5R)更換成工作溫度范圍更廣、可靠性更高的電容(0603-50 V-1 μF-X7R)后,再對該裝置的可靠性進(jìn)行測試,該裝置再未出現(xiàn)低壓側(cè)啟動板無法采樣的現(xiàn)象。
對繼電保護(hù)裝置,尤其是自主可控新一代繼電保護(hù)裝置進(jìn)行試驗具有重要意義。通過模擬繼電保護(hù)裝置在自然環(huán)境中正常運行所遇到的各種復(fù)雜狀況,盡可能找到設(shè)計中存在的缺陷,從而消除缺陷。從整機(jī)散熱到元器件選型,任何一個瑕疵都有可能成為引起整個裝置系統(tǒng)崩潰的元兇,所以選擇可靠的元器件是最基礎(chǔ)的,也是最不容忽視的關(guān)鍵一步。