閆鵬程, 張超銀, 孫全勝, 尚松行, 尹妮妮, 張孝飛
1. 安徽理工大學, 深部煤礦采動響應與災害防控國家重點實驗室, 安徽 淮南 232001
2. 安徽理工大學電氣與信息工程學院, 安徽 淮南 232001
自20世紀70年代以來, 我國的經(jīng)濟迅速地發(fā)展, 電力工業(yè)也相應地大規(guī)模壯大, 導致電力變壓器的使用日益增多[1-2]。 根據(jù)國家電力聯(lián)合會的相關統(tǒng)計, 2021年1月—2月份, 全社會用電量為12 588億kW時, 同比增長22.2%, 全國工業(yè)用電量比制造業(yè)用電量增加1 846億kW時。 發(fā)電機組保持綠色發(fā)展, 核能、 風能、 水能等能源的發(fā)電量均有提升, 其中燃氣發(fā)電機組容量超過一億千瓦, 裝機容量的增加, 對電網(wǎng)中的關鍵設備要求更高[3-4]。 煤炭發(fā)電是電力生產(chǎn)的主要能源, 煤礦中的電力變壓器更是在電能傳輸中起關鍵作用。 因此, 定期對煤礦變壓器檢測維護顯得十分重要。 電力變壓器常見的故障為電性故障、 局部受潮以及熱性故障。 電性故障主要表現(xiàn)為短路故障, 比如單相對地短路、 兩相對地短路、 三相之間的短路, 出口處短路最為常見。 局部受潮表現(xiàn)為套管部位密封不嚴謹, 儲油柜內(nèi)有積水等, 電力變壓器油中摻雜水分會影響其絕緣特性[5-8]。 異常電流過熱會導致電力變壓器出現(xiàn)熱性故障, 比如渦流、 環(huán)流等因素, 都會引起電流的瞬間增加, 引起電力變壓器出現(xiàn)故障[9-10]。
目前對電力變壓器油檢測的方法大多是氣相色譜法, 這種方法操作比較復雜, 不適合在線檢測, 不能快速地檢查出故障原因[11-14]。 本文提出激光誘導熒光光譜技術結合ELM算法識別出電力變壓器故障類型。 首先, 通過激光打入未知油樣, 得到熒光光譜, 再通過MSC、 SNV預處理算法進行噪聲處理, 采用KPCA與PCA算法對得到的光譜數(shù)據(jù)進行降維, 再經(jīng)過ELM算法識別出電力變壓器的故障類型。
實驗樣本是從黃山市和宿州市的國家電網(wǎng)收集的電力變壓器油樣, 分別為熱性故障油、 電性故障油、 局部受潮油以及原油, 故障油均為單狀態(tài)下的油樣。 每種油樣分別采集50個, 共200個, 存放在密閉無光的容器中。
采用的儀器為美國Ocean optics公司生產(chǎn)的激光誘導熒光光譜儀, 型號為USB2000+, 光譜儀探頭為可浸入式, 型號為FPB-405-V3。 整個油樣的光譜采集流程如圖1所示。
圖1 油樣的光譜采集流程圖
為了防止其他光線的干擾, 整個實驗均在暗室中進行。 由激光發(fā)生器發(fā)射出波長為405 nm的激光, 經(jīng)過光纖傳輸, 到達微型光譜儀探頭, 探頭把激光直接輸出到被測油樣中, 而后接收被測油樣受激發(fā)而產(chǎn)生的熒光, 經(jīng)過過濾器, 篩選出所需要的光譜波段, 再由光纖傳輸?shù)焦庾V儀進行光電信號轉(zhuǎn)換等, 最后經(jīng)數(shù)據(jù)線傳送到主機。 主機上由OceanView軟件顯示熒光光譜, 波長范圍370~1 050 nm, 積分時間100 ms, 多次掃描平均為3, 滑動平均寬度為1。
由于在光譜獲取的過程中, 難免會有一些不確定因素影響光譜圖的質(zhì)量。 第一, 一些干擾噪聲摻雜在生成的光譜圖像中, 會增大光譜數(shù)據(jù)的錯誤概率。 第二, 由于數(shù)據(jù)量大, 數(shù)據(jù)的品質(zhì)不統(tǒng)一。 為了提高高品質(zhì)的數(shù)據(jù), 以便得到更高質(zhì)量的結果, 因此, 我們需要對獲得的光譜數(shù)據(jù)采用兩種預處理方法, 分別為多元散射校正法(MSC)、 標準矢量歸一化法(SNV)。
光譜預處理目前常用的一種方法是多元散射校正算法, 降低散射的影響, 增加光譜數(shù)據(jù)的準確性。 由于難以獲取理想光譜數(shù)據(jù), 因此, 假設所有光譜數(shù)據(jù)的平均值為“理想光譜”。 其次, 將采集的油樣光譜與理想光譜進行一元線性回歸, 得到每個油樣的基線平移量和偏移量。 最后, 校正每個油樣的光譜。
(1)
(2)
(3)
標準矢量歸一化算法的主要作用是削減光程變化、 表面散射等因素的影響。 SNV算法是對光譜陣的行運算的, 處理的對象為某一條光譜。 SNV歸一化的公式
(4)
k=1, 2, …,m;i=1, 2, …,n
兩種預處理算法所生成的圖像和原始圖像進行對比, 如圖2所示, 波段在370~550和900~1 050 nm基本趨于一致,主要不同集中在550~900 nm, 四種波的波峰也主要集中在此, 可以看出有四類不同的波形, 分別代表四種不同的油樣。
圖2 兩種預處理及原始圖像
每個樣本生成的光譜數(shù)據(jù)為2 048個, 一共200個樣本, 由于數(shù)據(jù)維度過大, 會造成模型的復雜性, 因此, 采用PCA與KPCA算法降低數(shù)據(jù)的維度, 減少整個模型的訓練時間。
主成分分析(PCA)是把原來的變量映射到新的變量空間, 在新的變量空間可以用若干個變量替代原來的變量, 并盡可能保留原變量的數(shù)據(jù)內(nèi)容, 新變量之間相互正交, 消除原變量的共線性問題。
核主成分分析(KPCA)是通過核函數(shù)把原始數(shù)據(jù)映射到高維空間, 再利用更高的維度空間進行線性降維。
對預處理后的數(shù)據(jù)和原始數(shù)據(jù)進行降維, 如圖3和圖4所示, 當主成分數(shù)為1時, 只有MSC-PCA和MSC-KPCA的累計貢獻度達到85%以上, 其他模型的累計貢獻度均低于此值。 隨著主成分數(shù)的增加, 累計貢獻度也隨之上升, 因此, 選擇主成分數(shù)為5, MSC-PCA累計貢獻度為95.68%, Original-PCA與SNV-PCA累計貢獻度分別為61.74%和78.58%, MSC-KPCA累計貢獻度達到最高, 為99.00%, Original-KPCA與SNV-KPCA均低于MSC-KPCA的累計貢獻度, 分別為63.84%和84.72%。 結合數(shù)據(jù)可以看出, MSC預處理后的數(shù)據(jù)經(jīng)兩種方式降維效果最好, 累計貢獻度最高。 同時, 經(jīng)預處理比未經(jīng)預處理得到的降維數(shù)據(jù)更佳。
圖3 PCA累積貢獻率
圖4 KPCA累積貢獻率
極限學習機(ELM)是一種前饋神經(jīng)網(wǎng)絡算法, 該算法包含輸入層、 隱含層、 輸出層。 在創(chuàng)建網(wǎng)絡時, 輸入層和隱含層的連接權值以及隱含層神經(jīng)元的閾值均為隨機設定, 且設定以后不再調(diào)整。 隱含層和輸出層之間的連接權值β可通過求以下方程組的最小二乘解獲取
(5)
其解為
(6)
式(6)中,H+為隱含層輸出矩陣H的Moore-Penrose廣義逆。
(1)導入PCA與KPCA降維后的數(shù)據(jù)。
(2)訓練集/測試集的產(chǎn)生。 本實驗采用四種油樣, 每類油樣分別貼入標簽1, 2, 3和4, 即標簽1對應熱性故障油, 標簽2對應電性故障油, 標簽3對應局部受潮油, 標簽4對應原油。 每一種油樣中, 隨機選取40個作為訓練集, 10個為測試集, 共160個訓練集, 40個測試集。
(3)數(shù)據(jù)歸一化, 把不同范圍的數(shù)據(jù)映射到指定的區(qū)間, 減小數(shù)據(jù)差異較大對模型性能的影響, 提高預測模型的收斂速度, 縮短訓練時間。
(4)ELM創(chuàng)建/訓練。 用elmtrain()函數(shù)創(chuàng)建并訓練ELM, 設置隱含層神經(jīng)元個數(shù)以及激活函數(shù)類型, 參數(shù)TYPE設置為0。
(5)ELM仿真測試。 訓練完成后, 用elmpredict()函數(shù)對測試集進行仿真測試。 設置TF和TYPE, 并與訓練函數(shù)參數(shù)保持一致。
(6)繪圖與性能評價。 直觀反映結果, 并作出合理判斷。
由于測試集與訓練集是隨機產(chǎn)生, 因此每次結果都會不同, 某次運行的ELM預測模型擬合, 結果如圖5所示。 預測結果最好的是MSC-KPCA-ELM模型, 預測值與真實值基本一致。 表現(xiàn)效果最差的是未經(jīng)預處理的Original-PCA-ELM, 預測值在真實值周邊波動。 直觀的看, 經(jīng)MSC、 SNV預處理的模型比未經(jīng)預處理的模型預測更為準確。
圖5 ELM測試集輸出模型預測結果對比
各預測模型的性能指標如表1所示, MSC-KPCA-ELM模型最佳, 平均相對誤差MRE為0.96%, 均方根誤差RMSE為0.027 1, 均接近于0。 SNV-KPCA-ELM模型的平均相對誤差MRE為1.74%, 均方根誤差RMSE為0.036, Original-KPCA-ELM模型平均相對誤差MRE為2.41%, 均方根誤差RMSE為0.063 2。 可以看出, 同為KPCA降維的模型, 經(jīng)MSC預處理的效果要好。 MSC-PCA-ELM模型的平均相對誤差MRE為1.18%, 均方根誤差RMSE為0.033 9, 對比后發(fā)現(xiàn), 同為MSC預處理, KPCA-ELM模型比PCA-ELM模型效果更佳。 效果最差的模型是Original-PCA-ELM,平均相對誤差比最佳的模型高2.54%, 均方根誤差RMSE高0.045 9。
表1 ELM測試集輸出模型性能指標對比
MSC預處理后的KPCA-ELM模型運行時間為0.5 s, PCA-ELM模型運行時間為3.296 9 s, 其中KPCA降維的時間為0.437 5 s, PCA降維的時間為3.234 4 s, 可以看出, 由KPCA降維比PCA更快, 同一狀態(tài)下的效果會更好。
相對誤差能夠反映預測值偏離真實值的實際大小, 如圖6所示為ELM測試集輸出結果的相對誤差曲線, 誤差幅度變化較大主要集中在標簽1所對應的油樣, 標簽2, 3和4基本趨于平穩(wěn)。 MSC-KPCA模型的相對誤差波動最小, 為0.12%~3.68%, 驗證出預測結果更為準確。 誤差幅度變化最大的為Original-PCA模型, 最高值為18.74%, 較MSC-PCA模型高出了12.02%, 可以看出, 此模型預測結果相對不佳。
圖6 預測值與真實值的相對誤差曲線
實驗對三種電力變壓器故障油以及原油利用激光誘導熒光光譜分析技術進行數(shù)據(jù)分析, 采用MSC、 SNV兩種預處理方式, 結果發(fā)現(xiàn), MSC預處理后的數(shù)據(jù)經(jīng)KPCA降維, 其主成分貢獻率達到最高, 而未經(jīng)預處理的數(shù)據(jù)經(jīng)兩種降維算法達到的效果均較差。 實驗可見, 經(jīng)KPCA降維的模型運行時間小于PCA, 驗證出使用LIF技術獲取電力變壓器油熒光光譜, 結合MSC-KPCA模型經(jīng)ELM擬合性能最佳, 對檢測電力變壓器故障類型具有一定的可靠性。