曾冬洲,鄭宗華
(福州大學(xué)電氣工程與自動化學(xué)院,福建 福州 350108)
電力變壓器作為電力系統(tǒng)的關(guān)鍵樞紐設(shè)備,其工作狀態(tài)的正常與否直接影響著整個(gè)電力系統(tǒng)運(yùn)行的安全性和可靠性。處于異常狀態(tài)的變壓器,會降低電力系統(tǒng)的供電可靠性甚至造成社會經(jīng)濟(jì)損失。因此對變壓器的異常工作狀態(tài)及時(shí)識別,并進(jìn)行狀態(tài)檢修,能夠在提高設(shè)備可靠性的同時(shí),有效規(guī)避檢修不足及檢修過度等問題[1]。
傳統(tǒng)的變壓器狀態(tài)異常檢測方法主要包括局部放電檢測技術(shù)與油中氣體分析(Dissolved Gas Analysis,DGA)技術(shù)[2-4]。雖然這兩種技術(shù)在變壓器故障診斷方面應(yīng)用較廣,但是也存在一定的弊端。文獻(xiàn)[5]中采用局部放電檢測技術(shù)對疑似異常變壓器開展局部放電檢測時(shí),需要借助工作經(jīng)驗(yàn)開展局部放電定位及定量檢測工作,不僅耗時(shí)耗力,也不能對變壓器故障進(jìn)行及時(shí)有效的識別,影響設(shè)備運(yùn)行的可靠性。文獻(xiàn)[6]中利用油中氣體分析技術(shù)對變壓器異常狀態(tài)進(jìn)行檢測,其缺點(diǎn)在于從局部放電的發(fā)生到可檢測到特征氣體往往需要較長的時(shí)間,很難捕捉到突發(fā)性故障的征跡,實(shí)時(shí)性比較差。同時(shí),傳統(tǒng)的異常檢測技術(shù)主要使用變壓器油分解氣體含量、油色譜和紅紫外線等數(shù)據(jù),未能對變壓器在線監(jiān)測系統(tǒng)中積累的海量電氣監(jiān)測數(shù)據(jù)進(jìn)行有效的利用。
針對傳統(tǒng)變壓器異常檢測方法的不足,本文將變壓器的電壓、電流、功率等在線監(jiān)測數(shù)據(jù)作為特征參量,構(gòu)建一種基于主成分分析和局部離群因子算法的變壓器異常實(shí)時(shí)檢測模型,并通過具體算例分析驗(yàn)證該模型對變壓器異常檢測的有效性和可行性。
針對變壓器的電氣參量數(shù)據(jù)存在特征冗余度高和數(shù)據(jù)量大導(dǎo)致LOF檢測算法耗時(shí)長的問題,本文提出了一種基于主成分分析的LOF檢測算法。首先對原始數(shù)據(jù)歸一化處理,然后利用主成分分析法對數(shù)據(jù)集高維特征進(jìn)行降維,減小后期LOF算法的計(jì)算量,提高變壓器狀態(tài)異常點(diǎn)的檢測效率,最后計(jì)算出所有樣本點(diǎn)的局部離群因子,將離群因子大于設(shè)定閾值δ的樣本點(diǎn)歸為異常點(diǎn)。具體算法流程圖如圖1所示。
圖1 基于主成分分析的LOF檢測算法流程圖
本次實(shí)驗(yàn)采用的數(shù)據(jù)來自某變電站一臺電壓等級為10kV變壓器3個(gè)月的電氣監(jiān)測數(shù)據(jù),數(shù)據(jù)采樣的間隔為15分鐘。變壓器故障數(shù)據(jù)集共含8640個(gè)有效樣本,其中包括102個(gè)狀態(tài)異常點(diǎn)和8538個(gè)狀態(tài)正常點(diǎn),異常點(diǎn)占比僅為1.18%。變壓器監(jiān)測系統(tǒng)主要監(jiān)測的電氣參量包括任意時(shí)刻變壓器高壓側(cè)的三相電壓U1ca、U1ab、U1bc,低壓側(cè)的三相電壓U2a、U2b、U2c,有功功率Pa、Pb、Pc,無功功率Qa、Qb、Qc,共計(jì)12個(gè)電氣參量。
本文在實(shí)驗(yàn)前對數(shù)據(jù)的預(yù)處理工作主要包括:對含有缺失值的樣本采用劃分正常和異常的方法通過各自特征屬性的均值分別進(jìn)行填充。另外,為了消除各特征屬性間量綱的影響,對所有數(shù)據(jù)樣本采用零均值標(biāo)準(zhǔn)化的歸一化方法進(jìn)行處理,歸一化公式如下:
式中,μ和δ分別對應(yīng)于原始數(shù)據(jù)的均值和方差。
本實(shí)驗(yàn)的軟件環(huán)境為 Windows10_64bit,Python 3.5,Jupyter Notebook 5.6.0。硬件環(huán)境為Intel(R)6 Core(TM)i3-3240 3.39GHz CPU,8.0GB 內(nèi)存。
變壓器的異常檢測本質(zhì)上是一個(gè)分類問題,即將所有樣本分成兩類:異常狀態(tài)類和正常狀態(tài)類。本次實(shí)驗(yàn)采用表1中的混淆矩陣對檢測結(jié)果分別進(jìn)行描述,其中TP代表變壓器狀態(tài)實(shí)際為異常,檢測的結(jié)果也是異常的樣本數(shù);FP代表變壓器狀態(tài)實(shí)際為正常,檢測的結(jié)果卻是異常的樣本數(shù);TN代表變壓器狀態(tài)實(shí)際為正常,檢測的結(jié)果也是正常的樣本數(shù);FN代表變壓器狀態(tài)實(shí)際為異常,檢測的結(jié)果卻是正常的樣本數(shù)。
表1 混淆矩陣
由于變壓器數(shù)據(jù)集中的異常點(diǎn)占比僅為1.18%,為極不平衡數(shù)據(jù)集,不能使用傳統(tǒng)的準(zhǔn)確率指標(biāo)對檢測模型進(jìn)行有效的評估,因?yàn)榧词箤⑺挟惓|c(diǎn)全部誤判為正常點(diǎn),檢測的準(zhǔn)確率也能達(dá)到近99%,這對變壓器異常狀態(tài)的檢測將毫無意義。因此本次實(shí)驗(yàn)采用靈敏度(sensitivity,SE)和特異度(specificity,SP)的幾何均值G作為算法評估的指標(biāo),其計(jì)算公式如下:
根據(jù)式(12)可知,只有當(dāng)檢測結(jié)果的靈敏度和特異度都大時(shí),綜合指標(biāo)G值才會大。G值越大,表明算法的檢測效果越好。
為了縮減數(shù)據(jù)集的冗余特征,減少檢測算法的計(jì)算量,本次實(shí)驗(yàn)對數(shù)據(jù)集的特征進(jìn)行主成分分析。計(jì)算各主成分貢獻(xiàn)率及前4個(gè)主成分的累積貢獻(xiàn)率,各個(gè)主成分貢獻(xiàn)率情況如圖2所示,從圖中可以看出,前3個(gè)主成分的累積貢獻(xiàn)率就可以覆蓋原始數(shù)據(jù)集99%的信息量,因此本文將原始數(shù)據(jù)集的12個(gè)電氣參量特征歸約至3個(gè)主成分特征,可以有效降低后續(xù)LOF檢測算法的運(yùn)行時(shí)間,提高變壓器異常檢測的效率。
圖2 各主成分的貢獻(xiàn)率占比分析圖
經(jīng)多次實(shí)驗(yàn)測試,LOF算法中離群閾值δ在2.3~2.5之間取值時(shí),檢測效果較好,本次實(shí)驗(yàn)選定δ為2.4。另外,近鄰數(shù)k的選擇不僅影響到LOF算法檢測結(jié)果的有效性,且整體算法運(yùn)行的時(shí)間也與k值呈正相關(guān)。因此為了獲得最優(yōu)參數(shù)k并考量不同k值下有無主成分分析PCA對LOF算法檢測效果的影響,實(shí)驗(yàn)中分別對不同k值下的LOF算法和基于主成分分析的LOF算法即PCA-LOF進(jìn)行了測試,兩種算法檢測結(jié)果的幾何平均值G如圖3所示。
圖3 不同k值下LOF與PCA-LOF的幾何平均值
分析圖3可知,當(dāng)LOF算法的近鄰數(shù)k取值在150以下時(shí),主成分分析的數(shù)據(jù)降維環(huán)節(jié)對LOF算法的G值影響不大,且當(dāng)k值取150時(shí),LOF算法和PCA-LOF算法都能獲得最佳的檢測G值,分別為0.845和0.847。鑒于運(yùn)行時(shí)間的考慮,包含PCA降維處理環(huán)節(jié)的LOF算法耗時(shí)更短,能夠在保證檢測G值不受影響的條件下提高變壓器異常狀態(tài)的檢測效率。
當(dāng)近鄰數(shù)k值取最優(yōu)值150時(shí),PCA-LOF算法在以數(shù)據(jù)集前兩個(gè)主成分PC1與PC2為坐標(biāo)軸的二維平面上的檢測結(jié)果散點(diǎn)圖如圖4所示。
由圖4可以看出變壓器狀態(tài)異常點(diǎn)基本分布在數(shù)據(jù)的邊緣區(qū)域,并且其所處位置的密度相比其他正常點(diǎn)位置的密度更小。
本文提出了一種基于主成分分析和局部離群因子算法的變壓器異常檢測方法,可以實(shí)現(xiàn)動態(tài)實(shí)時(shí)數(shù)據(jù)的異常檢測。該方法首先利用主成分分析法對變壓器故障數(shù)據(jù)集進(jìn)行特征降維處理,然后通過局部離群因子算法計(jì)算所有樣本點(diǎn)的離群因子,最后將離群因子與設(shè)定的閾值進(jìn)行比較,篩選出代表變壓器存在異常狀態(tài)的離群樣本點(diǎn)。實(shí)驗(yàn)結(jié)果表明,本文算法對變壓器的異常狀態(tài)能進(jìn)行有效的檢測,可以輔助現(xiàn)場工作人員及時(shí)發(fā)現(xiàn)存在狀態(tài)異常的變壓器,提高變壓器運(yùn)行維護(hù)的效率。