苑津莎,尚海昆
(華北電力大學(xué) 電氣與電子工程學(xué)院,河北 保定 071003)
局部放電是造成電力變壓器絕緣故障的主要原因,而在變壓器絕緣體系中的放電類型有很多種,不同的放電類型造成的絕緣破壞程度有較大差異,因此對(duì)放電類型進(jìn)行識(shí)別是非常重要的。由于變壓器超高頻檢測(cè)技術(shù)具有檢測(cè)頻率高、信號(hào)數(shù)據(jù)量豐富、抗干擾性好等優(yōu)點(diǎn),因此在局部放電檢測(cè)中具有十分重要的地位[1-2]。
在局部放電模式識(shí)別過程中,模式特征的選擇至關(guān)重要,直接影響識(shí)別結(jié)果。目前局部放電常用特征提取方法主要有統(tǒng)計(jì)特征參數(shù)法[3-4]、分形特征參數(shù)法[5-6]、圖像矩特征參數(shù)法[7]、波形特征參數(shù)法[8]及小波分解法[9]等,其中統(tǒng)計(jì)特征參數(shù)法因其物理意義明確及較好的譜圖區(qū)分能力而得到更多的關(guān)注。本文采用統(tǒng)計(jì)特征方法提取描述超高頻局部放電譜圖特征的37個(gè)統(tǒng)計(jì)算子進(jìn)行分析。
主成分分析PCA(Principal Component Analysis)方法作為統(tǒng)計(jì)學(xué)中的有效分析工具,將數(shù)據(jù)從高維空間變換至低維空間,已被應(yīng)用到各種領(lǐng)域,并取得了較好的識(shí)別和降維效果[10-14]。本文利用主成分分析方法對(duì)局部放電37個(gè)特征參數(shù)進(jìn)行分析,提取出12個(gè)更具代表性的新特征因子來表征局部放電圖譜。
目前在模式識(shí)別領(lǐng)域BP神經(jīng)網(wǎng)絡(luò)(BPNN)以其固有的模式分類和噪聲抑制能力得到了廣泛的應(yīng)用,但存在訓(xùn)練樣本需求量大、訓(xùn)練周期長及易陷入局部最小等缺點(diǎn)。本文提出的概率神經(jīng)網(wǎng)絡(luò)PNN(Probabilistic Neural Network)[15-16]在分類功 能上與最優(yōu)貝葉斯分類器等價(jià),不像傳統(tǒng)神經(jīng)網(wǎng)絡(luò)需要用BP算法進(jìn)行反向誤差傳播的計(jì)算,而是完全前向的計(jì)算過程,結(jié)構(gòu)簡單,訓(xùn)練簡潔,有效避免陷入局部極小,容錯(cuò)能力較強(qiáng),在小樣本情況下也能得到滿意的識(shí)別精度。本文將提取出的主成分因子送入PNN進(jìn)行訓(xùn)練,具有較好的識(shí)別效果。
主成分分析方法是統(tǒng)計(jì)學(xué)中對(duì)數(shù)據(jù)分析的有力工具,將高維數(shù)據(jù)集變換到低維空間,保留最多的原始數(shù)據(jù)信息。該方法基本思想是通過對(duì)原有m個(gè)數(shù)據(jù)元素的線性加權(quán)組合,構(gòu)成r個(gè)互相正交的新元素(r?m;r,m∈N),并使其能夠反映被觀測(cè)對(duì)象的原始特征。這樣,由m個(gè)元素張成的特征空間就被壓縮至r維,而且在此低維空間中被觀測(cè)對(duì)象會(huì)更清楚地表達(dá)。此處,r個(gè)互相正交的新元素就稱為“主成分”。主成分分析的計(jì)算步驟如下。
a.根據(jù)研究問題選擇初始分析變量。
選取具有較強(qiáng)相關(guān)性的初始變量進(jìn)行分析,通常采用因子相關(guān)性分析的方法進(jìn)行變量選擇,如KMO(Kaiser-Meyer-Olkin)檢驗(yàn)和 Bartlett球形檢驗(yàn)方法。
b.計(jì)算協(xié)方差矩陣C。
假設(shè) X=(x1,x2,…,xm)T是 m×n 的原始特征空間矩陣,其中m是數(shù)據(jù)的樣本數(shù),n是特征參數(shù)的個(gè)數(shù),協(xié)方差矩陣的計(jì)算公式如下:
c.計(jì)算協(xié)方差矩陣的特征值與特征向量。
首先計(jì)算協(xié)方差矩陣C的特征值λj(j=1,2,…,m)與對(duì)應(yīng)的特征向量Um×m(正交方陣);然后將各個(gè)特征值按大小排序 λ1>λ2>λ3>…>λm,并按照此順序?qū)⑻卣飨蛄烤仃囍械母髁羞M(jìn)行重排,得到新的變換矩陣T;最后將原始特征空間矩陣X右乘T,便得到m個(gè)新的特征參數(shù)Y。矩陣運(yùn)算表示如下:
d.確定主成分的個(gè)數(shù)r。
主成分的選擇是根據(jù)貢獻(xiàn)率來決定的,貢獻(xiàn)率又可以通過特征值的大小來計(jì)算,特征值越大,它在Y中對(duì)應(yīng)的新元素的貢獻(xiàn)率就越大。一般采用單一貢獻(xiàn)率與累計(jì)貢獻(xiàn)率2個(gè)參數(shù)進(jìn)行評(píng)價(jià)。其中單一貢獻(xiàn)率Kr是指式(2)中Y的某列元素的貢獻(xiàn)率,而累計(jì)貢獻(xiàn)率Kt則是指Y中前r列新元素的總貢獻(xiàn)率。兩者的計(jì)算公式分別為:
通常累計(jì)貢獻(xiàn)率達(dá)到85%以上時(shí),認(rèn)為前r個(gè)元素可以代替原來的n個(gè)特征參數(shù),即所謂的主成分。這樣既能使損失的信息不太多,又達(dá)到減少變量、簡化問題的目的。
e.提取主成分。
確定累計(jì)貢獻(xiàn)率之后,主成分的個(gè)數(shù)r就確定了,式(1)中 Y 的前 r列元素(y1,y2,…,yr)就是所要求的主成分。
局部放電相位分布PRPD(Phase Resolved Partial Discharge)模式是一種廣泛應(yīng)用的局部放電模式。本文對(duì)超高頻局部放電PRPD模式的最大放電量相位分布 Hqmax(Φ)、平均放電量相位分布 Hqn(Φ)、放電次數(shù)相位分布Hn(Φ)及局部放電幅值分布Hn(q)4個(gè)不同二維圖譜分別提取出包括偏斜度S、陡峭度K、局部峰個(gè)數(shù)Pe、相位中值M、放電量因數(shù)Q、相位不對(duì)稱度Φ、互相關(guān)系數(shù)Cc共37個(gè)統(tǒng)計(jì)算子,各算子分別從不同角度描述譜圖特性,其值可根據(jù)文獻(xiàn)[4]計(jì)算得到。各特征參數(shù)如表1所示。
上面提取的局部放電特征量維數(shù)過高,各參數(shù)之間可能存在信息重疊,直接送入分類器進(jìn)行模式識(shí)別不但會(huì)給分類器帶來較大的負(fù)擔(dān),而且也可能產(chǎn)生比較大的識(shí)別誤差。主成分及因子分析的方法可以使提取出的特征量既全面表征放電譜圖特征,又使特征量維數(shù)有所下降,從而減小分類器負(fù)擔(dān)。下面以偏斜度S為例,描述主成分分析過程。
表1 參數(shù)統(tǒng)計(jì)表Tab.1 Statistic parameters
提取出的特征向量之間可能存在較強(qiáng)的相關(guān)性,通過因子相關(guān)性分析,可以找出反映變量之間共同特性的少數(shù)公共因子變量,判斷數(shù)據(jù)是否適合進(jìn)行因子分析。若各變量之間相關(guān)性較低,則很難找出公共因子。下面對(duì)表征譜圖偏斜度的特征量S1—S7進(jìn)行相關(guān)性分析。常用的檢驗(yàn)方法有KMO檢驗(yàn)和Bartlett球形檢驗(yàn)。KMO是用于檢驗(yàn)因子分析是否適用的指標(biāo),若它在0.5~1之間,表示適合;小于0.5表示不適合。Bartlett球形檢驗(yàn)是通過x2檢驗(yàn)來完成對(duì)變量之間是否相互獨(dú)立的檢驗(yàn)。若統(tǒng)計(jì)量取值較大,且對(duì)應(yīng)的顯著性水平較小,則因子分析是適用的。運(yùn)用SPSS軟件對(duì)統(tǒng)計(jì)出的S1—S7變量進(jìn)行分析,輸出檢驗(yàn)結(jié)果下:KMO的值為0.714,變量之間存在較強(qiáng)的偏相關(guān)性;Bartlett球形檢驗(yàn)為134.34,顯著性水平為0,拒絕零假設(shè),變量之間適合進(jìn)行因子分析,可以進(jìn)行主成分分析。
針對(duì)偏斜度7個(gè)特征參數(shù),根據(jù)式(1)構(gòu)造協(xié)方差矩陣求取主成分,通過求解協(xié)方差矩陣的特征值和與之對(duì)應(yīng)的特征向量,將原來的相關(guān)向量進(jìn)行線性變換。對(duì)得到的特征值進(jìn)行分析,選擇值大于1的特征根作為主成分進(jìn)行分析,從而達(dá)到降維的目的。表2列出了協(xié)方差矩陣的特征值及方差貢獻(xiàn)率。
表2 特征值和貢獻(xiàn)率Tab.2 Eigenvalues and corresponding contribution rates
由表2可以看出,前2個(gè)特征值大于1,且2個(gè)值的累計(jì)貢獻(xiàn)率超過90%。貢獻(xiàn)率隨主成分的變化情況如圖1所示。
圖1 貢獻(xiàn)率隨主成分變化圖Fig.1 Variation of components contribution rate along with principal component
由圖1分析得到,從第3個(gè)主成分開始,貢獻(xiàn)率變化趨勢(shì)已趨于平穩(wěn),且貢獻(xiàn)率逐漸減小,其貢獻(xiàn)可忽略不計(jì)。因此,取前2個(gè)主成分是比較合適的,可以很好地反映絕大部分變量信息。這樣由原來的7個(gè)指標(biāo)轉(zhuǎn)化為2個(gè)新指標(biāo),起到了降維作用。
SPSS分析軟件得到主成分系數(shù)如表3所示。
表3 主成分系數(shù)Tab.3 Coefficient of principal component
由表3可得2個(gè)主成分的線性組合為:用上面兩式可計(jì)算出主成分的值。
同樣的方法可以計(jì)算出陡峭度K、局部峰個(gè)數(shù)Pe、相位中值M、放電量因數(shù)Q、偏斜度S、互相關(guān)系數(shù)Cc的主成分,提取出的成分如表4所示。通過主成分分析,提取出37個(gè)特征變量的12個(gè)主成分因子,各參數(shù)的信息表征率均在75%以上。
表4 各參數(shù)主成分提取表Tab.4 Principal components of parameter
PNN是由徑向基函數(shù)網(wǎng)絡(luò)發(fā)展而來的一種前饋神經(jīng)網(wǎng)絡(luò),其理論依據(jù)是貝葉斯最小風(fēng)險(xiǎn)準(zhǔn)則(貝葉斯決策理論),PNN作為徑向基網(wǎng)絡(luò)的一種,適合于模式分類。
基于PNN的故障診斷方法是概率統(tǒng)計(jì)學(xué)中被普遍接受的決策方法。假設(shè)2種已知故障模式A、B,對(duì)于待識(shí)別的故障特征樣本為X,按貝葉斯最小風(fēng)險(xiǎn)準(zhǔn)則,若 HALAFA(X)>HBLBFB(X),則 X∈A;若HALAFA(X)<HBLBFB(X),則 X∈B。其中,HA和 HB代表故障模式A和B的先驗(yàn)概率,LA是將屬于A的故障特征樣本X錯(cuò)誤劃分到模式B的代價(jià)因子,LB為將屬于B的故障特征樣本X錯(cuò)誤劃分到模式A的代價(jià)因子,F(xiàn)A、FB是故障模式A、B的概率密度函數(shù)。一般FA、FB不能精確獲得,只能根據(jù)現(xiàn)有故障特征樣本求其統(tǒng)計(jì)值,概率密度函數(shù)的估計(jì)式如下:
其中,XAi為故障模式A的第i個(gè)訓(xùn)練向量;mt為故障模式A的訓(xùn)練樣本總數(shù);δ為平滑參數(shù),其值確定了以樣本為中心的鐘狀曲線的寬度。
PNN的層次模型由輸入層、模式層、求和層、輸出層組成,基本結(jié)構(gòu)如圖2所示。輸入層將輸入樣本傳遞給模式層的各個(gè)節(jié)點(diǎn),模式層將輸入節(jié)點(diǎn)傳遞來的輸入向量進(jìn)行加權(quán)求和,經(jīng)過一個(gè)非線性算子運(yùn)算后傳遞給求和層;求和層只是簡單地將由對(duì)應(yīng)與訓(xùn)練樣本中同一類的模式層傳來的輸入進(jìn)行求和;輸出層選擇求和層中輸出最大者對(duì)應(yīng)的狀態(tài)模式為分類結(jié)果。
圖2 概率神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)Fig.2 Basic structure of probabilistic neural network
4.2.1 網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)
a.輸入層向量選擇。
對(duì)于局部放電信號(hào),網(wǎng)絡(luò)輸入即為表征放電信號(hào)圖譜特征的特征參數(shù),包括上面介紹過的偏斜度、陡峭度、局部峰個(gè)數(shù)等37個(gè)統(tǒng)計(jì)特征參數(shù),以及經(jīng)主成分分析方法降維后的12個(gè)新的特征量用作對(duì)比分析,為消除量綱影響,所有輸入層向量均采用標(biāo)準(zhǔn)化后的數(shù)據(jù)。
b.輸出層向量選擇。
變壓器局部放電類型有許多種,本文采用比較典型的3種放電類型作為網(wǎng)絡(luò)結(jié)構(gòu)的輸出,即自由金屬顆粒懸浮放電、絕緣表面沿面放電和固體絕緣內(nèi)部氣隙放電。因此,采用PNN進(jìn)行模式分類時(shí),輸入層對(duì)應(yīng)37個(gè)節(jié)點(diǎn)或12個(gè)節(jié)點(diǎn),輸出層對(duì)應(yīng)3個(gè)輸出節(jié)點(diǎn),網(wǎng)絡(luò)的輸出即為診斷出的局部放電類型。文中用作對(duì)比分析的BPNN輸入層及輸出層節(jié)點(diǎn)與PNN相同,隱含層取16個(gè)(對(duì)應(yīng)37個(gè)輸入向量)和14個(gè)(對(duì)應(yīng)12個(gè)輸入向量)神經(jīng)元。
4.2.2 結(jié)果分析
本文針對(duì)懸浮放電、沿面放電和氣隙放電3種不同局部放電類型,在各地高壓變電站的局部放電在線監(jiān)測(cè)系統(tǒng)中收集得到現(xiàn)場(chǎng)超高頻放電信號(hào),對(duì)每種類型放電收集得到10組歷史數(shù)據(jù),并對(duì)30組放電數(shù)據(jù)進(jìn)行參數(shù)統(tǒng)計(jì),計(jì)算出相應(yīng)37個(gè)表征二維譜圖的統(tǒng)計(jì)算子。利用上面的主成分分析方法提取出12個(gè)新的特征向量,送入PNN進(jìn)行訓(xùn)練。3種類型放電分別取5組數(shù)據(jù)用來訓(xùn)練,5組用來測(cè)試。此外將未經(jīng)主成分因子分析的37個(gè)統(tǒng)計(jì)算子送入分類器進(jìn)行訓(xùn)練和測(cè)試,識(shí)別結(jié)果如圖3所示。
圖3 降維前和降維后的PNN識(shí)別效果圖Fig.3 Results of PNN recognition before and after dimension reduction
由圖3可見,樣本降維后12個(gè)統(tǒng)計(jì)參數(shù)的識(shí)別效果較之降維前的37個(gè)統(tǒng)計(jì)算子的識(shí)別情況相同,錯(cuò)誤判斷個(gè)數(shù)均為3。為進(jìn)行實(shí)驗(yàn)對(duì)比,將相同數(shù)據(jù)輸入傳統(tǒng)BPNN進(jìn)行訓(xùn)練并測(cè)試,對(duì)比結(jié)果見表5。
表5 實(shí)驗(yàn)對(duì)比結(jié)果Tab.5 Comparison of experimental results
由表5可以看出,數(shù)據(jù)降維后,PNN與BPNN的收斂時(shí)間均有不同程度的降低。PNN算法在數(shù)據(jù)降維前后具有相同的識(shí)別率,BPNN算法在數(shù)據(jù)降維后識(shí)別率略有下降。此外,PNN的總體收斂時(shí)間要少于BPNN,識(shí)別效果也要優(yōu)于BPNN。
本文利用主成分分析方法對(duì)局部放電特征數(shù)據(jù)進(jìn)行分析,降維后的新向量可以較好地表征原始特征向量,有效解決了原始特征參數(shù)維數(shù)過高的問題。通過PNN與BPNN分類器對(duì)降維前后的特征參數(shù)進(jìn)行模式分類,對(duì)比得出,降維后的新特征量使得網(wǎng)絡(luò)結(jié)構(gòu)得到了優(yōu)化,PNN與傳統(tǒng)的BPNN相比具有更好的識(shí)別效果。