(1.華北電力大學(xué) 計算機系,河北 保定 071003;2.國網(wǎng)河北省電力公司 電力科學(xué)研究院,石家莊 050021)
在電力系統(tǒng)中,變壓器運行狀態(tài)的變化將直接對電力系統(tǒng)的狀態(tài)產(chǎn)生影響。因此,對電力變壓器的健康狀態(tài)進(jìn)行預(yù)測,保障送變電安全,對提高電力系統(tǒng)的可靠性、促進(jìn)電力設(shè)備基于狀態(tài)的維修(condition based maintenance, CBM)具有重要意義。為保障變壓器的正常和安全運行,對其健康狀態(tài)的監(jiān)控與故障預(yù)測技術(shù)越來越受到變壓器運維人員和研究學(xué)者們的重視[1]。在實際應(yīng)用中,變壓器在故障產(chǎn)生前,通常會經(jīng)歷一系列的退化狀態(tài),當(dāng)積累到一定程度時,會最終導(dǎo)致變壓器故障[1]。如何正確的劃分和識別變壓器從正常狀態(tài)到故障狀態(tài)之間的狀態(tài)序列,是故障診斷研究中非常關(guān)鍵的一步,也是能夠得到較高診斷可靠度的前提條件之一[2-3]。
近年來,已有大量針對電力變壓器狀態(tài)評估與故障診斷的研究成果報道[4-6],但由于變壓器是一類內(nèi)部結(jié)構(gòu)復(fù)雜、運行工況與外在環(huán)境多變的設(shè)備,因此,尋找一種有效的方法對其故障演化規(guī)律進(jìn)行清晰的刻畫較為困難。例如,有研究者開始把HMM模型引入到基于狀態(tài)的設(shè)備維修和故障診斷領(lǐng)域中來,取得了良好的效果[7-9]。HMM在設(shè)備狀態(tài)識別領(lǐng)域的應(yīng)用是對設(shè)備歷經(jīng)的多個健康狀態(tài)分別建立并訓(xùn)練對應(yīng)的HMM,實現(xiàn)對狀態(tài)的劃分。文獻(xiàn)[10]將HMM應(yīng)用于機械設(shè)備故障診斷領(lǐng)域,通過對振動信號的學(xué)習(xí),實現(xiàn)了基于狀態(tài)的維修。文獻(xiàn)[11]將HMM應(yīng)用到發(fā)電機轉(zhuǎn)子的狀態(tài)識別中,描述了設(shè)備運行狀態(tài)的變化。文獻(xiàn)[12]對旋轉(zhuǎn)機械的變速過程進(jìn)行HMM建模,在建模過程中采用了多個觀測變量進(jìn)行分析,得到了較好的診斷結(jié)果。但這些研究只使用了標(biāo)準(zhǔn)HMM技術(shù),因為HMM的狀態(tài)持續(xù)時間遵循指數(shù)分布,所以模型對時間結(jié)構(gòu)的描述不夠精確,建模過程中未考慮設(shè)備的歷史狀態(tài)信息,為充分利用馬爾科夫過程的特點,需要對HMM模型中對歷史狀態(tài)不敏感的缺點進(jìn)行改進(jìn)。
隱式半馬爾科夫模型(hidden semi-markov models, HSMM)將歷史狀態(tài)信息納入計算過程,能夠克服 HMM對歷史狀態(tài)信息不敏感的局限性[13]。本文嘗試在變壓器故障診斷中,對HSMM模型引入“微狀態(tài)-宏狀態(tài)”的對應(yīng)關(guān)系來描述變壓器健康狀態(tài)的轉(zhuǎn)移。最后使用變壓器DGA故障數(shù)據(jù)對HSMM模型進(jìn)行訓(xùn)練,并通過實驗來驗證模型的可靠性及準(zhǔn)確性。
一個HMM模型可用下列參數(shù)描述[9]:
(1)N為模型中Markov鏈的狀態(tài)數(shù)目。記N狀態(tài)為:s1,s2,...,sN,記t時刻Markov鏈所處的狀態(tài)為qt,顯然qt∈(s1,s2,…,sN)。
(2)M為一個隱狀態(tài)產(chǎn)生的觀測值種類數(shù)量。記M個觀測值為o1,o2,...,oM,記t時刻的觀測值為ot,其中,ot∈(o1,o2,...,oM)。
(3)π為初始概率分布矢量,π=(π1,π1,…,πN)。πN初始時刻時,模型處在該狀態(tài)的概率。其中:
πi=P(qt=si),1≦i≦N
(1)
(4)A為狀態(tài)轉(zhuǎn)移矩陣,A={aij}N*N。其中:
aij=P(qt+1=si|qt=si),1≦i,j≦N
(2)
(5)B為觀測值概率矩陣,B={bjk}N*M。其中:
bjk=P(ot=vk|qt=sj),1≦j≦N,1≦k≦M
(3)
這樣可以記HMM為λ=(N,M,π,A,B),因為在模型中,各個參數(shù)之間又具有一定的關(guān)聯(lián),N和M確定之后才能計算A和B,所以HMM可簡寫為λ=(π,A,B)。
HMM在實際應(yīng)用中的3個相關(guān)基本問題及算法描述如下[11]:
(1)評估問題(“前向-后向”算法):在給定的觀察序列o=o1,o2,...,oM和參數(shù)組為λ=(π,A,B) 的HMM中,該觀察序列出現(xiàn)的概率是多少?
(2)解碼問題(Viterbi算法):在給定的觀察序列o=o1,o2,...,oM和參數(shù)組為λ=(π,A,B) 的HMM中,隱藏狀態(tài)序列s=s1,s2,...,sN生成所給出的觀察序列的概率是多少?
(3)學(xué)習(xí)問題 (Baum-Welch算法):觀察序列確定的情況下,如何設(shè)定HMM中的參數(shù),如:初始概率分布(π)、狀態(tài)轉(zhuǎn)移矩陣(A)等,才能夠使得HMM輸出該觀測序列的概率最大?
HMM是一個雙重隨機過程,它可以在概率統(tǒng)計學(xué)的基礎(chǔ)上解答上述3個問題。HMM的參數(shù)λ=(π,A,B)可以由Baum-Welch算法從觀測到的DGA數(shù)據(jù)中估計出來,由估算出的HMM組成分類器,可以實現(xiàn)對觀測序列的分類。具體流程如圖1所示。
圖1 HMM故障診斷流程圖
在使用HMM對變壓器運行狀態(tài)進(jìn)行建模時,將初始模型的隱狀態(tài)數(shù)量設(shè)定為4,并采用均勻選取的辦法對模型的觀測值概率矩陣選取進(jìn)行確定。HMM的初始形態(tài)如圖2所示。模型中變量之間的依賴關(guān)系用箭頭來表示,箭頭上的數(shù)字表示此次狀態(tài)轉(zhuǎn)移的概率,由圓圈中的數(shù)字表示HMM模型中不同的隱狀態(tài)。根據(jù)HMM模型的基本理論可知,每個隱狀態(tài)都可能產(chǎn)生多個觀測值,圖2中的o1,o2,...,oT都表示為離散的觀測值序列。
圖2 HMM變壓器故障模型
當(dāng)建立了HMM的初始模型后,就可以采用Baum-Welch算法進(jìn)行計算,為變壓器的每個故障類型訓(xùn)練出相應(yīng)的HMM,從而建立起面向變壓器的HMM分類器。
在HMM研究和應(yīng)用領(lǐng)域的相關(guān)內(nèi)容中可以歸納出其模型的局限性,主要表現(xiàn)為以下幾點[14]:
(1)HMM狀態(tài)駐留概率遵循指數(shù)分布。即系統(tǒng)在狀態(tài)i持續(xù)時間為d的概率為:
(4)
式中,aii表示系統(tǒng)駐留在狀態(tài)i的概率。根據(jù)公式(4)的表示,隨著駐留時間d的增加,Pi(d)呈指數(shù)下滑,這也與實際情況不符合。
(2)HMM假設(shè)模型中各觀測變量之間互不影響,即觀測序列產(chǎn)生僅與當(dāng)前所處的狀態(tài)有關(guān):
P(o1,o2,...,ot|s1,s2,…,st)=P(ot|qt)
(5)
o1是由s1生成的,o2是由s2生成的,但是s2的形成受s1影響,所以o1和o2也一定有聯(lián)系。但是為了研究和應(yīng)用方便,就假設(shè)s1和s2不獨立,但o1和o2獨立。在實際的變壓器DGA運行過程中,各個狀態(tài)之間能夠相互轉(zhuǎn)化,所以這個假設(shè)與實際情況不符。
(3)HMM模型中,馬爾可夫過程具有齊次性,表現(xiàn)在變壓器的狀態(tài)轉(zhuǎn)移中即為——狀態(tài)轉(zhuǎn)移矩陣確定后,不會隨變壓器狀態(tài)的變化而變化。在實際情況中,隨著變壓器運行狀態(tài)的不斷改變,其各個狀態(tài)之間的轉(zhuǎn)移概率肯定會不斷變化。
針對上述局限性,目前的改進(jìn)方法就是根據(jù)應(yīng)用場景的不同,適當(dāng)放寬HMM模型的假設(shè)條件,主要思路如下:
(1)在傳統(tǒng)的HMM 結(jié)構(gòu)上加入時間要素,使?fàn)顟B(tài)轉(zhuǎn)移矩陣能夠根據(jù)歷史狀態(tài)信息進(jìn)行改變,打破馬爾科夫過程的齊次性。
(2)在HMM模型各個狀態(tài)轉(zhuǎn)移概率的計算過程中,加入歷史狀態(tài)的變化量,來描述各個狀態(tài)之間的跳轉(zhuǎn)信息。該方法具有較強的適應(yīng)性,但是每次狀態(tài)轉(zhuǎn)移過程的計算與建模較為復(fù)雜。文獻(xiàn)[15]表明,在基于HMM的手寫字體識別系統(tǒng)中,因為手寫字母的分割處理程序本身具有極強的不確定性,所以使用結(jié)合歷史狀態(tài)的模型來實現(xiàn)手寫字體的識別是切實可行的。
(3)針對HMM的觀測序列輸出僅與當(dāng)前狀態(tài)有關(guān)的假設(shè),可將觀測序列之間的依賴性加入建模過程中。自回歸隱馬爾可夫模(Auto-Regressive Hidden Markov Model, ARHMM)通過AR模型計算的觀測值概率矩陣B={bjk}N*M,其中,bjk=P(st=sj|ot=oj),反映了狀態(tài)st和觀測序列ot之間的統(tǒng)計對應(yīng)關(guān)系:
bjk=P(sj|ot=oj)=N(sj|∑ak(i)ot-i|∑k)
(6)
式中,N(·)表示高斯函數(shù),∑k表示高斯分布的估計方差,通過統(tǒng)計學(xué)將狀態(tài)與觀測序列之間建立關(guān)系,實現(xiàn)了觀測序列之間的依賴性。文獻(xiàn)[16]通過ARHMM 對工業(yè)控制過程的數(shù)據(jù)進(jìn)行異常檢測,提升了檢測精度和抗干擾能力。
目前基于HSMM故障診斷的應(yīng)用對象主要以旋轉(zhuǎn)機械居多,通過對其工作過程中的振動信號進(jìn)行建模分析,實現(xiàn)對其健康狀態(tài)的劃分,旋轉(zhuǎn)機械振動信息采集的連續(xù)性較強[17]。但是變壓器的故障數(shù)據(jù),如DGA數(shù)據(jù)的采集通常為間隔操作,變壓器健康狀態(tài)的持續(xù)時間也遠(yuǎn)較機械設(shè)備等更長久,具有宏觀上的離散性。因此,本文結(jié)合變壓器DGA數(shù)據(jù)采集特點及狀態(tài)演變規(guī)律,引入“微狀態(tài)-宏狀態(tài)”的對應(yīng)關(guān)系來描述變壓器的運行過程,將變壓器歷史狀態(tài)信息納入建模過程中,以提升模型準(zhǔn)確率。
變壓器的運行狀態(tài)分為正常狀態(tài)和故障狀態(tài),故障類型分為放電性故障和過熱性故障,其中放電性故障分為:低能放電、高能放電;過熱性故障分為:中低溫過熱(溫度≦700 ℃)、高溫過熱(溫度≧700 ℃)[18]。其中兩種故障特性都包含的有:低能放電兼過熱和高能放電兼過熱。本文所采用的HSMM是在傳統(tǒng)HMM結(jié)構(gòu)上加入了時間要素,為變壓器故障診斷提供更好的建模和數(shù)據(jù)分析能力,具體如下:
針對變壓器的各個健康狀態(tài),使用各類DGA故障數(shù)據(jù)對HSMM進(jìn)行訓(xùn)練,與HMM不同的是,HSMM中的 “宏狀態(tài)”對應(yīng)變壓器的各個健康狀態(tài)。
HSMM與傳統(tǒng)HMM的不同還體現(xiàn)在狀態(tài)與觀測值的產(chǎn)生方式上,傳統(tǒng)HMM 的一個狀態(tài)僅產(chǎn)生單個觀測值,但HSMM的一個狀態(tài)會產(chǎn)生一個由多次觀測值組成的觀測值片段。本文將HSMM中隱狀態(tài)一次產(chǎn)生的觀測值被稱為“微狀態(tài)”,由連續(xù)多次的觀測值組成的片段稱為“宏狀態(tài)”。其對應(yīng)關(guān)系如圖3所示。在HSMM中s表示變壓器的隱狀態(tài),o表示由采集的DGA數(shù)據(jù)處理得來的觀測序列。
圖3 HSMM模型示意圖
如圖3所示,值為oqi-1,...,oqi的觀測序列,對應(yīng)的微狀態(tài)為sqi-1,...,sqi,這個微狀態(tài)序列對應(yīng)HSMM模型中相同的宏狀態(tài)即hi。
HSMM可表示為λ=(π,A,D,B),其中,π表示初始狀態(tài)分布,A表示狀態(tài)轉(zhuǎn)移矩陣,D表示狀態(tài)持續(xù)時間分布,B表示觀測值概率矩陣。在HSMM模型中具有多個微狀態(tài),這些微狀態(tài)的轉(zhuǎn)換不具有馬爾科夫性,而模型中宏狀態(tài)之間的轉(zhuǎn)換是符合馬爾科夫過程的,狀態(tài)轉(zhuǎn)移矩陣(A)用來描述這些隱狀態(tài)之間的轉(zhuǎn)換:
P(hql=j|hql-1=i)=aij
(7)
為了能夠使HSMM模型識別出變壓器在運行過程中不同的狀態(tài),所以在訓(xùn)練模型時采用各種變壓器DGA故障數(shù)據(jù),為所有變壓器的正常狀態(tài)和每個故障類型各訓(xùn)練一個單獨的HSMM模型,從而建立起變壓器故障的HSMM分類器。如圖4所示。
圖4 HSMM故障診斷示意圖
基于HSMM的變壓器故障診斷流程,由特征提取、狀態(tài)分類和故障識別3個部分組成。其中,狀態(tài)分類是該流程中的關(guān)鍵步驟,其HSMM的計算過程如下:根據(jù)觀測序列利用“前向-后向”算法求解最優(yōu)模型λ,采用Baum-Welch算法訓(xùn)練模型,得到輸出該觀測序列概率值最大的模型參數(shù)。在模型中每個變壓器的運行狀態(tài)都對應(yīng)一個訓(xùn)練好的HSMM,將觀測序列依次代入每個HSMM模型中進(jìn)行計算,得到該觀測序列的P(o|λ),即為發(fā)生該故障的概率。
在電力變壓器的診斷分析環(huán)節(jié)中,DGA分析技術(shù)的數(shù)據(jù)采集方便,分析結(jié)果也較為準(zhǔn)確,所以近年來的變壓器健康管理和DGA技術(shù)緊密結(jié)合[19]。在運行過程中如果變壓器發(fā)生過熱或放電性故障時,會使得內(nèi)部固體絕緣材料和絕緣油如絕緣紙板、電纜紙等加速發(fā)生分解,產(chǎn)出氣體。主要氣體有氫氣(H2)、烴類氣體如:甲烷(CH4)、乙烷(C2H6)、乙烯(C2H4)、乙炔(C2H2)、一氧化碳(CO)、二氧化碳(CO2)等。在這7種氣體中,因為變壓器內(nèi)部受到空氣中二氧化碳滲入的影響較大,故其不能夠靈敏的反應(yīng)運行狀態(tài)變化,所以一般不將二氧化碳(CO2)作為判斷故障的特征變量。當(dāng)變壓器運行狀態(tài)發(fā)生改變時,一氧化碳(CO)在絕緣油中的溶解濃度要遠(yuǎn)大于其他特征氣體,在HSMM建模過程中容易掩蓋其他油中溶解氣體對于模型計算的影響。為了簡化問題,同時結(jié)合實際情況,將用于HSMM建模的特征變量定為5個,即氫氣(H2)、甲烷(CH4)、乙烷(C2H6)、乙烯(C2H4),且只考慮樣本之間的關(guān)系。由此可得到特征氣體的矢量表達(dá)式:
X=[H2,CH4,C2H6,C2H4,C2H2]
(8)
先對DGA數(shù)據(jù)進(jìn)行歸一化,使數(shù)據(jù)限制于[0, 1]之間。由于H2、CH4、C2H6、C2H4、C2H2這幾種特征氣體都是可燃性氣體,通常將這些DGA特征氣體含量總和稱為可燃?xì)怏w總量(TCG)。通過將這5種特征氣體變量與TCG的比值實現(xiàn)DGA數(shù)據(jù)的歸一化處理,即以H2/TCG、CH4/TCG、C2H6/TCG、C2H4/TCG、C2H2/TCG作為歸一化的DGA數(shù)據(jù),從而將DGA數(shù)據(jù)限制在0到1之間。
當(dāng)發(fā)生放電性故障時,若CH4/H2>1,則同時伴隨有過熱性故障的發(fā)生,即此時變壓器的運行狀態(tài)出現(xiàn)放電兼過熱性故障;當(dāng)CH4/H2≦1時,一般認(rèn)為是純放電性故障。當(dāng)訓(xùn)練HSMM變壓器故障模型時,我們將放電性故障和放電兼過熱性故障合為一種故障類型,即將變壓器的運行狀態(tài)由7類合并為5類:正常、中低溫過熱(溫度≦700℃)、高溫過熱(溫度≧700℃)、低能放電,高能放電。合并運行狀態(tài),可以提升HSMM的訓(xùn)練速度和正確率。例如,若輸入的特征氣體觀測矢量為x=[85.9,66.0,15.3,25.7,6.3],則HSMM模型各狀態(tài)的識別結(jié)果輸出如表1所示,其發(fā)生高能放電故障的概率是98.45%。
表1 HSMM輸出
表1中的對數(shù)似然值就是由HSMM對觀測矢量X進(jìn)行分類得到的對每個狀態(tài)的logP(o|λ),其中Inf表示無窮大,HSMM輸出的對數(shù)似然值越大,則表示此故障的發(fā)生概率就越大。
我們從相關(guān)文獻(xiàn)和資料收集到的樣本中選出變壓器運行過程中每個狀態(tài)各15組數(shù)據(jù),這75組數(shù)據(jù)未在模型中參與訓(xùn)練過程,作為HSMM的輸入矢量進(jìn)行分類測試。在本算例實驗中,因為變壓器運行狀態(tài)共有5種,所以設(shè)定HSMM模型中隱藏狀態(tài)數(shù)目為5;因為初始值的選取對于訓(xùn)練結(jié)果的影響不大[19],所以對于HSMM的初始模型π,我們采用均勻選取。設(shè)置訓(xùn)練過程中的收斂值0.0001,最大迭代次數(shù)為100。在一開始的訓(xùn)練過程中,隨著迭代次數(shù)的增加,各個狀態(tài)輸出的對數(shù)似然值也逐漸加大,即狀態(tài)識別的正確率也在逐步提高。各個狀態(tài)輸出的對數(shù)似然值曲線在10次后趨于平穩(wěn),總體訓(xùn)練過程的迭代次數(shù)都在15次之內(nèi),訓(xùn)練過程如圖5所示。
圖5 5種狀態(tài)HSMM的訓(xùn)練曲線
當(dāng)各種故障類型的HSMM建立以后,就可以使用圖4所示的方法進(jìn)行故障識別。為了能夠直觀的了解HSMM變壓器診斷方法的效果,把這75組數(shù)據(jù)用傳統(tǒng)HMM方法進(jìn)行診斷,并和本文所述的診斷方法進(jìn)行比較。從本次實驗的結(jié)果可以看出,相較于傳統(tǒng)HMM方法, HSMM方法正確率更高。HSMM對于每個故障類型的劃分都要比HMM準(zhǔn)確。測試結(jié)果如表2所示。
表2 暫態(tài)運動各自由度穩(wěn)態(tài)誤差
本文針對傳統(tǒng)HMM在電力設(shè)備故障診斷中的局限性,通過引入“微狀態(tài)-宏狀態(tài)”,考慮變壓器運行過程中的歷史狀態(tài)對于狀態(tài)轉(zhuǎn)移的影響,給出了一種基于HSMM的變壓器故障診斷流程,并采用DGA數(shù)據(jù)進(jìn)行了算例分析,結(jié)果驗證了模型的有效性,也更加符合變壓器實際運行狀態(tài)。