丁江橋,文屹,呂黔蘇,張迅,范強,黃軍凱
(貴州電網(wǎng)有限責(zé)任公司電力科學(xué)研究院,貴陽 550002)
電網(wǎng)是經(jīng)濟和社會發(fā)展的重要基礎(chǔ)設(shè)施,也是能源產(chǎn)業(yè)鏈中的重要紐帶[1]。在堅強智能電網(wǎng)框架下,智能輸變電設(shè)備逐漸成為建設(shè)未來電網(wǎng)必不可少的環(huán)節(jié)。但輸變電設(shè)備存在過載、過壓、老化等現(xiàn)象,導(dǎo)致設(shè)備缺陷和故障等[2]。隨著大數(shù)據(jù)時代的到來,大數(shù)據(jù)技術(shù)逐漸成熟并應(yīng)用到各個領(lǐng)域。應(yīng)用大數(shù)據(jù)技術(shù)對數(shù)據(jù)本身的內(nèi)在規(guī)律進行挖掘,從而對設(shè)備狀態(tài)進行更加全面和詳細的分析。因此,對基于大數(shù)據(jù)技術(shù)的電力設(shè)備異常狀態(tài)檢測方法進行研究具有重要的現(xiàn)實意義。
目前,國內(nèi)外對設(shè)備異常狀態(tài)檢測方法進行了大量的研究。但在電力行業(yè),大數(shù)據(jù)技術(shù)在設(shè)備異常檢測中的應(yīng)用尚處于起步階段。主要包括時間序列分析、馬爾可夫模型和分類算法等。在文獻[3]中,提出了一種基于無監(jiān)督學(xué)習(xí)的數(shù)據(jù)挖掘方法,使用自回歸模型,提出了契合度指標(biāo),并在正常工作時間序列上進行了歐氏距離分析,最后通過實例驗證了該方法的準(zhǔn)確性。在文獻[4]中,提出一種通過大數(shù)據(jù)技術(shù)深度挖掘與分析電力變壓器狀態(tài)數(shù)據(jù)的方法,分析當(dāng)前的應(yīng)用現(xiàn)狀以及決策優(yōu)化的典型場景。在文獻[5]中,提出一種采用移動時間窗劃分狀態(tài)數(shù)據(jù)的方法,結(jié)合空間位置坐標(biāo)形成時空聯(lián)合數(shù)據(jù),采用模糊C均值聚類方法對數(shù)據(jù)進行聚類,判斷電力設(shè)備運行狀態(tài)。在文獻[6]中,根據(jù)變電站設(shè)備狀態(tài)監(jiān)測和評估的手段,對新一代智能變電站設(shè)備狀態(tài)監(jiān)測與評價的大數(shù)據(jù)處理方法進行分析。從建立設(shè)備異常知識庫和狀態(tài)評估兩個方面展望大數(shù)據(jù)技術(shù)在設(shè)備檢測中的應(yīng)用前景。但是以上電力設(shè)備異常檢測方法利用的數(shù)據(jù)量小,沒有充分考慮到歷史數(shù)據(jù)的作用。
在此基礎(chǔ)上,文中提出了一種基于時間序列和神經(jīng)網(wǎng)絡(luò)的電力設(shè)備狀態(tài)信息異常檢測方法。通過自回歸時間序列模型和自組織映射神經(jīng)網(wǎng)絡(luò)將連續(xù)的監(jiān)測數(shù)據(jù)進行離散化,找出歷史數(shù)據(jù)隨時間的變化規(guī)律,以此為基礎(chǔ)完成數(shù)據(jù)的快速異常檢測。最后通過實驗驗證了該方法在實際電力設(shè)備狀態(tài)診斷中的有效性。
電力設(shè)備狀態(tài)評估數(shù)據(jù)包括實時狀態(tài)數(shù)據(jù),如在線監(jiān)測信息等;準(zhǔn)實時狀態(tài)數(shù)據(jù),如日常巡檢、預(yù)防性試驗和維護等;靜態(tài)原始數(shù)據(jù),如設(shè)備臺帳等[7]。巡檢數(shù)據(jù)包括運行巡檢數(shù)據(jù),并且在每次檢查后更新數(shù)據(jù)。在線監(jiān)測數(shù)據(jù)包括現(xiàn)場所有監(jiān)測設(shè)備實時或定期向中心發(fā)送的數(shù)據(jù),并實時更新數(shù)據(jù);預(yù)防性試驗數(shù)據(jù)包括各種周期性離線試驗數(shù)據(jù);檢修數(shù)據(jù)包括檢修后設(shè)備各部分的最新狀態(tài),并在每次檢查后更新數(shù)據(jù)。
基于電力設(shè)備不同維度的狀態(tài)信息,從電力設(shè)備的狀態(tài)監(jiān)測信息、測試信息和電網(wǎng)運行信息等全景信息的特征信息。電力設(shè)備狀態(tài)全景信息模型如圖1所示。
圖1 全景信息模型
文中研究的異常檢測方法主要是對在線監(jiān)測的狀態(tài)信息,集合歷史數(shù)據(jù)和設(shè)備類型數(shù)據(jù),從縱向時間跨度、橫向電網(wǎng)和設(shè)備跨度這三個方面對設(shè)備的全景狀態(tài)信息進行綜合分析。然而,大數(shù)據(jù)技術(shù)為異常狀態(tài)檢測提供了新的解決思路和技術(shù)手段。
由于電力設(shè)備在運動過程中動態(tài)性較低,具有較強記憶力的自回歸(Auto Regressive,AR)時間序列模型被廣泛用于評估[8]。在一般情況下,電力設(shè)備的狀態(tài)變量有兩類[9]。第一類是平穩(wěn)序列,一階AR可以直接擬合,如接地電流和導(dǎo)線張力等。另一類為狀態(tài)變量周期變化,但由于幅度較小,也可以調(diào)整后使用一階AR進行擬合,例如油溫、環(huán)境溫度等。因此,采用一階AR模型來擬合設(shè)備數(shù)據(jù)。如式(1)所示:
(1)
式中xt為監(jiān)測數(shù)據(jù)t時刻的時間序列;α為自相關(guān)系數(shù);et為t時刻的白噪聲,遵循正態(tài)分布et~N(μe,λ2);μe為該分布的數(shù)學(xué)期望;λ為該分布的標(biāo)準(zhǔn)差。因此,xt服從N(μ,σ2)正態(tài)分布,并且μ和σ滿足式(2)和式(3)所示:
μ=μe/(1-α)
(2)
(3)
正常運行時設(shè)備狀態(tài)量在閾值范圍內(nèi),因此,假定xt在區(qū)間[a,b]內(nèi)。
在采樣時t+1,t+2,…,t+k時刻可以判斷其量化是否屬于同一區(qū)間。僅當(dāng)式(4)成立時,有a≤xt+k≤b[10]。
-αkxt+α≤et+k+αet+k-1+…+αk-1et+1≤-αkxt+b
(4)
式中et~N(μe,λ2),只有當(dāng)α<α0時,整個序列才能滿足區(qū)間[a,b]。
但是,僅用AR模型無法準(zhǔn)確檢測超過狀態(tài)變量閾值的異常數(shù)據(jù)[11]。這主要是由于設(shè)備之間的數(shù)據(jù)不一致,當(dāng)設(shè)備性能逐漸下降并存在潛在故障時,異常數(shù)據(jù)通常在規(guī)定閾值內(nèi),這會導(dǎo)致錯誤的狀態(tài)評估。
自組織映射(Self Organized Maps,SOM)是一種神經(jīng)網(wǎng)絡(luò),在數(shù)據(jù)聚類和降維中應(yīng)用較多[12]。工作原理如圖2所示。在輸入層通過輸入樣本進行模型訓(xùn)練。訓(xùn)練過程會不斷更改輸入數(shù)據(jù)的權(quán)重,趨于平穩(wěn)輸入實時數(shù)據(jù),將輸入輸出神經(jīng)元比較,只有一個輸出層神經(jīng)元將成為獲勝者。
圖2 SOM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
由于SOM可以執(zhí)行無監(jiān)督分類,將xt作為SOM的輸入,而該序列C={C1,C2,…,Cn}將用作網(wǎng)絡(luò)的輸出。那么每一個xt訓(xùn)練其屬于節(jié)點Cj的公式,判別通過為歐幾里得距離,如式(5)所示[13]:
j=i(xt)=argmind(xt,Ci(t))
(5)
連續(xù)輸入數(shù)據(jù)后,改變權(quán)值以最小化xt與最終輸出節(jié)點的距離,如式(6)所示:
(6)
在式中,γ(t)為SOM神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)率,隨t的增加逐漸降低,取值在[0,1]之間。
輸入狀態(tài)序列xt到SOM神經(jīng)網(wǎng)絡(luò)模型中,分類后,xt就變?yōu)榫€性空間中的離散點時間序列Ct∈{C1,C2,…,CN},如式(7)所示[14]:
Ct=Ci(xt)
(7)
式中Ct為t時刻最接近xt的節(jié)點。
因為SOM在競爭層節(jié)點相關(guān)關(guān)聯(lián),所以每個神經(jīng)元節(jié)點與其鄰域節(jié)點有很強的相關(guān)性,而與區(qū)域外節(jié)點的相關(guān)性較弱??梢砸暈橥負浣Y(jié)構(gòu)中一個神經(jīng)元到另一個神經(jīng)元的轉(zhuǎn)移,挖掘數(shù)據(jù)時間變化規(guī)律。
(1)神經(jīng)元的概率密度函數(shù)
當(dāng)使用一階轉(zhuǎn)移概率P概率來表示神經(jīng)元之間的相關(guān)性時,AR(N)模型中的神經(jīng)元之間的一階傳遞概率P[ct+1|ct,ct-1,…,c1],AR(1)模型中的神經(jīng)元之間的一階傳遞轉(zhuǎn)移概率可以簡化為P[ct+1|ct]。
令{C1,C2,…,CN}的取值為{1,2,…,N},t時刻的概率可以通過式(5)推導(dǎo),ct的取值為CI的概率如式(8)所示[15]:
P[ct=CI]=P[i(xt)=I]
(8)
由式(7)和式(8)導(dǎo)出的概率密度函數(shù)如式(9)所示:
(9)
由于x和c是一維數(shù)組,因此令a=(CI+CI+1)/2,且b=(CI+CI-1)/2,由于xt服從正態(tài)分布,xt概率分布函數(shù)可以表示為標(biāo)準(zhǔn)正態(tài)分布函數(shù),如式(10)所示[16]:
(10)
當(dāng)I= 1 時,如式(11)所示:
(11)
當(dāng)I=N時,如式(12)所示:
(12)
(2)神經(jīng)元之間的傳遞
AR過程中數(shù)據(jù)較為平穩(wěn)。二階概率分布函數(shù)如式(13)所示:
P[ct=CI1,ct+k=C12]=P[xt∈(b1,a1),xt+k∈(b2,a2)]
(13)
式中CI1,CI2∈{C1,…,CN},I1=(a1,b1),I2=(a2,b2)。因為xt服從正態(tài)分布,所以xt的二階正態(tài)分布函數(shù)如式(14)所示[17]:
(14)
式中ρ(k)=αk為一階AR過程的自相關(guān)函數(shù)。
在該模型中,神經(jīng)元僅轉(zhuǎn)移一步,故式(13)可由式(12)和式(14)轉(zhuǎn)化為式(15):
(15)
在實際的操作過程中,由于設(shè)備屬性、操作條件和環(huán)境的差異,很難用準(zhǔn)確、統(tǒng)一的函數(shù)來表示設(shè)備狀態(tài)監(jiān)控參數(shù)。例如,變壓器熱點溫度和底油溫度、頂油溫度、環(huán)境溫度和負荷等參數(shù)之間的關(guān)系主要由熱平衡方程式給出。熱平衡方程具有許多參數(shù),并且在高溫下常常不準(zhǔn)確,從而難以檢測異常熱點溫度。
為了解決多維參數(shù)融合的問題,采用具有噪聲的基于密度的聚類方法(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)完成多維在線監(jiān)測數(shù)據(jù)的聚類,簡化了不同參數(shù)之間的復(fù)雜關(guān)聯(lián)[18]。
通過以上提取算法,可以快速檢測在線監(jiān)視數(shù)據(jù)流中的異常。具體步驟如下:
步驟一:根據(jù)每個參數(shù)的歷史數(shù)據(jù),使用AR模型和SOM神經(jīng)網(wǎng)絡(luò)算法計算單參數(shù)轉(zhuǎn)移概率矩陣{X1,X2,…,XN}[19]。
步驟二:使用DBSCAN算法對所有參數(shù)的歷史數(shù)據(jù)進行聚類以獲得m個正常聚類簇。
步驟三:用步驟一中的轉(zhuǎn)移概率矩陣替換在線監(jiān)測實時數(shù)據(jù)流,得到各參數(shù)的轉(zhuǎn)移概率序列,然后判斷每個時間點的數(shù)據(jù)是否屬于m個聚類簇。
步驟四:根據(jù)步驟三的結(jié)果執(zhí)行異常檢測,邏輯如下:
(1)如果每個參數(shù)的轉(zhuǎn)移概率序列不為零,數(shù)據(jù)流中的數(shù)據(jù)屬于m個簇,則該數(shù)據(jù)段正常。
(2)如果具有少量參數(shù)的轉(zhuǎn)移概率序列為零個,數(shù)據(jù)流中有一小部分數(shù)據(jù)不屬于m個簇,則認為該數(shù)據(jù)有少量噪聲,為可以忽略的傳感器異常。
(3)如果k個參數(shù)的轉(zhuǎn)移概率序列中有一段為0,數(shù)據(jù)流中有一小部分數(shù)據(jù)不屬于m個簇,則設(shè)備參數(shù)異常,設(shè)備運行狀態(tài)異常。
(4)對于邏輯(3)的異常操作狀態(tài),從每個參數(shù)的轉(zhuǎn)變概率序列的過零確定參數(shù)的異常發(fā)生時間。檢測過程如圖3所示。
圖3 檢測流程
在當(dāng)?shù)乇O(jiān)測中心取220 kV主變壓器正常運行時的在線監(jiān)測數(shù)據(jù),以變壓器油溫、設(shè)備負荷、環(huán)境溫度等為例評估設(shè)備的狀態(tài),取2019年的數(shù)據(jù),以7月15日—7月22日為樣本,并取7月23日12點—20點數(shù)據(jù)為待測樣本。以每分鐘采集一次這些狀態(tài)變量,總計480組。通過AR(1)模型擬合后參數(shù)為λ=0.01、α=0.85、μe=0,設(shè)置 SOM 的神經(jīng)元個數(shù)為 12,兩相鄰時刻的數(shù)據(jù)屬于同一神經(jīng)元的概率最大。如圖4所示,設(shè)備負荷和油溫在380點后上升趨勢平穩(wěn)。
圖4 變壓器檢測信號
通過文中方法進行異常檢測結(jié)果如圖5所示??梢缘玫揭韵陆Y(jié)論。
圖5 變壓器異常檢測結(jié)果
(1)觀測時刻80 min處油溫有0點,這種情況下的聚類結(jié)果也顯示異常值,但是由于時間傳遞概率高,聚類結(jié)果正常,判斷為傳感器異常引起,可忽略[20]。
(2)油溫和負荷的推移概率在觀測時為0。在觀測時刻(390~410)min處,轉(zhuǎn)移概率序列的值上下波動,并且有很多零點。聚類結(jié)果還表明,在觀測時刻(390~500)min處大多數(shù)觀測數(shù)據(jù)不屬于常規(guī)聚類。因此,從觀測時間384 min處(對應(yīng)于時間18:20)開始運行異常,出現(xiàn)油溫和負荷快速升高的現(xiàn)象。并且偏離正常值,此時應(yīng)發(fā)出異常運行狀況的早期預(yù)警。
在查看日志和記錄后,在7月23日18:15,變壓器收到調(diào)度命令,在高負載系數(shù)1.1~1.2下,工作75分鐘后,在7:30恢復(fù)正常運行。檢測與實際相同,文中方法能夠完成變壓器異常檢測。
在變壓器狀態(tài)評估中沒有油溫、負荷、環(huán)境溫度的閾值標(biāo)準(zhǔn) 。使用閾值判定方法,根據(jù)經(jīng)驗選擇1.2倍。即如果測量數(shù)據(jù)超過正常值的1.2倍,則判斷為異常,有以下結(jié)果。
(1)在觀測時刻80 min處油溫異常;
(2)觀測時刻450 min(相當(dāng)于18:50)以后,油溫和負載同時異常。閾值判定方法的異常檢測結(jié)論滯后于實際情況,無法杜絕傳感器異常引起的誤判。
在當(dāng)?shù)乇O(jiān)測中心選擇500 kV的輸電線路覆冰數(shù)據(jù)。每年11月至2月,冰層覆蓋率最高,將2019年處于重冰覆蓋的9月至11月附冰裝置采集數(shù)據(jù)作為訓(xùn)練樣本。數(shù)據(jù)如圖6所示。從2019年12月到2020年1月數(shù)據(jù)為待測樣本,設(shè)備的采樣周期為一小時。
圖6 輸電線路覆冰監(jiān)測數(shù)據(jù)
在對SOM網(wǎng)絡(luò)和集群進行訓(xùn)練之后,將圖6數(shù)據(jù)作為輸入,通過文中檢測流程,得到如圖7所示轉(zhuǎn)移概率序列和聚類結(jié)果??梢缘玫揭韵陆Y(jié)論。
圖7 輸電線路異常檢測結(jié)果
(1)在觀測時刻345 h時,具有大量接近0或為0的數(shù)據(jù)。在觀測時刻(380~400)h段,導(dǎo)線拉力和傾角幾乎都為0點,從聚類結(jié)果來看,該數(shù)據(jù)段不屬于常規(guī)聚類,在觀測時刻(400~580)h段有聚類異常。因此,在觀測時刻380 h時(12月17日)就存在覆冰異常,可判斷當(dāng)天輸電線路狀態(tài)異常。
(2)觀測時間在(590~610)h段(12月26日)導(dǎo)線張力、傾角和風(fēng)速的轉(zhuǎn)換概率序列中有很多零點,聚類結(jié)果介于正常和異常之間,從而確定覆冰厚度異常增大,線路檢測異常,每日覆冰均有記錄。線路的結(jié)冰厚度從去年12月以來,約為2 mm。16日,由于天氣(寒冷,小雪,大霧),線路的冰層厚度迅速增加。在18日對冰上的涂層進行特別檢查時,發(fā)現(xiàn)監(jiān)控設(shè)備附近的冰厚度超過10 mm。線路檢查員向有關(guān)部門報告后,主管部門發(fā)出了異常檢測信息,與異常檢測結(jié)果相一致。12月26日以后,檢測出異常,但覆冰厚度僅為8.7 mm,這可能是風(fēng)速增加導(dǎo)致的張力異常,非覆冰引起。
在評估輸電線路狀態(tài)時,將早期覆冰厚度預(yù)警值設(shè)置為10 mm。根據(jù)該預(yù)警值,采用閾值判斷方法進行異常檢測。圖8所示覆冰厚度的時變曲線。閾值異常僅在觀察時刻446 h處(對應(yīng)于12月20日)出現(xiàn),預(yù)警時間晚于文中的方法,并且在觀測時間(570~610)h段也出現(xiàn)閾值異常,與實際不同??梢缘贸鑫闹蟹椒▋?yōu)于閾值判斷方法。
圖8 覆冰厚度變化曲線
文中結(jié)合大數(shù)據(jù)分析技術(shù)和設(shè)備評估技術(shù),提出了一種基于時間序列和神經(jīng)網(wǎng)絡(luò)的狀態(tài)數(shù)據(jù)異常檢測方法。通過AR時間序列模型和SOM神經(jīng)網(wǎng)絡(luò)將連續(xù)的電力設(shè)備數(shù)據(jù)離散為單個序列,計算狀態(tài)變量在時間軸上的轉(zhuǎn)移概率。通過實驗對該方法的合理性和有效性進行驗證。結(jié)果表明該方法可以快速、有效地檢測電力設(shè)備異常狀態(tài)。后續(xù)將針對不斷增長的電力設(shè)備數(shù)量和數(shù)據(jù)規(guī)模,完善基于大數(shù)據(jù)技術(shù)的電力設(shè)備異常狀態(tài)檢測模型。