馬洪斌,王文峰,石峰,楊飛,郇帥
(國網(wǎng)棗莊供電公司,山東 棗莊 277000)
電網(wǎng)的安全穩(wěn)定運(yùn)行是保障電力可靠供應(yīng)的基礎(chǔ),作為電網(wǎng)組成部分的電力設(shè)備是否得到及時、準(zhǔn)確的監(jiān)測對于電網(wǎng)堅(jiān)強(qiáng)運(yùn)行至關(guān)重要。通過對設(shè)備進(jìn)行有效的監(jiān)測分析,了解設(shè)備的整體運(yùn)行狀況,可大大降低設(shè)備故障發(fā)生的概率,保障居民穩(wěn)定用電和經(jīng)濟(jì)社會高效發(fā)展[1-3]。
隨著大數(shù)據(jù)分析技術(shù)在電力領(lǐng)域的廣泛應(yīng)用,變電設(shè)備監(jiān)測分析的方法也得到廣泛的研究,文獻(xiàn)[4]針對變電設(shè)備狀態(tài)評價參數(shù)復(fù)雜多樣且各參數(shù)之間存在不明確的關(guān)聯(lián)關(guān)系,應(yīng)用主成分分析構(gòu)建參數(shù)體系。文獻(xiàn)[5]針對輸電線路的狀態(tài)評價問題,提出了構(gòu)建多棵決策樹組合模型。文獻(xiàn)[6]針對設(shè)備的類別及設(shè)備數(shù)據(jù)的結(jié)構(gòu),通過構(gòu)建支持向量機(jī)分析模型進(jìn)行狀態(tài)評價。文獻(xiàn)[7]通過對變壓器運(yùn)行過程中的監(jiān)測數(shù)據(jù)及變壓器的缺陷故障等數(shù)據(jù)進(jìn)行處理,并提取其故障特征向量,進(jìn)行數(shù)據(jù)建模和優(yōu)化處理,實(shí)現(xiàn)對變壓器故障識別的高準(zhǔn)確性。
變電設(shè)備的狀態(tài)評價影響因素眾多,設(shè)備參數(shù)、運(yùn)行工況、試驗(yàn)數(shù)據(jù)等信息均與設(shè)備的狀態(tài)密切相關(guān),隨著大數(shù)據(jù)技術(shù)應(yīng)用和數(shù)據(jù)中臺建設(shè),加快了電力數(shù)據(jù)分析和應(yīng)用,中臺的建設(shè),逐步實(shí)現(xiàn)對設(shè)備信息、運(yùn)行信息等大量數(shù)據(jù)的集成共享,逐漸形成了電力大數(shù)據(jù)體系,結(jié)合大數(shù)據(jù)分析技術(shù)對設(shè)備進(jìn)行狀態(tài)監(jiān)測有了強(qiáng)力的支撐[8-10]。
本文第一部分首先提出了變電設(shè)備關(guān)鍵參數(shù)體系,第二部分介紹變電設(shè)備狀態(tài)評價分析模型的搭建,第三部分展示變電設(shè)備狀態(tài)評價結(jié)果。通過對建立設(shè)備的參數(shù)體系,提取設(shè)備的特征信息,采用梯度提升樹算法搭建設(shè)備監(jiān)測分析模型,實(shí)現(xiàn)對設(shè)備的精準(zhǔn)、快速、可靠分析。
變電設(shè)備從出廠到現(xiàn)場運(yùn)行到發(fā)生缺陷及故障直至報(bào)廢過程中會產(chǎn)生大量的信息及數(shù)據(jù),這些數(shù)據(jù)通常表征著設(shè)備的運(yùn)行狀態(tài)。通過對設(shè)備的運(yùn)行數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,可以將設(shè)備數(shù)據(jù)分為靜態(tài)參數(shù)、實(shí)時參數(shù)、準(zhǔn)實(shí)時參數(shù)[11-13],將三類參數(shù)作為電力設(shè)備狀態(tài)評價的因素對設(shè)備的運(yùn)行狀態(tài)進(jìn)行識別。靜態(tài)參數(shù)信息主要包括設(shè)備的技術(shù)參數(shù)、投運(yùn)日期、地理位置、出廠實(shí)驗(yàn)參數(shù)等。實(shí)時參數(shù)信息主要是設(shè)備的在線監(jiān)測信息及運(yùn)行環(huán)境氣象信息。準(zhǔn)實(shí)時參數(shù)據(jù)信息主要是設(shè)備的帶電檢測數(shù)據(jù)、設(shè)備的故障、缺陷及檢修等信息。通過對變電設(shè)備的靜態(tài)參數(shù)、實(shí)時參數(shù)、準(zhǔn)實(shí)時參數(shù)進(jìn)行分析,滿足設(shè)備狀態(tài)評價的科學(xué)性和準(zhǔn)確性。
本文分析的變電設(shè)備主要是110kV及220kV變電站內(nèi)的設(shè)備,包括油浸式變壓器、互感器、開關(guān)等。結(jié)合設(shè)備的實(shí)際運(yùn)行分析和設(shè)備狀態(tài)評價研究,對變電設(shè)備的運(yùn)行參數(shù)進(jìn)行選擇。針對電壓互感器、電流互感器、斷路器和隔離開關(guān)的特征主要包括基本參數(shù)、缺陷數(shù)據(jù)和試驗(yàn)數(shù)據(jù)。由于目前變電站內(nèi)的高壓變壓器設(shè)備主要是以絕緣油作為介質(zhì),在實(shí)際的運(yùn)行過程中,隨著負(fù)荷的增加,油溫的變化,油中會產(chǎn)生大量的氣體,通過對油中氣體進(jìn)行監(jiān)測分析和試驗(yàn)研判,實(shí)現(xiàn)變壓器的運(yùn)行的有效監(jiān)測,因此對變壓器設(shè)備的特征選取主要包括基本參數(shù)、油中氣體、缺陷數(shù)據(jù)和試驗(yàn)數(shù)據(jù)。
根據(jù)特征提取獲得的基本參數(shù)信息、油中氣體數(shù)據(jù)信息、缺陷數(shù)據(jù)信息和試驗(yàn)數(shù)據(jù)信息,通過關(guān)鍵字段關(guān)聯(lián)生成樣本數(shù)據(jù)寬表,在對樣本數(shù)據(jù)的標(biāo)簽定義上,通過結(jié)合實(shí)際的工作對每條樣本數(shù)據(jù)集的故障類型進(jìn)行標(biāo)簽化,包括正常、注意、異常等三種狀態(tài)類型。將得到的變電設(shè)備狀態(tài)評價特征信息和所對應(yīng)的故障類型信息作為新的數(shù)據(jù)集,對數(shù)據(jù)集進(jìn)行數(shù)據(jù)預(yù)處理操作,確保數(shù)據(jù)的完整性和可靠性。針對數(shù)據(jù)集數(shù)據(jù)存在缺失的情況,采用前一項(xiàng)或后一項(xiàng)數(shù)據(jù)進(jìn)行填充,對缺失值進(jìn)行補(bǔ)全。針對數(shù)據(jù)集中數(shù)據(jù)由于采集裝置異常等原因造成的數(shù)據(jù)異常問題,對異常數(shù)據(jù)進(jìn)行刪除操作,得到干凈的數(shù)據(jù)。由于機(jī)器學(xué)習(xí)只能識別數(shù)值,無法對狀態(tài)的文字進(jìn)行判斷,因此將電力設(shè)備的狀態(tài)信息進(jìn)行數(shù)值化處理,對設(shè)備狀態(tài)評價結(jié)果正常、注意、異常三種狀態(tài)分別采用0、1、2表示,得到完整的電力設(shè)備樣本數(shù)據(jù)集[14-15]。數(shù)據(jù)集包括每條樣本設(shè)備數(shù)據(jù)的參數(shù)及數(shù)據(jù)對應(yīng)的設(shè)備運(yùn)行狀態(tài)。
圖1 設(shè)備參數(shù)Fig.1 Parameters of equipment
結(jié)合設(shè)備的靜態(tài)參數(shù)、實(shí)時參數(shù)、準(zhǔn)實(shí)時參數(shù),對設(shè)備參數(shù)進(jìn)行選取,所用的參數(shù)如下:運(yùn)行天數(shù)、運(yùn)行月數(shù),運(yùn)行年數(shù),設(shè)備類型,設(shè)備廠家,電壓等級,氣體數(shù)據(jù)、缺陷總次數(shù),危急缺陷次數(shù),嚴(yán)重缺陷次數(shù),一般缺陷次數(shù),已消缺缺陷數(shù),未消缺缺陷數(shù),設(shè)備試驗(yàn)數(shù)據(jù),設(shè)備名稱編號等15項(xiàng)參數(shù)數(shù)據(jù)。
主成分分析是一種將多變量進(jìn)行組合,從而得到較少變量的一種降維方法。原始的變量之間存在關(guān)聯(lián)關(guān)系,通過線性組合的方式生成互不相關(guān)的綜合指標(biāo),即主成分。通過主成分分析可以大大減少變量的個數(shù),降低數(shù)據(jù)之間存在的關(guān)聯(lián)關(guān)系導(dǎo)致的信息冗余等問題[16-17]。
基本原理是假設(shè)有p個綜合評價的原始指標(biāo)x1,x2,…,xp,設(shè)定這些指標(biāo)在m個單位之間進(jìn)行比較,則共有mp個數(shù)據(jù)。主成分分析是把原始的指標(biāo)進(jìn)行組合形成新的互不關(guān)聯(lián)的新的指標(biāo)y1,y2,…,yp,新的指標(biāo)為原始指標(biāo)的線性組合函數(shù):
(1)
由以上的分析可以得到綜合指標(biāo)yi之間是線性不相關(guān)的。主成分分析得到的新的指標(biāo)y1,y2,…,yp,對于新指標(biāo)的方差按照從大到小的順序進(jìn)行排序,p個綜合指標(biāo)的方差之和等于原始指標(biāo)的總方差。若p個綜合指標(biāo)的前r個即可以有效地表征原始指標(biāo)的信息,那么我們就將r值作為我們得到的主成分個數(shù)。通過主成分分析,我們將指標(biāo)的個數(shù)由p個降為r個(r
主成分分析的步驟主要包括以下。
(1)對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。得到的數(shù)據(jù)往往由于量綱或者數(shù)量的大小存在差異,影響分析結(jié)果,因此在進(jìn)行主成分分析之前,對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化。
(2)查看指標(biāo)之間的關(guān)聯(lián)關(guān)系,通過計(jì)算指標(biāo)之間的協(xié)方差,得到協(xié)方差矩陣。
(3)計(jì)算協(xié)方差矩陣的特征值和特征向量,識別主成分。主成分是原始指標(biāo)線性組合得到的,之間相關(guān)獨(dú)立互不關(guān)聯(lián),第一個主成分中包含了最多的信息,第二個主成分第二多,以此類推。得到p個主成分,其相加信息等于原始指標(biāo)。
(4)通過特征值的順序?qū)μ卣飨蛄窟M(jìn)行排序,從最高到最低,即得到按重要性排序的主成分,根據(jù)實(shí)際需求選擇合適的主成分進(jìn)行評價分析。
決策樹是一種采用樹狀結(jié)構(gòu)對數(shù)據(jù)進(jìn)行分類的分析模型。通常應(yīng)用于預(yù)測分析,通過決策樹對大量的數(shù)據(jù)進(jìn)行分類分析,找到數(shù)據(jù)內(nèi)部潛在的價值信息。決策樹分類樹結(jié)構(gòu)簡單易懂,描述簡單,分類速度較快,便于人們理解,同時決策樹的樹狀分析結(jié)構(gòu)決定了在構(gòu)建決策樹模型時不需要大量的額外訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)[19-20]。
通常采用信息熵對決策樹進(jìn)行屬性選擇,信息熵是描述消息中,不確定性的值,也叫不確定程度。熵越低,不確定性越低,就更容易得到確定的信息;熵越高,不確定性就越高,就難以得到確定的信息。在決策樹種由于存在各個分支,各個分支中的樣本數(shù)量又是不同的,若某一個分支中含有的樣本數(shù)越大,則它的影響就越大,考慮到該問題采用權(quán)重方式進(jìn)行處理。因此我們采用信息增益的方式對分支進(jìn)行選擇若計(jì)算得到信息增益值較大,則表明使用該屬性進(jìn)行分支劃分時信息的純度越高,效果越好。
決策樹的生成步驟如下所示:
(1)首先是所有的特征均為符號值,即離散值。如果某個特征的值為連續(xù)值,那么需要先將其離散化。
(2)決策樹中包含有根節(jié)點(diǎn)、葉節(jié)點(diǎn)以及中間的路徑,一個節(jié)點(diǎn)代表一個對象,在節(jié)點(diǎn)之間的分叉路徑處代表屬性值,從根節(jié)點(diǎn)到葉節(jié)點(diǎn)中間的路徑代表對象值。某一個節(jié)點(diǎn)數(shù)據(jù)若都屬于同一類型的話,那么該節(jié)點(diǎn)就是葉節(jié)點(diǎn)。若樣本數(shù)據(jù)不是同一類型的話,我們就利用信息熵、信息增益來對樣本數(shù)據(jù)進(jìn)行劃分,選擇信息增益大的特征作為根節(jié)點(diǎn)。
(3)依次遞歸,直至特征劃分時信息增益很小或者為特征可以劃分,我們就得到了決策樹模型。遞歸操作的停止條件為:一個節(jié)點(diǎn)中所有樣本數(shù)據(jù)均為一類;沒有特征可以用來對該節(jié)點(diǎn)樣本進(jìn)行劃分;沒有樣本能夠滿足其他特征的取值。
梯度提升樹是一種組合的算法,通過對多個決策樹的結(jié)果進(jìn)行求和得到梯度提升樹的識別結(jié)果。每棵決策樹針對其中的部分?jǐn)?shù)據(jù)做出預(yù)測,所有樹的結(jié)果加起來即可以很好地分析最終結(jié)果,通過增加樹的數(shù)量,可以不斷迭代提升識別性能,是一種泛化能力較強(qiáng)的算法,占用內(nèi)存較少,且預(yù)測速度較快[21-22]。
X為屬性向量,假設(shè)梯度提升樹模型生成了n個弱回歸樹,每一個弱回歸樹得到一個預(yù)測結(jié)果fi(X),i=1,2,…,n,f0為模型的初始值,則梯度提升樹的預(yù)測結(jié)果為n個弱回歸樹的預(yù)測結(jié)果之和,
F(X)=f0+f1(X)+…+fn(X)
(2)
梯度提升樹的步驟如下。
對于給定的訓(xùn)練集數(shù)據(jù),表達(dá)式如下:
T={(X1,y1),(X2,y2),…,(XN,yN)},
Xi∈γ∈Rn,yi∈γ∈R
(3)
N為訓(xùn)練樣本數(shù)據(jù)的個數(shù),對于每個樣本數(shù)據(jù)Xi都含有z個變量(x1i,x2i,…,xzi),損失函數(shù)為L(y,f(x)),假設(shè)進(jìn)行了M次的迭代過程,則梯度提升樹的實(shí)現(xiàn)步驟如下所示。
(1)對模型進(jìn)行初始化。首先我們要找到一個常數(shù)值c,確保常數(shù)值使得損失函數(shù)L最小,
(4)
對于這里的回歸樹模型,我們采用平方誤差損失函數(shù):
(5)
式中:y為真實(shí)值;g(x)為預(yù)測值。
(2)迭代過程。迭代的總次數(shù)為M。
1)對于i=1,2,…,N,通過計(jì)算得到損失函數(shù)的負(fù)梯度:
(6)
對于平方誤差損失函數(shù),其梯度為:
(7)
將梯度函數(shù)負(fù)梯度表達(dá)式進(jìn)行簡化得到:
rmi=yi-fm-1(Xi)
(8)
當(dāng)我們利用平方誤差函數(shù)進(jìn)行求解時,上式得到的誤差稱為擬合殘差。
2)我們將得到的(Xi,rmi),i=1,2,…,N從新作為訓(xùn)練數(shù)據(jù),繼續(xù)使用回歸樹模型進(jìn)行學(xué)習(xí),這樣就得到了若干個葉節(jié)點(diǎn)區(qū)域,Rmj,j=1,2,…,J,其中J為第m顆弱回歸樹的葉節(jié)點(diǎn)數(shù)。
3)針對葉節(jié)點(diǎn)區(qū)域Rmj,j=1,2,…,J,我們利用線性搜索的方法求解使損失函數(shù)最小時所對應(yīng)的常數(shù)c的值,
(9)
4)更新強(qiáng)回歸模型為:
(10)
式中:I()是指示函數(shù),當(dāng)Xi落入Rmj中,該值為1,否則該值為0。
(3)通過迭代,并結(jié)合式(1)我們得到了最終的預(yù)測模型:
F(X)=fM(X)
(11)
影響變電設(shè)備狀態(tài)評價的特征信息較多,考慮到大量信息作為特征輸入會降低模型學(xué)習(xí)的時間和效率。對選取的運(yùn)行天數(shù)、運(yùn)行月數(shù),運(yùn)行年數(shù),設(shè)備類型,設(shè)備廠家,電壓等級,氣體數(shù)據(jù)、缺陷總次數(shù),危急缺陷次數(shù),嚴(yán)重缺陷次數(shù),一般缺陷次數(shù),已消缺缺陷數(shù),未消缺缺陷數(shù),設(shè)備試驗(yàn)數(shù)據(jù),設(shè)備名稱編號等15項(xiàng)參數(shù)作進(jìn)一步的篩選,選擇差異性明顯的指標(biāo)變量作為建模變量。通過對15項(xiàng)參數(shù)進(jìn)行均值和標(biāo)準(zhǔn)差計(jì)算,并用非參數(shù)檢驗(yàn)方法對各參數(shù)進(jìn)行校驗(yàn),發(fā)現(xiàn)設(shè)備廠家、氣體數(shù)據(jù)和試驗(yàn)數(shù)據(jù)的P值均大于0.05,指標(biāo)差異性不顯著剔除,保留12項(xiàng)特征參數(shù)信息。通過對含有12項(xiàng)特征信息的數(shù)據(jù)集分為訓(xùn)練集和測試集數(shù)據(jù),以訓(xùn)練集數(shù)據(jù)進(jìn)行識別分類器模型構(gòu)建,并通過測試集數(shù)據(jù)驗(yàn)證模型的準(zhǔn)確性。選擇準(zhǔn)確率較高的分類器作為我們的故障識別模型。進(jìn)一步對12項(xiàng)特征參數(shù)信息進(jìn)行主成分分析,選擇合適的主成分因子個數(shù),分析因子貢獻(xiàn)率,得到降維的表征設(shè)備狀態(tài)的主成分。將新的特征信息作為樣本數(shù)據(jù)集,劃為訓(xùn)練集和測試集,以訓(xùn)練集數(shù)據(jù)進(jìn)行訓(xùn)練學(xué)習(xí)得到設(shè)備的狀態(tài)識別模型,利用測試集數(shù)據(jù)對模型的識別結(jié)果進(jìn)行驗(yàn)證分析。模型采用梯度提升樹作為狀態(tài)識別模型,為驗(yàn)證模型的準(zhǔn)確性,同時采用決策樹、隨機(jī)森林等多種模型進(jìn)行分析,并結(jié)合交叉驗(yàn)證進(jìn)行驗(yàn)證[23]。
將含有12項(xiàng)特征參數(shù)的數(shù)據(jù)集分為訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)進(jìn)行數(shù)據(jù)建模和模型驗(yàn)證,并通過與決策樹、隨機(jī)森林、AdaBoost、KNN、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、XGBoost、LGBM等分類器進(jìn)行比較分析[24-29]。數(shù)據(jù)集數(shù)據(jù)為474條,訓(xùn)練集數(shù)據(jù)為332條,測試集數(shù)據(jù)為142條。各分類器的分類識別結(jié)果如表1 所示。
表1 不同分類器識別結(jié)果Tab.1 Identify results of different classifier
從表中的分析結(jié)果可以看出在9個分類器中,KNN的訓(xùn)練用時最小,僅為0.006s,但是其訓(xùn)練集和測試集的準(zhǔn)確率過低,分別為0.801、0.601。梯度提升樹的訓(xùn)練用時較長為1.349s,但是訓(xùn)練集和測試集的準(zhǔn)確率較高,分別為1、0.839。在實(shí)際工作中,檢修運(yùn)維人員對于設(shè)備的狀態(tài)評價考慮更多的是識別結(jié)果的準(zhǔn)確率,因此我們舍棄訓(xùn)練時間因素,考慮高識別率,最終選擇梯度提升樹作為我們的變電設(shè)備狀態(tài)識別模型。
進(jìn)一步對梯度提升樹分類模型的識別結(jié)果進(jìn)行分析,細(xì)化每類設(shè)備狀態(tài)的識別結(jié)果,得到如下表2的結(jié)果。
表2 變電設(shè)備不同狀態(tài)識別結(jié)果Tab.2 Identify results of different status of substation equipment
由以上的分析結(jié)果可以看到,模型對于正常狀態(tài)、注意狀態(tài)的識別準(zhǔn)確率較高,分別為85.91%、83.10%,由于異常狀態(tài)的數(shù)據(jù)樣本數(shù)較少,導(dǎo)致識別效果較差。
為進(jìn)一步優(yōu)化狀態(tài)評價模型的特征參數(shù),通過主成分分析對特征參數(shù)進(jìn)行方差解釋,獲得主成分分析的個數(shù)及每一個成分的貢獻(xiàn)率和主成分的累計(jì)貢獻(xiàn)率,得到結(jié)果如下表3所示。
表3 主成分分析結(jié)果Tab.3 Analyze results of principal component
基于以上的分析結(jié)果可以看出在主成分4時,總方差解釋的特征根低于1,變量解釋的貢獻(xiàn)率達(dá)到75.321%,可以有效地表征設(shè)備的特征,因此我們選擇四個主成分進(jìn)行分析。
表4 主成分分析因子載荷系數(shù)Tab.4 Load coefficient of analyze fctor of principal component
上表為因子載荷系數(shù)表,可以分析到每個主成分中隱變量的重要性。在主成分1中缺陷總次數(shù)、一般缺陷次數(shù)、已消缺缺陷數(shù)的權(quán)重較大,主要體現(xiàn)為缺陷數(shù)據(jù)對特征的影響;在主成分2中天數(shù)、月數(shù)和年數(shù)的權(quán)重較大,主要體現(xiàn)為設(shè)備的運(yùn)行時間對特征的影響;在主成分3中,危急缺陷次數(shù)、嚴(yán)重缺陷次數(shù)的權(quán)重較大,主要體現(xiàn)在缺陷的程度對特征的影響;在主成分4中,主要是設(shè)備的運(yùn)行時間對特征的影響,在共同度分析中,可以得到電壓等級、嚴(yán)重缺陷次數(shù)和未消缺缺陷數(shù)的權(quán)重較小,因此排除掉電壓等級、嚴(yán)重缺陷次數(shù)和未消缺次數(shù),保留其他參數(shù)作為主成分。
將含有天數(shù)、月數(shù)、年數(shù)、設(shè)備類型、num、缺陷總次數(shù)、危急缺陷次數(shù)、一般缺陷次數(shù)、已消缺缺陷數(shù)等9項(xiàng)特征參數(shù)的數(shù)據(jù)集分為訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)進(jìn)行數(shù)據(jù)建模和模型驗(yàn)證,選擇狀態(tài)識別模型為梯度提升樹,對訓(xùn)練集數(shù)據(jù)進(jìn)行驗(yàn)證分析,數(shù)據(jù)集數(shù)據(jù)為474條,訓(xùn)練集數(shù)據(jù)為332條,測試集數(shù)據(jù)為142條。梯度提升樹的分類識別結(jié)果如下表5所示。
表5 主成分分析分類識別結(jié)果Tab.5 Results of calssifying identify of principal component
由上表的識別結(jié)果可以看出,基于主成分分析獲得新的特征數(shù)據(jù)集,通過梯度提升樹分類器模型進(jìn)行建模分析,訓(xùn)練集、交叉驗(yàn)證集和測試集的準(zhǔn)確率分別為1、0.758和0.881,相比于未進(jìn)行主成分分析的故障識別結(jié)果0.839,準(zhǔn)確率上升了0.042。
對每類設(shè)備狀態(tài)的識別結(jié)果進(jìn)行分析,得到如下表6結(jié)果 。
表6 變電設(shè)備不同狀態(tài)識別結(jié)果Tab.6 Identify results of different status of substation equipment
由以上的分析結(jié)果可以看出正常狀態(tài)、注意狀態(tài)的識別準(zhǔn)確率分別為83.10%、94.37%,相對于主成分分析之前的結(jié)果得到了大大的提升,同時我們得到注意狀態(tài)的識別準(zhǔn)確率達(dá)到94.37%,相比于未進(jìn)行主成分分析之前的識別率83.10%,提高了11.27%,注意狀態(tài)的識別效果更好,對于我們在日常的變電設(shè)備監(jiān)測中具有較好的指導(dǎo)意義。
本文通過梳理變電設(shè)備的參數(shù)體系,選擇特征信息,采用主成分分析獲得新的特征參數(shù)集,搭建梯度提升樹分類模型,并與其他類型的分類器識別結(jié)果進(jìn)行比較分析,驗(yàn)證梯度提升樹的準(zhǔn)確性,對于設(shè)備的監(jiān)測分析具有重要的意義。在特征的選擇上結(jié)合數(shù)據(jù)分析技術(shù)進(jìn)行優(yōu)化,將會進(jìn)一步提升狀態(tài)評價結(jié)果的準(zhǔn)確性和可靠性。