中國能源建設(shè)集團廣東省電力設(shè)計研究院有限公司 譚卓敏 姚 池 何智文 廖德芳 關(guān)秋楠
近年來,我國社會經(jīng)濟出現(xiàn)跨越式發(fā)展,據(jù)專業(yè)人員統(tǒng)計發(fā)現(xiàn),在2020年全國GDP總量超過100萬億,和1980年相比,增長幅度為4000%。在這種經(jīng)濟奇跡增長背后,和我國電力工業(yè)提供的基礎(chǔ)保障能源有直接聯(lián)系,隨著電網(wǎng)規(guī)模不斷拓展,無形中提高了電網(wǎng)供電能力,但也增加了電網(wǎng)運行的安全風(fēng)險。
目前,我國遼寧省有很多變電站均受到惡劣天氣影響,出現(xiàn)安全故障,導(dǎo)致很多區(qū)域發(fā)生停電事故,損失負荷為255.2MW,說明自然災(zāi)害嚴重影響到電網(wǎng)運行。除了外在因素影響外,和電網(wǎng)結(jié)構(gòu)、設(shè)備故障等因素有關(guān)聯(lián),電網(wǎng)設(shè)備作為電力網(wǎng)絡(luò)的重要環(huán)節(jié),一旦該環(huán)節(jié)出現(xiàn)安全事故,必然誘發(fā)嚴重的電網(wǎng)振蕩,甚至導(dǎo)致電網(wǎng)系統(tǒng)崩潰,嚴重影響到工農(nóng)業(yè)生產(chǎn)效率[1]。
電網(wǎng)設(shè)備狀態(tài)量是指能直觀反映電網(wǎng)設(shè)備實際運行情況的信息。由于電網(wǎng)設(shè)備結(jié)構(gòu)過于復(fù)雜,單個信息不能反映出設(shè)備實際健康狀況,但值得注意的是,要合理控制狀態(tài)量選擇數(shù)量。在故障診斷過程中,狀態(tài)量過多很容易影響到判斷的準確性,導(dǎo)致有用信息被無效數(shù)據(jù)埋沒,不利于工作人員判斷電網(wǎng)設(shè)備實際情況。因此,在選擇狀態(tài)量時,要嚴格遵循科學(xué)性、典型性等原則。其中典型性原則決定著設(shè)備健康評價質(zhì)量,能準確反映出設(shè)備特征,狀態(tài)量選擇中并非依靠數(shù)量,如果其數(shù)量過多,不僅會提高數(shù)據(jù)收集難度系數(shù),還會摻雜各種不相關(guān)狀態(tài)量,避免其對狀態(tài)評價造成負面影響。可見,典型性狀態(tài)量篩選是一個減法過程,要解決掉關(guān)聯(lián)性較低的狀態(tài),加強模型搭建效率;科學(xué)性表示在選擇狀態(tài)量中要具有較強科學(xué)依據(jù),通常利用儀器進行檢測,能充分體現(xiàn)出設(shè)備實際情況[2]。
為了避免受到上述因素影響,給建模流程打下堅實的基礎(chǔ),工作人員要預(yù)處理數(shù)據(jù)資源:首先,數(shù)據(jù)清洗。第一,先識別數(shù)據(jù)中異常信息,主要包括重復(fù)信息、不完整信息、不正確信息等,再科學(xué)處理異常數(shù)據(jù),形成完整的樣本集;第二,數(shù)據(jù)集成。其主要目的是整合各種數(shù)據(jù)信息,這里的整合不是直接集合過程,由于數(shù)據(jù)結(jié)構(gòu)、名稱、定義等方面存在嚴重差異性,很容易影響到數(shù)據(jù)處理的準確性。工作人員要統(tǒng)一數(shù)據(jù)格式,將這些數(shù)據(jù)整合,刪除重復(fù)數(shù)據(jù),保證數(shù)據(jù)使用質(zhì)量;第三,數(shù)據(jù)轉(zhuǎn)換。將數(shù)據(jù)從一種格式轉(zhuǎn)變成其他格式的過程,對數(shù)據(jù)管理有重要作用,通常應(yīng)用歸一化、規(guī)范化兩種方法。規(guī)范化是指統(tǒng)一數(shù)據(jù)單位、格式、順序等要素;歸一化是將狀態(tài)量數(shù)據(jù)由原本的絕對值向相對值方向轉(zhuǎn)變,是目前最常見的無量綱處理方法。但因為不同電網(wǎng)設(shè)備狀態(tài)數(shù)據(jù)單位差異性較強,這種處理方法能有效解決不同性質(zhì)數(shù)據(jù)差異性,避免量綱給數(shù)據(jù)信息準確性造成嚴重影響;最后,數(shù)據(jù)歸約。在確保數(shù)據(jù)原始特征基礎(chǔ)上,合理控制數(shù)據(jù)集規(guī)模,加強算法效率的重要方法,其是由數(shù)據(jù)規(guī)約和數(shù)據(jù)降維兩種處理方式。其中數(shù)據(jù)降維是通過控制數(shù)據(jù)集中的屬性優(yōu)化數(shù)據(jù)集,最常用線性判別分析、特征提取分析、主成分分析等;數(shù)值歸約控制數(shù)據(jù)集中數(shù)據(jù),改善數(shù)據(jù)集內(nèi)容[3]。
將收集到的1039組油中溶解氣體數(shù)據(jù),嚴格按照8:2比例,分解到訓(xùn)練集1378組,測試集345組,且進行建模作業(yè)。本文實驗仿真平臺采用Anaconda,編程語言Python 3.7(見表1)。
表1 故障樣本數(shù)據(jù)分布
調(diào)整參數(shù)主要目的是找到模型的最佳參數(shù)比,發(fā)現(xiàn)誤差和模型復(fù)雜度間的必然關(guān)聯(lián)。在挖掘數(shù)據(jù)過程中,工作人員通常采用衡量算法應(yīng)用到泛化誤差方面,其泛化誤差值越低,說明模型泛化能力越強(如圖1所示)。
圖1 泛化誤差和模型復(fù)雜度關(guān)系圖
通過分析上述圖片內(nèi)容,發(fā)現(xiàn)當模型復(fù)雜程度較低時,會影響到算法模型應(yīng)用效果,產(chǎn)生較高的泛化誤差,即模型欠擬合;而如果模型復(fù)雜程度較高,算法模型易將噪聲數(shù)據(jù)特征應(yīng)用到模型,增加泛化誤差,統(tǒng)稱模型過擬合;如果模型復(fù)雜程度適中,能合理控制泛化誤差,檢測精度最好。而調(diào)整參數(shù)主要目的是提高模型檢測精度,增加模型使用分數(shù)。基于此,本文采用Sklearn庫,調(diào)參對象為決策樹最高深度和數(shù)量,直到兩個參數(shù)數(shù)值能達到預(yù)期標準。結(jié)合自身多年工作經(jīng)驗和數(shù)據(jù)內(nèi)容,將參數(shù)決策樹數(shù)量設(shè)置為n_estimators= [5,10,15,20,25,30,35,40,45,50,55,60,65,70],最高深度值為max_depth_list =[5,6,7,8,9,10,11,12,13,14,15],準確檢測測試集準確率變化情況,如圖2所示。
圖2 RF 測試集的準確率
通過分析上圖,發(fā)現(xiàn)決策樹最高深度和數(shù)量經(jīng)過160次迭代,變壓器故障診斷正確率在82次、58次、13次、102次時最高[4]。
2.3.1 不同模型性能對比
在故障診斷過程中,最常用支持向量機分類模型、邏輯回歸模型、最近領(lǐng)算法模型等方法。因此,工作人員要根據(jù)樣本集進行劃分,以無編碼數(shù)據(jù)為特征參量,應(yīng)用到不同診斷模型中進行分析(見表2)。
表2 不同診斷模型的結(jié)果比較
通過分析上述表格,發(fā)現(xiàn)邏輯回歸模型診斷模型召回率、分類正確率、F1等分數(shù)均小于0.8,診斷效果未達到預(yù)期要求;隨機森林診斷模型中評價指標均超過0.9,表示其診斷效果較好。從整體角度分析,鄰算法模型、支持向量機分類模型正確率較低,隨機森林診斷模型能有效提高正確率8%~13%,判斷整體性能分數(shù)高于其他算法模型,說明本文診斷模型在故障診斷分類方面具有重要作用[5]。
2.3.2 不同故障集結(jié)果分析
為了分析各種故障樣本集對模型診斷正確率作用,根據(jù)不同故障類型,將樣本數(shù)據(jù)分成樣本1、樣本2、樣本3、樣本4、樣本5、樣本6,按照遵循8:2比例,合理規(guī)范訓(xùn)練集和測試集,將15對氣體比值分別輸入到如下表格(見表3)。
表3 不同故障集診斷結(jié)果對比
高溫過熱、正常數(shù)據(jù)、高能發(fā)電、中低溫過熱等故障數(shù)據(jù)診斷精確度較高,F(xiàn)1分數(shù)超過0.8,具有良好的診斷性能。而低能發(fā)電故障數(shù)據(jù)精確率僅為0.72,通常是由于低能放電故障出現(xiàn)在電力變壓器故障前期,且不同放電類型產(chǎn)生的氣體比例存在嚴重影響,造成低能放電數(shù)據(jù)過于分散,給診斷效果造成嚴重影響。同時,各種因素影響局部放電故障數(shù)據(jù)準確性,工作人員要根據(jù)實際情況,合理提升樣本數(shù)量,全面加強診斷準確率。
2.3.3 不同特征量對結(jié)果的影響
本文采用15對氣體比值作為分類器的特征屬性,為了分析這些特征屬性對整體模型的重要程度,注重研究特征數(shù)據(jù)對模型評分的影響(如圖3所示)??煽吹紺10、C13、C14、C12、C11對整體模型影響程度在首位。但C11、C10、C13三組特征量也是行業(yè)標準中常用的三比值法的氣體數(shù)據(jù),不僅檢驗了以往數(shù)據(jù)的正確性,還證明了該模型分類的準確性,對工作人員試驗有重要作用。
圖3 特征屬性對模型評分的影響度
綜上所述,政府部門要提高對電網(wǎng)設(shè)備安全故障的重視程度,分析既有設(shè)備工作情況和異常數(shù)據(jù),提前預(yù)測故障問題,針對問題提出有效解決措施,制訂應(yīng)急預(yù)案和運行方案,避免出現(xiàn)大規(guī)模停電現(xiàn)象,加強電網(wǎng)運行的穩(wěn)定性。