施文
(國網(wǎng)陜西省電力公司,陜西西安 710048)
電費抄核收數(shù)據(jù)異常診斷是一項十分重要的工程,隨著科學(xué)技術(shù)的迅猛發(fā)展,電力企業(yè)中的抄核收工作人員不僅要提升自身的專業(yè)水平,同時還要充分利用現(xiàn)代科學(xué)技術(shù)提升自身素養(yǎng)[1]。電力企業(yè)要充分認識到電費抄核收數(shù)據(jù)異常診斷在整個流程中的重要性,并且要投入大量的精力采取有效的措施,促使電費抄核收數(shù)據(jù)異常診斷結(jié)果更加準確。最近幾年,相關(guān)專家也加強了該方面內(nèi)容的研究,例如裴茂林等人]將智能電表設(shè)定為用戶和電網(wǎng)的信息樞紐[2],通過電網(wǎng)為用戶提供用電習慣以及負荷特征等相關(guān)信息進行數(shù)據(jù)異常診斷。楊茂等人分析風電功率特征[3],通過Copula函數(shù)獲取概率功率曲線,同時結(jié)合異常數(shù)據(jù)的時序特征建立數(shù)據(jù)異常診斷模型。以上兩種方法雖然現(xiàn)階段取得了較為滿意的研究成果,但是由于未能進行數(shù)據(jù)去噪,導(dǎo)致電費抄核收數(shù)據(jù)異常診斷準確性降低,診斷延時上升。為此,提出一種基于主元分析算法的電費抄核收數(shù)據(jù)異常診斷方法。仿真實驗結(jié)果表明,所提方法不僅可以全面增強電費抄核收數(shù)據(jù)異常診斷準確性,同時還能夠降低診斷延時。
在采集電費抄核收數(shù)據(jù)的過程中,許多數(shù)據(jù)存在尖峰或者突變現(xiàn)象,并且噪聲也不是平衡的白噪聲,對于這種信號的處理,采樣傳統(tǒng)的傅里葉變換是無法實現(xiàn)去噪的。由于傅里葉分析是完全在頻域中進行信號分析,無法獲取信號在任意時間段的變化情況,促使信號在時間軸上的隨機一個突變都會影響整個信號的圖譜[4-5]。而小波分析不僅能夠同時在時域和頻域中對信號進行分析,還能夠準確區(qū)分信號中的突變部分以及噪聲,有效實現(xiàn)噪聲消除。
對于函數(shù)φ(t)∈L2R,如果進行傅里葉函數(shù),則需要滿足以下的可容性條件:
上式中,φ(t)代表基本小波或者小波母函數(shù),將小波母函數(shù)φ(t)進行伸縮或者平移;同時尺度因子為a;平移因子為b,令經(jīng)過平移后的函數(shù)為φ(a,b)(t),則有:
上式中,φ(a,b)(t)代表依賴于a、b的小波基函數(shù)[6]。
將任意L2R空間中的函數(shù)f(t)在小波基下展開,將展開的函數(shù)f(t)稱為連續(xù)小波變換,具體的表達式為:
其中:
當實際采用小波方法進行去噪時,小波變換的尺度參數(shù)不需要進行連續(xù)取值,而是采用一種方式將連續(xù)小波及其變換進行離散化處理[7]。通常情況下,將尺度a 按照冪級數(shù)進行離散化處理,對位移b進行均勻離散取值,經(jīng)過離散后可以表示為:
其中:
通過公式(6)能夠得到第m個倍頻的局部信息;f(t)的小波分解和重構(gòu)可以根據(jù)Mallat 塔式算法進行計算。任意尺度的逼近信號均可以表示成下一程度的逼近信號和細節(jié)信號之和,即:
通過二進離散小波對信號進行三層分解,具體可以表示為:
在實際應(yīng)用的過程中,有用信號可以表示為低頻信號或者是部分較為平穩(wěn)的信號,而噪聲則可以表示為高頻信號,所以在降噪的過程中需要進行以下處理:首先對初始信號進行小波分解;其次對小波分解的高頻系數(shù)利用門限值等形式進行量化處理;最后對信號進行重構(gòu),即可達到降噪的目的。設(shè)定噪聲的一維信號為:
上式中,f(i)代表真實信號;e(i)代表噪聲;s(i)代表含有噪聲的信號。通常情況下,一維的降噪過程可以劃分為以下的步驟為:
(1)信號的小波分解:
選取小波分解,同時確定分解的層次N;然后對各個層次的高頻系數(shù)進行量化處理。
(2)高頻系數(shù)的閾值量化處理:
選取合適的閾值對1~N從層的高頻系數(shù)進行量化處理。
(3)小波重構(gòu):
通過小波分解的第N層系數(shù)和經(jīng)過量化處理后的第1~N層的高頻系數(shù),進而實現(xiàn)小波的重構(gòu)。
在上述步驟中,關(guān)鍵是閾值的選擇和量化的處理,這會直接關(guān)系到信號的質(zhì)量,閾值選擇方法主要包含以下幾種形式,分別為:通過stein的無偏似然估計、啟發(fā)式等。
在數(shù)據(jù)曲線中,非反射點的閾值是其損耗的經(jīng)驗值,它主要是由不同的連接技術(shù)以及工藝決定的。
針對信號f 進行閾值處理時,主要包含軟硬閾值兩種方法。其中硬閾值是將信號變換的絕對值和閾值進行對比,小于或者等于閾值的點變?yōu)榱悖笥陂撝档狞c則保持不變[8]。通過研究發(fā)現(xiàn),軟閾值的去噪效果明顯優(yōu)于硬閾值。
主元分析在數(shù)據(jù)預(yù)處理方面具有十分明顯的優(yōu)勢,尤其是在處理復(fù)雜數(shù)據(jù)的應(yīng)用方面。它主要是將其和其它多元技術(shù)進行結(jié)合。首先針對子系統(tǒng)中的隨機信號進行壓縮處理,構(gòu)建一個統(tǒng)一的大系統(tǒng)降維統(tǒng)計模型—PCA模型;然后提取系統(tǒng)中PCA 模型輸出的統(tǒng)計特征參數(shù),通過分析結(jié)果采用人工智能技術(shù)進一步判定故障的具體位置以及性質(zhì),并且對其進行一體化處理,將全部變量有效保留在PCA模型中。
主元分析主要是通過初始變量間的相關(guān)性,采用初始變量的少數(shù)線性組合對原始變量信息進行解釋,進而有效實現(xiàn)數(shù)據(jù)降維。通常情況下,通過主元分析方法獲取的主元變量和初始變量之間存在以下的關(guān)系,即:
(1)通過不同主元組成初始變量的線性組合;
(2)初始變量數(shù)量明顯高于主元數(shù)量;
(3)主元有效保留了初始變量的大部分信息;
(4)不同主元之間不是相互關(guān)聯(lián)的。
對于2.1小節(jié)經(jīng)過小波變換的數(shù)據(jù)進行主元分析,采用主元分析算法是在確保電費抄核收數(shù)據(jù)信息丟失最少的情況下,對高維變量空間中的數(shù)據(jù)盡可能采用綜合變量表示,主元個數(shù)是主元分析模型中十分重要的參數(shù);當所使用的主元數(shù)量太少時,會導(dǎo)致變量中的信息丟失,且模型的誤差增加;當采用較多的主元時,又會將數(shù)據(jù)中的測量噪聲過多地引入過來,增強分析的計算量和診斷的復(fù)雜性,所以主元個數(shù)的確定十分重要。
設(shè)定正常狀態(tài)下采集到的電費抄核收觀測數(shù)據(jù)為X,其中共計含有m個觀測變量以及n個觀測值,采用m×n的數(shù)據(jù)矩陣代表這些數(shù)據(jù),即:
其中矩陣X能夠分解為以下的形式:
設(shè)定X的方差為:∑=COV(X),其中∑的特征值可以表示為λ1,λ2,…,λm,同時λ1≥λ2≥…≥λm,結(jié)合矩陣的分解定理能夠獲取:
通過相關(guān)系數(shù)矩陣對電費抄核收數(shù)據(jù)主成分進行求解,即:
明確數(shù)據(jù)貢獻率的主元數(shù)量,主要通過方差累積貢獻率進行主元數(shù)量確定,具體的計算式為:
當前l(fā) 個主元的累積貢獻率百分比超過一個閾值,利用這個閾值結(jié)合實際情況確定主元量。
在上述分析的基礎(chǔ)上,將采集到的電費抄核收數(shù)據(jù)設(shè)定為訓(xùn)練樣本,通過公式(15)選取合適的滯后時間,為了能夠更好地提取動態(tài)變量間的相互關(guān)系,即:
通過公式(16)進行數(shù)據(jù)訓(xùn)練,獲取對應(yīng)的數(shù)據(jù)陣:
通過公式(14)對公式(16)進行標準化處理,獲取均值以及標準方差。
在上述分析的基礎(chǔ)上,計算SPE統(tǒng)計量和T2統(tǒng)計量在置信度α的控制限,即:
采集故障數(shù)據(jù)將其設(shè)定為測試數(shù)據(jù),同時組建測試數(shù)據(jù)對應(yīng)的數(shù)據(jù)向量。同時將數(shù)據(jù)向量分別分解到不同的主元子空間和殘差子空間中,獲取 和 。同時,采用公式(19)和公式(20)計算T2的統(tǒng)計量和SPE統(tǒng)計量,即:
繪制T2和SPE多變量統(tǒng)計控制圖,同時實時監(jiān)控系統(tǒng)的運行狀態(tài)。
同時利用主元分析表達式建立數(shù)據(jù)異常診斷模型,通過模型實現(xiàn)電費抄核收數(shù)據(jù)異常診斷,即:
綜上所述,完成了電費抄核收數(shù)據(jù)異常診斷。
為了驗證所提基于主元分析算法的電費抄核收數(shù)據(jù)異常診斷方法的綜合有效性,在Win7 系統(tǒng),CPU i55600U@2.6GHz,內(nèi)存16GB3200MHz下進行仿真實驗測試。
由于所提方法在研究初期使用小波變換對采集到的電費抄核收數(shù)據(jù)進行去噪處理,利用表1給出所提方法的去噪效果。
表1 所提方法的去噪效果
分析表1中的實驗數(shù)據(jù)可知,所提方法能夠有效提升數(shù)據(jù)的信噪比,同時有效抑制數(shù)據(jù)的震蕩現(xiàn)象,對異常數(shù)據(jù)處理效果明顯。
為了驗證電費抄核收數(shù)據(jù)異常診斷結(jié)果的準確性,實驗選取平均絕對誤差和平均誤差設(shè)定為測試指標,其中兩項指標的取值越低,則說明電費抄核收數(shù)據(jù)異常診斷結(jié)果準確性越高,反之則說明電費抄核收數(shù)據(jù)異常診斷結(jié)果準確性越低。實驗選取兩種方法作為對比方法,利用表2~表4給出三種方法的電費抄核收數(shù)據(jù)異常診斷結(jié)果準確性對比結(jié)果:
分析表2~表4中的實驗數(shù)據(jù)可知,所提方法有效降低了電費抄核收數(shù)據(jù)異常診斷結(jié)果的平均絕對誤差和平均誤差,促使所提方法的電費抄核收數(shù)據(jù)異常診斷結(jié)果更加準確。這主要依賴于所提方法的研究初期,采用小波變換對采集到的電費抄核收數(shù)據(jù)進行去噪處理,有效濾除數(shù)據(jù)中的噪聲,全面提升數(shù)據(jù)異常診斷結(jié)果的準確性,且所提方法明顯優(yōu)于另外兩種方法。
表2 所提方法的電費抄核收數(shù)據(jù)異常診斷結(jié)果準確性
表3 文獻[2]方法的電費抄核收數(shù)據(jù)異常診斷結(jié)果準確性
表4 文獻[3]方法的電費抄核收數(shù)據(jù)異常診斷結(jié)果準確性
在進行電費抄核收數(shù)據(jù)異常診斷的過程中,由于受到各種各樣外界因素的干擾,導(dǎo)致各個方法均存在診斷延時,以下實驗測試將電費抄核收數(shù)據(jù)異常診斷延時設(shè)定為測試指標,分別選取文獻[2]方法和文獻[3]方法作為對比方法,利用圖1給出具體的實驗對比結(jié)果。
分析圖1中的實驗數(shù)據(jù)可知,各個方法的電費抄核收數(shù)據(jù)異常診斷延時會隨著測試樣本數(shù)量的增加而增加,但是和另外兩種方法相比,所提方法的電費抄核收數(shù)據(jù)異常診斷延時明顯更低一些,這是因為所提方法采樣小波變換對采集到的電費抄核收數(shù)據(jù)進行去噪處理,有效濾除無利用價值的數(shù)據(jù),減少電費抄核收數(shù)據(jù)異常診斷延時。
圖1 不同方法的電費抄核收數(shù)據(jù)異常診斷延時對比結(jié)果
為了有效提升傳統(tǒng)方法的電費抄核收數(shù)據(jù)異常診斷準確性,降低電費抄核收數(shù)據(jù)異常診斷延時,結(jié)合主元分析算法,提出了一種基于主元分析算法的電費抄核收數(shù)據(jù)異常診斷方法。通過具體的仿真實驗測試,全面驗證了所提方法的有效性和優(yōu)越性。