馬草原
(國網(wǎng)天津市電力公司,天津 300000)
電力系統(tǒng)含有龐大的實(shí)時(shí)數(shù)據(jù)。這些數(shù)據(jù)與電力系統(tǒng)的安全運(yùn)行有著密切聯(lián)系,對電力系統(tǒng)的安全與可靠起到?jīng)Q定性作用。電力系統(tǒng)工作過程中需要產(chǎn)生和消耗大量電力能源,在正常工作的情況下依然會(huì)產(chǎn)生不良數(shù)據(jù)影響系統(tǒng)的決策,威脅整個(gè)電力系統(tǒng)的安全[1-3]。因此,利用專業(yè)技術(shù)檢測出不良數(shù)據(jù)并修正,有助于保證電力系統(tǒng)的正常運(yùn)行和電力能源的正常供給。
到目前為止,國內(nèi)外學(xué)者對電力能源大數(shù)據(jù)的檢測和修正作了很多理論與實(shí)際研究,總結(jié)出兩種使用比較廣泛的修正方法。一種是基于Spark框架的電網(wǎng)運(yùn)行異常數(shù)據(jù)辨識與修正方法,通過聚類或神經(jīng)網(wǎng)絡(luò)等數(shù)據(jù)挖掘算法在大數(shù)據(jù)中提取出異常數(shù)據(jù),在Spark框架下對其進(jìn)行修正[4]。另一種是基于改進(jìn)低秩矩陣補(bǔ)全的電網(wǎng)數(shù)據(jù)缺失值修正方法。這種方法主要根據(jù)一定的置信度水平設(shè)置閾值,結(jié)合概率論相關(guān)知識進(jìn)行假設(shè)檢驗(yàn),然后通過改進(jìn)低秩矩陣補(bǔ)全數(shù)據(jù)缺失值,實(shí)現(xiàn)異常修正[5]。
以上兩種方法中存在因過多重復(fù)的搜索次數(shù)導(dǎo)致數(shù)據(jù)辨識異常,或?qū)⒄?shù)據(jù)誤判為不良數(shù)據(jù)的情況。針對這種情況,設(shè)計(jì)基于低秩模型的電力能源大數(shù)據(jù)異常修正方法,解決以往修正方法中存在的問題。
利用低秩模型,在電力能源大數(shù)據(jù)中去除噪聲數(shù)據(jù),分離出含有有利信息的數(shù)據(jù)[6]。低秩的一般表示形式如下:
(1)
式中:K為系數(shù)矩陣;Q為電力能源數(shù)據(jù)樣本;D為字典[7-8]。
假設(shè)在一個(gè)時(shí)間序列中得到的所有數(shù)據(jù)將形成一個(gè)矩陣,表示為W。設(shè)定w為狀態(tài)量、A為異常數(shù)據(jù)矩陣,具有不穩(wěn)定性和離散特性。在時(shí)間序列內(nèi),電力能源正常數(shù)據(jù)呈連續(xù)平穩(wěn)的特征[9-11]。根據(jù)上述特征確定初步的目標(biāo)方程為:
(2)
式中:η為平衡參數(shù),η>0;rank(K)為矩陣K的秩;sparse(A)為矩陣A的一個(gè)稀疏約束。
在實(shí)際應(yīng)用中,將D初始化,作為矩陣稀疏約束實(shí)例化的范數(shù),計(jì)算出目標(biāo)方程的最小解,也就是低秩模型中最小化矩陣的秩[12-13]。綜上,式(2)可進(jìn)一步寫為:
(3)
將式(3)作為低秩模型監(jiān)測異常數(shù)據(jù)。為了更好地處理電力能源大數(shù)據(jù)中的異常數(shù)據(jù),根據(jù)實(shí)際需求,將初始化后的D分為兩個(gè)部分,一部分用來觀察關(guān)鍵量測量數(shù)據(jù),另一部分用來觀察非關(guān)鍵量測量的異常數(shù)據(jù)。即:
D=[D1,D2]
(4)
式中:D1為用于表達(dá)觀測到的模式;D2為隱藏的潛在模式。
考慮低秩模型中:正常電力能源數(shù)據(jù)與異常電力能源行為均遵循一定規(guī)則;異常數(shù)據(jù)并不只是胡亂地零散分布,而是表現(xiàn)出一定特征。在處理噪聲數(shù)據(jù)中,引入特征選擇方法深度挖掘噪聲信息,則最終的目標(biāo)方程如下所示:
(5)
式中:D1和D2為在已知情況下得到的已劃分?jǐn)?shù)據(jù)樣本。
利用目標(biāo)方程不斷更新數(shù)據(jù)樣本,并以數(shù)據(jù)樣本的收斂性作為判斷更新次數(shù)是否達(dá)到最大的條件。若達(dá)到最大更新次數(shù),則停止更新。此時(shí)的電力能源數(shù)據(jù)已滿足檢測辨識和修正對數(shù)據(jù)的要求。通過上述過程,得到不含噪聲的電力能源大數(shù)據(jù)樣本。
通過低秩模型得到有規(guī)律的電力能源數(shù)據(jù),考慮大數(shù)據(jù)中異常數(shù)據(jù)的特性,將支持向量機(jī)(support vector machine,SVM)作為辨識數(shù)據(jù)的主要工具,在離線模式和聯(lián)機(jī)模式下辨識出異常數(shù)據(jù)。
異常數(shù)據(jù)與正常數(shù)據(jù)的區(qū)別與數(shù)據(jù)有功功率和時(shí)間的比值相關(guān),計(jì)算出某一數(shù)據(jù)點(diǎn)與該點(diǎn)相鄰點(diǎn)的有功功率和時(shí)間的比值。若比值的絕對值大于正常運(yùn)行狀態(tài)下的正常比值,則說明該點(diǎn)數(shù)據(jù)為異常數(shù)據(jù)。SVM作為典型的二分類模型,存在訓(xùn)練和應(yīng)用兩個(gè)階段。采用離線模式訓(xùn)練SVM,訓(xùn)練數(shù)據(jù)來自電力能源數(shù)據(jù)庫,對數(shù)據(jù)進(jìn)行歸一化處理:
(6)
式中:pi為數(shù)據(jù)庫中第i個(gè)數(shù)據(jù);pmin為數(shù)據(jù)庫中的最小值;pmax為數(shù)據(jù)庫中的最大值;p′i為歸一化后的數(shù)據(jù)庫中的第i個(gè)數(shù)據(jù)。
將歸一化數(shù)據(jù)結(jié)果作為樣本數(shù)據(jù),并對樣本數(shù)據(jù)進(jìn)行分塊處理,確保每一個(gè)樣本塊內(nèi)部數(shù)據(jù)大小基本相同。通過聚類方法處理每個(gè)樣本塊中的數(shù)據(jù)集,獲得對應(yīng)的聚類結(jié)果,并將聚類結(jié)果整合。將上述結(jié)果看作一個(gè)完整聚類集,通過二次聚類后獲得最終的聚類結(jié)果。聚類矩陣演變過程如圖1所示。
圖1 聚類矩陣演變過程
對于每一次聚類,記錄類簇包含的所有樣本信息,計(jì)算類簇中心矢量:
(7)
式中:n為類簇包含的樣本數(shù);i為聚類次數(shù);gi為樣本i對應(yīng)的數(shù)據(jù)矢量;gc為類簇中心矢量。
當(dāng)聚類完成后,設(shè)置閾值ξ。當(dāng)某個(gè)類簇中的數(shù)據(jù)個(gè)數(shù)小于設(shè)置的閾值時(shí),將該類簇中的數(shù)據(jù)丟棄。剩下的數(shù)據(jù)就是具有一定的價(jià)值的數(shù)據(jù)。對于剩余的簇,采用針對性的訓(xùn)練措施,獲得與簇一一對應(yīng)的支持向量機(jī)模型。
針對剩余的類簇,計(jì)算出每個(gè)數(shù)據(jù)點(diǎn)對應(yīng)的有功功率和時(shí)間的比值。對于時(shí)間起點(diǎn)和時(shí)間終點(diǎn)上的取值,對應(yīng)的點(diǎn)取前一天或后一天的相鄰值,數(shù)據(jù)點(diǎn)有功功率和時(shí)間的比值計(jì)算完成后,標(biāo)記計(jì)算得到的每個(gè)數(shù)據(jù)特征,完成數(shù)據(jù)樣本訓(xùn)練。
在各類簇聚類中心對應(yīng)的數(shù)據(jù)經(jīng)過歸一化處理之后,計(jì)算聚類中心與對應(yīng)的時(shí)段數(shù)據(jù)的距離,對比距離的大小并排序,使用與最小距離的類簇?cái)?shù)據(jù)對應(yīng)的支持向量機(jī)模型,對類簇?cái)?shù)據(jù)一一分類,得到初步數(shù)據(jù)辨識結(jié)果。在分類完成后,設(shè)置一個(gè)滑動(dòng)窗口,接收待處理某一時(shí)段電力能源數(shù)據(jù)?;瑒?dòng)窗口的大小由該時(shí)段數(shù)據(jù)個(gè)數(shù)確定。當(dāng)滑動(dòng)窗口接收數(shù)據(jù)操作完成后,在類簇中尋找距離最近的時(shí)段數(shù)據(jù),使用與其對應(yīng)的支持向量機(jī)模型簡單辨識出異常數(shù)據(jù)。
假設(shè)辨識出的時(shí)段數(shù)據(jù)中異常數(shù)據(jù)的點(diǎn)數(shù)為m,默認(rèn)此時(shí)的滑動(dòng)出窗口邊界處的數(shù)據(jù)均為正常數(shù)據(jù)。在此條件下,當(dāng)時(shí)段數(shù)據(jù)中異常數(shù)據(jù)的點(diǎn)數(shù)小于3時(shí),修正異常數(shù)據(jù);當(dāng)時(shí)段數(shù)據(jù)中異常數(shù)據(jù)的點(diǎn)數(shù)大于等于3時(shí),修正除時(shí)間起點(diǎn)和時(shí)間終點(diǎn)的所有異常數(shù)據(jù)。對于時(shí)間起點(diǎn)和時(shí)間終點(diǎn)的數(shù)據(jù),計(jì)算其特征值,重新辨識該數(shù)據(jù)。在重新辨識過程中,如果滑動(dòng)窗口的上邊界處為異常數(shù)據(jù)的同時(shí)上一窗口未關(guān)閉,則時(shí)段數(shù)據(jù)中異常數(shù)據(jù)點(diǎn)數(shù)的計(jì)算不僅需要結(jié)合當(dāng)前窗口,還需要將上一窗口的時(shí)段數(shù)據(jù)計(jì)算在內(nèi)。
通過上述過程辨識出電力能源大數(shù)據(jù)異常數(shù)據(jù),電力能源大數(shù)據(jù)的修正隨著窗口上界和下界的變化進(jìn)行。
根據(jù)基爾霍夫電流定律可知,在電力能源產(chǎn)生和供給過程中,如產(chǎn)生的數(shù)據(jù)都是正常數(shù)據(jù),則有功功率和無功功率互相抵消,相加的總和為零。此時(shí),節(jié)點(diǎn)的功率是平衡的。假設(shè)母線上有b條支路,第j條支路的有功功率和無功功率分別為Pj和Uj,則節(jié)點(diǎn)功率平衡的表達(dá)式如下:
(8)
(9)
當(dāng)線路某側(cè)有功確定為正常數(shù)據(jù)時(shí),則根據(jù)式(8)、式(9)修正另一側(cè)異常數(shù)據(jù):
(10)
(11)
式中:v為b條支路中第v條支路。
若線路兩側(cè)均為異常數(shù)據(jù),則令與待修正數(shù)據(jù)點(diǎn)首尾相鄰的點(diǎn)為(x0,y0)、(x1,y1),待修正點(diǎn)為(x,y),根據(jù)以下公式修正:
(12)
式中:ε為修正系數(shù)。
通過以上方法修正異常數(shù)據(jù),適用于單個(gè)或多個(gè)不相關(guān)的異常數(shù)據(jù)的修正,并且能夠?qū)崿F(xiàn)零誤差的修正。至此,基于低秩模型的電力能源大數(shù)據(jù)異常修正方法設(shè)計(jì)完成。
利用IEEE-30節(jié)點(diǎn)系統(tǒng)的數(shù)據(jù)作為試驗(yàn)數(shù)據(jù),歸一化處理遙感數(shù)據(jù)。IEEE-30節(jié)點(diǎn)電網(wǎng)接線圖2所示。
圖2 IEEE-30節(jié)點(diǎn)電網(wǎng)接線圖
采用IEEE-30節(jié)點(diǎn)的大型電網(wǎng)數(shù)據(jù)進(jìn)行仿真。量測數(shù)據(jù)主要包括節(jié)點(diǎn)注入的有功和無功功率,支路潮流的有功和無功功率。IEEE-30節(jié)點(diǎn)量測配置如表1所示。
表1 IEEE-30節(jié)點(diǎn)量測配置表
使用不同的電力能源大數(shù)據(jù)異常修正方法處理量測數(shù)據(jù)。在量測數(shù)據(jù)過程中,對組號為3、7、9、15、19的測量節(jié)點(diǎn)設(shè)置30%的量測誤差值,將其作為異常數(shù)據(jù)用于后續(xù)試驗(yàn)中,驗(yàn)證不同的電力能源大數(shù)據(jù)異常修正方法對異常數(shù)據(jù)的辨識情況?;诒孀R結(jié)果,計(jì)算不同修正方法的殘差值。
使用不同的電力能源大數(shù)據(jù)異常修正方法,分別對量測數(shù)據(jù)進(jìn)行檢測與修正。通過仿真驗(yàn)證不同修正方法的負(fù)荷數(shù)據(jù)異常修正效果。電力負(fù)荷數(shù)據(jù)異常修正結(jié)果如圖3所示。
圖3 電力負(fù)荷數(shù)據(jù)異常修正效果
分析圖3可知,不同方法下電力負(fù)荷數(shù)據(jù)異常修正效果不同。對于不同時(shí)間點(diǎn)來說,電力負(fù)荷會(huì)發(fā)生一定的改變,整體來看,電力負(fù)荷先下降后上升再下降。中午12 h時(shí),電力負(fù)荷最大。此時(shí)電力系統(tǒng)實(shí)際負(fù)荷為1 325 kW,Spark框架修正方法的電力負(fù)荷為1 432 kW,改進(jìn)低秩矩陣補(bǔ)全修正方法的電力負(fù)荷為1 213 kW,本文方法的電力負(fù)荷為1 325 kW。經(jīng)過本文方法修正后,電力負(fù)荷與實(shí)際負(fù)荷值相符。而Spark框架修正方法與改進(jìn)低秩矩陣補(bǔ)全修正方法的修正效果不理想。經(jīng)過本文方法修正后的曲線與實(shí)際負(fù)荷曲線基本重合,而其他方法的負(fù)荷曲線明顯存在一定差異。這說明本文方法電力負(fù)荷數(shù)據(jù)異常修正效果最好。這是因?yàn)楸疚姆椒軌驅(qū)Σ煌J讲捎貌煌姆椒▽?shí)現(xiàn)誤差修正,并且通過滑動(dòng)窗口獲得異常數(shù)據(jù),使修正準(zhǔn)確性得到提升。
殘差表示觀察值與擬合值之間的差值,可作為誤差的觀測值。殘差值越小表示誤差越小,說明修正的效果效果越好。為此,本文通過殘差值判斷不同方法法修正效果。使用不同的電力能源大數(shù)據(jù)異常修正方法處理,獲得不同方法在各個(gè)量測組的殘差值。不同方法的殘差值如表2所示。
表2 不同方法的殘差值
分析表2可知,不同方法的殘差值不同。當(dāng)試驗(yàn)次數(shù)為10次時(shí),Spark框架修正方法的殘差值為1.361 4,改進(jìn)低秩矩陣補(bǔ)全的殘差值1.835 4,本文方法的殘差值0.012,本文方法的殘差值為最低。整體來看,Spark框架修正方法的平均殘差值為1.493 52,改進(jìn)低秩矩陣補(bǔ)全的平均殘差值為1.884 97,本文方法的平均殘差值為0.009 5。本文方法的殘差值最低,說明本文方法具有較為準(zhǔn)確的電力能源大數(shù)據(jù)異常修正結(jié)果。這是因?yàn)楸疚姆椒ú捎昧说椭饶P蛯﹄娏δ茉磾?shù)據(jù)樣本進(jìn)行去噪處理,去除了樣本噪聲,提高了數(shù)據(jù)結(jié)果準(zhǔn)確性。
隨著電力輸電系統(tǒng)進(jìn)入超高壓遠(yuǎn)距離輸電、跨區(qū)域聯(lián)網(wǎng)的新階段,在電力能源大數(shù)據(jù)中產(chǎn)生了很多異常問題。本文針對這一問題,設(shè)計(jì)基于低秩模型的電力能源大數(shù)據(jù)異常修正方法,利用低秩模型展開了一系列的研究。通過與以往使用的修正方法對比試驗(yàn),驗(yàn)證了設(shè)計(jì)的修正方法在處理電力能源大數(shù)據(jù)時(shí)具有很好的性能,實(shí)用性強(qiáng),簡單易行。