王遠(yuǎn)敏
(貴州省興義民族師范學(xué)院,貴州興義 562400)
電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)中的過(guò)負(fù)荷數(shù)據(jù)挖掘方法研究
王遠(yuǎn)敏
(貴州省興義民族師范學(xué)院,貴州興義562400)
電力網(wǎng)絡(luò)中的分散控制系統(tǒng)(distributed control systems,DCS)數(shù)據(jù)庫(kù)中寄存有海量的電力數(shù)據(jù),進(jìn)行電力系統(tǒng)智能調(diào)度和控制。對(duì)電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)中的過(guò)負(fù)荷數(shù)據(jù)的有效挖掘是實(shí)現(xiàn)電力網(wǎng)絡(luò)系統(tǒng)過(guò)載保護(hù)的關(guān)鍵環(huán)節(jié)。當(dāng)前對(duì)DCS數(shù)據(jù)庫(kù)的過(guò)負(fù)荷數(shù)據(jù)挖掘采用基于決策樹(shù)特征分類(lèi)方法進(jìn)行特征提取和挖掘?qū)崿F(xiàn),在過(guò)負(fù)荷數(shù)據(jù)序列的廣域子空間中產(chǎn)生大量干擾噪聲,挖掘算法的置信度較低。提出一種基于經(jīng)驗(yàn)?zāi)B(tài)分解和決策樹(shù)分類(lèi)結(jié)合的電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)中的過(guò)負(fù)荷數(shù)據(jù)挖掘方法。構(gòu)建了電力網(wǎng)絡(luò)的DCS數(shù)據(jù)庫(kù)結(jié)構(gòu)模型,在DCS數(shù)據(jù)庫(kù)中進(jìn)行數(shù)據(jù)流信號(hào)模型構(gòu)建,采用經(jīng)驗(yàn)?zāi)B(tài)分解算法對(duì)數(shù)據(jù)信號(hào)流進(jìn)行固有模態(tài)時(shí)頻特征提取,以此特征為基礎(chǔ),采用決策樹(shù)分類(lèi)算法實(shí)現(xiàn)過(guò)負(fù)荷數(shù)據(jù)的準(zhǔn)確檢測(cè)和挖掘。仿真結(jié)果表明,采用該算法能有效實(shí)現(xiàn)對(duì)電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)中的過(guò)負(fù)荷數(shù)據(jù)的特征提取和分類(lèi)挖掘,誤碼率較低,性能優(yōu)越于傳統(tǒng)算法。
電力網(wǎng)絡(luò);分散控制系統(tǒng);數(shù)據(jù)庫(kù);數(shù)據(jù)挖掘
電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)在煤電廠(chǎng)、火電廠(chǎng)和水利發(fā)電廠(chǎng)的發(fā)電和供電數(shù)據(jù)管理中具有廣泛的應(yīng)用。電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)中寄存了海量的電力數(shù)據(jù),其中包括了電網(wǎng)功耗數(shù)據(jù)、電壓數(shù)據(jù)、用戶(hù)信息數(shù)據(jù)以及電網(wǎng)功率數(shù)據(jù)等,對(duì)電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)中的過(guò)負(fù)荷數(shù)據(jù)進(jìn)行準(zhǔn)確有效的挖掘,確保電網(wǎng)安全穩(wěn)定運(yùn)行[1]。
電力網(wǎng)絡(luò)分散控制數(shù)據(jù)庫(kù)采用冗余配置和診斷模件集合的方式構(gòu)成,具有高度的可靠性,DCS數(shù)據(jù)庫(kù)支持多種現(xiàn)場(chǎng)總線(xiàn)標(biāo)準(zhǔn),底層漢化的軟件平臺(tái)具備強(qiáng)大的處理功能,電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)實(shí)現(xiàn)了核電、火電、熱電、石化等電網(wǎng)數(shù)據(jù)的完整監(jiān)控管理,由于DCS數(shù)據(jù)庫(kù)的規(guī)模龐大,系統(tǒng)構(gòu)成復(fù)雜,對(duì)DCS數(shù)據(jù)庫(kù)中的過(guò)負(fù)荷數(shù)據(jù)的挖掘具有一定的難度[2],傳統(tǒng)方法中對(duì)DCS數(shù)據(jù)庫(kù)中的過(guò)負(fù)荷數(shù)據(jù)挖掘的方法主要有神經(jīng)網(wǎng)絡(luò)控制算法、語(yǔ)義特征提取算法、支持向量機(jī)數(shù)據(jù)挖掘算法和時(shí)頻特征分析算法等,以數(shù)據(jù)庫(kù)中的過(guò)負(fù)荷數(shù)據(jù)的特征提取方法實(shí)現(xiàn)數(shù)據(jù)挖掘成為未來(lái)發(fā)展的主要趨勢(shì)[3],并取得了一定的研究成果,其中,文獻(xiàn)[4]提出一種功率譜特征提取的電網(wǎng)數(shù)據(jù)庫(kù)的異常數(shù)據(jù)挖掘算法,實(shí)現(xiàn)要有現(xiàn)場(chǎng)控制站(I/O站)構(gòu)建和數(shù)據(jù)通信,提高了數(shù)據(jù)性能,但該算法需要對(duì)電網(wǎng)數(shù)據(jù)庫(kù)的過(guò)負(fù)荷數(shù)據(jù)進(jìn)行分級(jí)管理和調(diào)度,增大了計(jì)算的復(fù)雜性,在干擾環(huán)境下的過(guò)負(fù)荷檢測(cè)性能不高。文獻(xiàn)[5]中,對(duì)DCS數(shù)據(jù)庫(kù)的過(guò)負(fù)荷數(shù)據(jù)挖掘采用基于決策樹(shù)特征分類(lèi)方法進(jìn)行特征提取和挖掘?qū)崿F(xiàn),在過(guò)負(fù)荷數(shù)據(jù)序列的廣域子空間中產(chǎn)生大量干擾噪聲,挖掘算法的置信度較低[6-9]。
1.1電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)結(jié)構(gòu)
首先構(gòu)建電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)結(jié)構(gòu)模型,電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)是一個(gè)由過(guò)程控制級(jí)和過(guò)程監(jiān)控級(jí)組成級(jí)聯(lián)數(shù)據(jù)庫(kù)。電力網(wǎng)絡(luò)的DCS數(shù)據(jù)庫(kù)主要由數(shù)據(jù)通訊系統(tǒng)、人機(jī)接口單元(操作員站OPS、工程師站ENS)、機(jī)柜、電源等組成。電力網(wǎng)絡(luò)的DCS數(shù)據(jù)庫(kù)工作結(jié)構(gòu)示意圖如圖1所示。
電力網(wǎng)絡(luò)的DCS數(shù)據(jù)庫(kù)具備開(kāi)放的體系結(jié)構(gòu),具有全網(wǎng)絡(luò)節(jié)點(diǎn)查詢(xún)能力,可以提供多層開(kāi)放數(shù)據(jù)接口。DCS數(shù)據(jù)庫(kù)提供方便的組態(tài)連接查詢(xún)能力,與用戶(hù)自主開(kāi)發(fā)專(zhuān)用高級(jí)控制算法結(jié)合實(shí)現(xiàn)數(shù)據(jù)管理和調(diào)度。
圖1 電力網(wǎng)絡(luò)的DCS數(shù)據(jù)庫(kù)工作結(jié)構(gòu)Fig.1 DCS database working structure of the power network
在上述描述了電力網(wǎng)絡(luò)的DCS數(shù)據(jù)庫(kù)工作結(jié)構(gòu)和基本特性的基礎(chǔ)上,給出DCS數(shù)據(jù)庫(kù)的數(shù)據(jù)結(jié)構(gòu)及存儲(chǔ)模型。對(duì)電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)進(jìn)行過(guò)負(fù)荷數(shù)據(jù)挖掘,根本上來(lái)說(shuō)是對(duì)數(shù)據(jù)庫(kù)中的異常數(shù)據(jù)信息進(jìn)行特征處理的過(guò)程,DCS數(shù)據(jù)庫(kù)的數(shù)據(jù)結(jié)構(gòu)模型狀態(tài)方程描述為:
令A(yù)={a1,a2,…,an}為電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)信息流功率復(fù)雜關(guān)聯(lián)規(guī)則的屬性集,B={b1,b2,…,bm}為過(guò)負(fù)荷數(shù)據(jù)挖掘?qū)傩灶?lèi)別集,ai的屬性值為{c1,c2,…,ck},電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)體系結(jié)構(gòu)采用動(dòng)態(tài)散列的混合型級(jí)聯(lián)方式進(jìn)行數(shù)據(jù)控制,采用一個(gè)連通的無(wú)向圖G=(V,E,W)表示過(guò)程監(jiān)控級(jí),其中V為DCS數(shù)據(jù)庫(kù)任何兩個(gè)節(jié)點(diǎn)的關(guān)聯(lián)特征集合,其中V={v1,v2,…,vN},所有級(jí)聯(lián)數(shù)據(jù)節(jié)點(diǎn)都有相同的數(shù)據(jù)容量r,過(guò)負(fù)荷數(shù)據(jù)關(guān)聯(lián)規(guī)則矢量模型的邊(u,v)∈E,表示電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)中詞頻特征之間的關(guān)系,W={ω1,ω2,…,ωm}邊的權(quán)值集合?;赥akens嵌入定理,結(jié)合相空間重構(gòu)算法,采用合適的冗余配置得到電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)高維數(shù)據(jù)結(jié)構(gòu)空間為:
式中:x(t)為電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)信息流時(shí)間序列;J為相空間的時(shí)間窗函數(shù);m為DCS數(shù)據(jù)的信息流嵌入維數(shù);Δt為過(guò)負(fù)荷數(shù)據(jù)的采樣時(shí)間滑動(dòng)窗口寬度。在高維相空間中對(duì)電力網(wǎng)絡(luò)數(shù)據(jù)庫(kù)的負(fù)荷數(shù)據(jù)進(jìn)行特征分析和提取,實(shí)現(xiàn)數(shù)據(jù)挖掘。
1.2數(shù)據(jù)流信號(hào)模型構(gòu)建
在上述進(jìn)行電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)結(jié)構(gòu)分析和DCS數(shù)據(jù)庫(kù)高維數(shù)據(jù)結(jié)構(gòu)空間構(gòu)建的基礎(chǔ)上,在高維相空間中進(jìn)行電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)的數(shù)據(jù)信息流信號(hào)模型構(gòu)建,然后采用信號(hào)處理算法實(shí)現(xiàn)特征提取和數(shù)據(jù)挖掘。
1960年代,美國(guó)心理學(xué)家蒂莫西·利里宣稱(chēng):“解放自己,調(diào)轉(zhuǎn)方向,退出體制?!睘榇?,他號(hào)召服用致幻劑。我們也的確因此而看到了很多“畫(huà)得不像自己老師”的所謂現(xiàn)代藝術(shù)家。但是,不要忘記,他們的“不像”里,有著害人的致幻劑成分。
假設(shè)電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)過(guò)負(fù)荷數(shù)據(jù)信息流是一組線(xiàn)性調(diào)頻信號(hào),信號(hào)的時(shí)間序列函數(shù)為:
式中:t為數(shù)據(jù)采樣時(shí)間點(diǎn);x(t)為號(hào)幅度信息;τ為時(shí)延參數(shù);P為能量密度譜。對(duì)電力網(wǎng)絡(luò)數(shù)據(jù)庫(kù)中的數(shù)據(jù)流信號(hào)x(t)的進(jìn)行短時(shí)傅里葉變換,定義為:
式中:h*(τ-t)為時(shí)傅里葉變換的系統(tǒng)狀態(tài)函數(shù),它的實(shí)質(zhì)是加了窗的傅里葉變換。計(jì)算電力網(wǎng)絡(luò)的DCS數(shù)據(jù)庫(kù)信號(hào)模型的短時(shí)傅里葉變換對(duì)應(yīng)的能量密度譜:
式中:f為數(shù)據(jù)采樣頻率;|.|表示去歐式距離,通過(guò)對(duì)短時(shí)傅里葉變換對(duì)應(yīng)的能量密度譜計(jì)算,正確反映頻率與時(shí)間變化的關(guān)系。根據(jù)Heisenberg測(cè)不準(zhǔn)原理,計(jì)算數(shù)據(jù)信息流的時(shí)頻分辨率,進(jìn)一步提高對(duì)低頻段過(guò)負(fù)荷數(shù)據(jù)的挖掘性能,數(shù)據(jù)信息流的時(shí)頻分辨率計(jì)算公式為:
式中:x(t)為可調(diào)窗口的平方可積函數(shù);ψ(t)為Heisenberg基小波函數(shù),參數(shù)a和τ有關(guān)。通過(guò)在信號(hào)上加一個(gè)變尺度滑移窗來(lái)實(shí)現(xiàn)對(duì)信號(hào)頻譜上的不同頻率成分的特征分析,通過(guò)上述處理進(jìn)行DCS數(shù)據(jù)庫(kù)的數(shù)據(jù)信息流信號(hào)模型構(gòu)建,為進(jìn)行下一步的特征提取和數(shù)據(jù)挖掘提供信號(hào)輸入源函數(shù)。
2.1經(jīng)驗(yàn)?zāi)B(tài)分解及過(guò)負(fù)荷數(shù)據(jù)的特征提取
在DCS數(shù)據(jù)庫(kù)中進(jìn)行數(shù)據(jù)流信號(hào)模型構(gòu)建和數(shù)據(jù)庫(kù)的數(shù)據(jù)結(jié)構(gòu)分析的基礎(chǔ)上,進(jìn)行過(guò)負(fù)荷數(shù)據(jù)挖掘優(yōu)化設(shè)計(jì),分析傳統(tǒng)方法可見(jiàn),當(dāng)前對(duì)DCS數(shù)據(jù)庫(kù)的過(guò)負(fù)荷數(shù)據(jù)挖掘采用基于決策樹(shù)特征分類(lèi)方法進(jìn)行特征提取和挖掘?qū)崿F(xiàn),在過(guò)負(fù)荷數(shù)據(jù)序列的廣域子空間中產(chǎn)生大量干擾噪聲,挖掘算法的置信度較低。為了克服傳統(tǒng)算法的弊端,本文提出一種基于經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical mode decomposition,EMD)和決策樹(shù)分類(lèi)結(jié)合的電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)中的過(guò)負(fù)荷數(shù)據(jù)挖掘方法。EMD方法能夠直觀(guān)地顯示分解信號(hào)所得的若干IMF分量,計(jì)算電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)過(guò)負(fù)荷數(shù)據(jù)局部特征時(shí)間尺度為:
式中:ykj為數(shù)據(jù)陣元矢量;N為數(shù)據(jù)長(zhǎng)度,對(duì)任意過(guò)負(fù)荷數(shù)據(jù)信號(hào)x(t),本文采用經(jīng)驗(yàn)?zāi)B(tài)分解得到過(guò)負(fù)荷數(shù)據(jù)的包絡(luò)特征為:
式中:a(t)和θ(t)分別為電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)過(guò)負(fù)荷數(shù)據(jù)信息流的HHT頻譜包絡(luò)和相位,對(duì)DCS數(shù)據(jù)庫(kù)過(guò)負(fù)荷數(shù)據(jù)的包絡(luò)矢量z(t)實(shí)行高斯離散采樣,經(jīng)過(guò)“篩分”過(guò)程,使用EMD方法將信號(hào)進(jìn)行分解,得到對(duì)高頻分量為:
式中:z(t)為DCS數(shù)據(jù)庫(kù)過(guò)負(fù)荷數(shù)據(jù)信號(hào)的IMF分量;x(t)為DCS數(shù)據(jù)庫(kù)過(guò)負(fù)荷數(shù)據(jù)的幅度調(diào)制實(shí)部;y(t)為小波分解尺度,對(duì)x(t)與1/t進(jìn)行經(jīng)驗(yàn)?zāi)B(tài)分解卷積,固定頻率段的時(shí)域波形,得到EMD后的過(guò)負(fù)荷數(shù)據(jù)信號(hào)x(t)的第n個(gè)行固有模態(tài)時(shí)頻特征IMF分量有:
式中:rn為固有模態(tài)時(shí)頻特征的殘余信號(hào);IMF分量為cn,弱殘余信號(hào)rn的幅值非常小,當(dāng)該值小于預(yù)先設(shè)定好的值,那么提取的固有模態(tài)時(shí)頻特征即為過(guò)負(fù)荷數(shù)據(jù)的信息特征,以此實(shí)現(xiàn)數(shù)據(jù)挖掘。
2.2決策樹(shù)數(shù)據(jù)分類(lèi)
在上述特征提取的基礎(chǔ)上,利用訓(xùn)練集建立決策樹(shù)模型,引入C4.5決策樹(shù)模型進(jìn)行過(guò)負(fù)荷數(shù)據(jù)分類(lèi)挖掘,電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)過(guò)負(fù)荷數(shù)據(jù)決策樹(shù)分類(lèi)模型如圖2所示。常見(jiàn)的數(shù)據(jù)分類(lèi)器有BP神經(jīng)網(wǎng)絡(luò)分類(lèi)器、貝葉斯分類(lèi)器、SVM分類(lèi)器,而傳統(tǒng)的分類(lèi)器進(jìn)行過(guò)負(fù)荷數(shù)據(jù)分類(lèi)中,由于在高維相空間中產(chǎn)生大量干擾噪聲,分類(lèi)算法的置信度較低,本文采用決策樹(shù)模型更有利于電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)過(guò)負(fù)荷數(shù)據(jù)的挖掘和分類(lèi)。電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)過(guò)負(fù)荷數(shù)據(jù)決策樹(shù)分類(lèi)模型如圖2所示。
圖2中,電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)的過(guò)負(fù)荷測(cè)試數(shù)據(jù)集進(jìn)行8次決策樹(shù)數(shù)據(jù)測(cè)試,得到過(guò)負(fù)荷數(shù)據(jù)固有模態(tài)時(shí)頻特征的主特征決策樹(shù)分叉圖,跟蹤屬性取值{0,1}映射到?jīng)Q策樹(shù)中表現(xiàn)為映射值{No,Yes},采用Weka系統(tǒng)默認(rèn)值推薦實(shí)驗(yàn)參數(shù),電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)的過(guò)負(fù)荷數(shù)據(jù)的固有模態(tài)時(shí)頻特征設(shè)置類(lèi)型設(shè)置為164類(lèi),提取的主特征類(lèi)型為19類(lèi),產(chǎn)生數(shù)據(jù)伴隨狀態(tài)序列集,分類(lèi)過(guò)程中過(guò)負(fù)荷數(shù)據(jù)出現(xiàn)的概率權(quán)重為:
式中:β為數(shù)據(jù)干擾頻率;w(epkq)初步的數(shù)據(jù)篩選后的特征輸出,最后得到DCS數(shù)據(jù)庫(kù)過(guò)負(fù)荷數(shù)據(jù)的挖掘的判別函數(shù)為:
式中:α為決策樹(shù)類(lèi)別調(diào)節(jié)系數(shù);W為電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)的過(guò)負(fù)荷數(shù)據(jù)固有模態(tài)特征的二叉樹(shù)分裂類(lèi)間距離,其取值范圍為0≤α≤1。由此實(shí)現(xiàn)數(shù)據(jù)挖掘算法改進(jìn)。
圖2 電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)過(guò)負(fù)荷數(shù)據(jù)決策樹(shù)分類(lèi)模型Fig.2 Decision tree classification model of power network DCS database overload data
為了驗(yàn)證本文算法在實(shí)現(xiàn)電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)的過(guò)負(fù)荷數(shù)據(jù)挖掘中的性能,進(jìn)行仿真實(shí)驗(yàn)。仿真實(shí)驗(yàn)的軟件環(huán)境建立在Matlab仿真軟件基礎(chǔ)上,硬件環(huán)境為:IntelCore3-530 1G內(nèi)存,操作系統(tǒng)為Windows 7。構(gòu)建電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)模型,過(guò)負(fù)荷數(shù)據(jù)的信號(hào)模型表型為一組頻帶為5~15 kHz、時(shí)寬為6 ms的線(xiàn)性調(diào)頻信號(hào),電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)體系結(jié)構(gòu)采用動(dòng)態(tài)散列的混合型級(jí)聯(lián)方式進(jìn)行數(shù)據(jù)控制,假設(shè)DCS數(shù)據(jù)庫(kù)信息流矢量長(zhǎng)度為N,N=1 024,對(duì)電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)信息流序列連續(xù)數(shù)據(jù)集屬性離散化處理,以此為基礎(chǔ)構(gòu)建DCS數(shù)據(jù)庫(kù)高維數(shù)據(jù)結(jié)構(gòu)空間,相空間重構(gòu)中,時(shí)間窗函數(shù)J取值為12 s,嵌入維數(shù)m取值為4,時(shí)間窗口帶寬Δt=3 ms。在上述仿真環(huán)境和參數(shù)設(shè)定的基礎(chǔ)上,根據(jù)電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)過(guò)負(fù)荷數(shù)據(jù)的信號(hào)模型偏移程度分析,得到電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)過(guò)負(fù)荷數(shù)據(jù)的經(jīng)驗(yàn)?zāi)B(tài)分解EMD結(jié)果如圖3所示。
圖3 電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)過(guò)負(fù)荷數(shù)據(jù)的經(jīng)驗(yàn)?zāi)B(tài)分解結(jié)果Fig.3 Empirical mode decomposition results of DCS power network database overload data
根據(jù)圖3中所示的各層EMD分解結(jié)果,對(duì)數(shù)據(jù)信號(hào)流進(jìn)行固有模態(tài)時(shí)頻特征提取,得出弱殘余信號(hào)即為過(guò)負(fù)荷數(shù)據(jù),得到過(guò)負(fù)荷數(shù)據(jù)挖掘結(jié)果如圖4所示。
圖4 DCS數(shù)據(jù)庫(kù)過(guò)負(fù)荷數(shù)據(jù)挖掘結(jié)果Fig.4 DCS database overload data mining results
圖4中,虛線(xiàn)部分?jǐn)?shù)據(jù)序列表示進(jìn)行經(jīng)驗(yàn)?zāi)B(tài)分解和固有模態(tài)時(shí)頻特征提取處理后的殘余分量數(shù)據(jù),即為本文需要挖掘的過(guò)負(fù)荷數(shù)據(jù),從仿真結(jié)果可見(jiàn),采用本文算法能有效實(shí)現(xiàn)對(duì)DCS數(shù)據(jù)庫(kù)過(guò)負(fù)荷數(shù)據(jù)挖掘,為了定量分析本文算法的挖掘性能。采用本文算法進(jìn)行固有模態(tài)時(shí)頻特征提取挖掘處理后,采用決策樹(shù)分類(lèi)器對(duì)挖掘數(shù)據(jù)進(jìn)行分類(lèi),并和傳統(tǒng)方法進(jìn)行對(duì)比,C4.5決策樹(shù)分類(lèi)下過(guò)負(fù)荷數(shù)據(jù)挖的誤碼率(Bit error rate,BER)對(duì)比結(jié)果如圖5所示,從圖5可見(jiàn),采用本文算法,誤碼率較低,挖掘精度較高。
對(duì)電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)中的過(guò)負(fù)荷數(shù)據(jù)的有效挖掘是實(shí)現(xiàn)電力網(wǎng)絡(luò)系統(tǒng)的過(guò)載保護(hù)的關(guān)鍵環(huán)節(jié)。當(dāng)前對(duì)DCS數(shù)據(jù)庫(kù)的過(guò)負(fù)荷數(shù)據(jù)挖掘采用基于決策樹(shù)特征分類(lèi)方法進(jìn)行特征提取和挖掘?qū)崿F(xiàn),在過(guò)負(fù)荷數(shù)據(jù)序列的廣域子空間中產(chǎn)生大量干擾噪聲,挖掘算法的置信度較低。提出一種基于經(jīng)驗(yàn)?zāi)B(tài)分解和決策樹(shù)分類(lèi)結(jié)合的電力網(wǎng)絡(luò)DCS數(shù)據(jù)庫(kù)中的過(guò)負(fù)荷數(shù)據(jù)挖掘方法。構(gòu)建了電力網(wǎng)絡(luò)的DCS數(shù)據(jù)庫(kù)結(jié)構(gòu)模型,在DCS數(shù)據(jù)庫(kù)中進(jìn)行數(shù)據(jù)流信號(hào)模型構(gòu)建,采用經(jīng)驗(yàn)?zāi)B(tài)分解算法對(duì)數(shù)據(jù)信號(hào)流進(jìn)行固有模態(tài)時(shí)頻特征提取,以此特征為基礎(chǔ),采用決策樹(shù)分類(lèi)算法實(shí)現(xiàn)過(guò)負(fù)荷數(shù)據(jù)的準(zhǔn)確檢測(cè)和挖掘,研究結(jié)果證明,采用本文算法對(duì)DCS數(shù)據(jù)庫(kù)中的過(guò)負(fù)荷數(shù)據(jù)挖掘性能較好,誤碼率較低,特征分類(lèi)精度較高,展示了優(yōu)越性能。
圖5 C4.5決策樹(shù)分類(lèi)下過(guò)負(fù)荷數(shù)據(jù)挖的誤碼率Fig.5 Bit error rate of the overload data mining under the C4.5 decision tree classification
[1]王曙燕,耿國(guó)華,李丙春.決策樹(shù)算法在醫(yī)學(xué)圖像數(shù)據(jù)挖掘中的應(yīng)用[J].西北大學(xué)學(xué)報(bào):自然科學(xué)版,2005,35(3):262-265.WANG Shuyan,GENG Guohua,LI Bingchun.The application of decision tree algorithm in medical image data mining[J].Joumal of Norlhwest Universily:Nalural Seience Edlition,2005,35(3):262-265(in Chinese).
[2]饒翔,王懷民,陳振邦,等.云計(jì)算系統(tǒng)中基于伴隨狀態(tài)追蹤的故障檢測(cè)機(jī)制[J].計(jì)算機(jī)學(xué)報(bào),2012,35(5):856-870.RAO Xiang,WANG Huaimin,CHEN Zhenbang,et al.Detecting faults by tracing companion states in cloud computing systems[J].Chinese Journal of Computers,2012,35(5):856-870(in Chinese).
[3]孔英會(huì),車(chē)轔轔,苑津莎,等.基于小波分解和數(shù)據(jù)挖掘中決策樹(shù)算法的電能質(zhì)量擾動(dòng)識(shí)別方法[J].電網(wǎng)技術(shù),2007,31(23):78-82.KONG Yinghui,CHE Linlin,YUAN Jinsha,et al.A power quality disturbance identification method based on wavelet decomposition and decision tree algorithm in data mining[J].Power System Technology,2007,31(23):78-82(in Chinese).
[4]李紅升.基于粒子群算法改進(jìn)電力信息系統(tǒng)的安全研究[J].科技通報(bào),2013,29(4):158-161.LI Hongsheng.Study on improvement of power information system security based on particle swarm optimization algorithm[J].Bulletin of Science and Technology,2013,29(4):158-161(in Chinese).
[5]郭麗.面向PID電力系統(tǒng)信息安全自動(dòng)控制研究[J].科技通報(bào),2013,29(2):39-41.GUO Li.PID oriented information security in power system automatic control research[J].Bulletin of Science and Technology,2013,29(2):39-41(in Chinese).
[6]楊來(lái),史忠植,梁帆,等.基于Hadoop云平臺(tái)的并行數(shù)據(jù)挖掘方法[J].系統(tǒng)仿真學(xué)報(bào),2013,25(5):936-944.YANG Lai,SHI Zhongzhi,LIANG Fan,et al.Parallcl approach in data mining bascd on hadoop cloud platform[J].Journal of System Simulation,2013,25(5):936-944(in Chinese).
[7]張國(guó)良,姚二亮,湯文俊,等.一種自適應(yīng)的GraphSLAM魯棒閉環(huán)算法[J].信息與控制,2015,44(3):316-320,327.ZHANG Guoliang,YAO Erliang,TANG Wenjun,et al.AN adaptive robust loop closure algorithm for graph SLAM[J].Information and Control,2015,44(3):316-320,327(in Chinese).
[8]王進(jìn),陽(yáng)小龍,隆克平.基于大偏差統(tǒng)計(jì)模型的Http-Flood DDoS檢測(cè)機(jī)制及性能分析[J].軟件學(xué)報(bào),2012,23(5):1272-1280.WANG Jin,YANG Xiaolong,LONG Keping.Http-Flood DDoS detection scheme based on large deviation and performance analysis[J].Journal of Software,2012,23(5):1272-1280(in Chinese).
[9]鄭海雁,王遠(yuǎn)方.標(biāo)簽集約束近似頻繁模式的并行挖掘[J].計(jì)算機(jī)工程與應(yīng)用,2015,51(9):135-141.ZHENG Haiyan,WANG Yuanfang.Parallel mining on label-constraint proximity pattern[J].Computer EngineeringandApplications,2015,51(9):135-141(in Chinese).
Research on Overload Data Mining Method in Power Network DCS Database
WANG Yuanmin
(Guizhou Xingyi Normal University for Nationalities,Xingyi 562400,Guizhou,China)
A mass of power data is stored in the distributed control system(distributed control systems,DCS)database of the power network for the intelligent scheduling and control of the power system.The effective mining of the overload data in the DCS database is a key link in the realization of the overload protection of the electric power network system.At present,the overload date in the DCS database is mined based on the decision tree feature classification method to extract features and realize mining,and this method produces a lot noise in the wide area subspace of the overload data sequence,therefore the mining algorithm is of low confidence.To this end,a method of data mining based on combination of the empirical mode decomposition and decision tree classification is proposed in this paper.The DCS database structure model of the power network is built and the data flow signal model is built in the DCS database,and the intrinsic mode time-frequency feature are extracted in the data signal flow using the empirical mode decomposition algorithm.On the basis of the extracted feature,the accurate defection and mining of the overload data are realized using the decision tree classification algorithm.The simulation results show that the proposed algorithm can effectively extract and classify the overload data in the DCS database of the power network,and the error rate is low,and the performance is superior to the traditional algorithm.
power network;distributed control system;database;data mining
1674-3814(2015)11-0036-05
TP391
A
2015-06-08。
王遠(yuǎn)敏(1982—),女,講師,研究方向?yàn)橛?jì)算機(jī)應(yīng)用技術(shù)。
(編輯徐花榮)
《貴陽(yáng)交通智能控制與誘導(dǎo)技術(shù)研究》(黔科合J字[2013]2456)。
Project Supported by“Research on Guiyang Intelligent Control and Induction Technology”of Science and Technology Fund of Guizhou Province(J[2013]2456).