• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于時間序列提取和維諾圖的電力數(shù)據(jù)異常檢測方法

      2017-05-11 01:08:10裴湉齊冬蓮
      電力建設(shè) 2017年5期
      關(guān)鍵詞:分段樣本算法

      裴湉, 齊冬蓮

      (浙江大學(xué)電氣工程學(xué)院,杭州市 310027)

      基于時間序列提取和維諾圖的電力數(shù)據(jù)異常檢測方法

      裴湉, 齊冬蓮

      (浙江大學(xué)電氣工程學(xué)院,杭州市 310027)

      電力網(wǎng)絡(luò)中信息系統(tǒng)與物理系統(tǒng)的深度融合,導(dǎo)致現(xiàn)代電力系統(tǒng)易受異常數(shù)據(jù)的影響。現(xiàn)有的電力數(shù)據(jù)異常檢測方法未能充分挖掘數(shù)據(jù)特征,存在計算復(fù)雜、靈活性差、精度較低等缺點。提出一種基于時間序列提取和維諾圖的異常數(shù)據(jù)檢測方法,利用重要點分段的時間序列提取方法,將高維數(shù)據(jù)進(jìn)行降維處理,并將其映射到二維平面上,構(gòu)造維諾圖分區(qū),進(jìn)而檢測出異常數(shù)據(jù)。該方法可降低數(shù)據(jù)維度和算法復(fù)雜度,能根據(jù)序列特征靈活設(shè)定異常閾值,實現(xiàn)異常數(shù)據(jù)的準(zhǔn)確檢測,仿真實驗證明所提方法的有效性。

      時間序列;維諾圖;異常檢測;電力數(shù)據(jù)

      0 引 言

      智能電網(wǎng)的提出、深化及推廣應(yīng)用,正在以驚人的速度改變著現(xiàn)代電力系統(tǒng),使其逐步向高度信息化、物理信息耦合化的方向發(fā)展[1]。電力信息物理系統(tǒng)[2]、能源互聯(lián)網(wǎng)[3]、區(qū)域鏈[4]等新概念的相繼提出,無不顯示著信息通信技術(shù)在現(xiàn)在和未來電力系統(tǒng)中的重要地位。隨著電力系統(tǒng)信息化程度的快速提升,反映各類分布式電源、負(fù)荷、監(jiān)控保護(hù)終端和傳感器的海量實時數(shù)據(jù)不僅大大增加了管理、分析和處理的難度,而且這些設(shè)備一旦遭受外部惡意攻擊,因物理與信息的強耦合而導(dǎo)致的連鎖故障將嚴(yán)重威脅電力系統(tǒng)的正常運轉(zhuǎn)[5]。例如,2010年9月伊朗核電站的損毀事故,2015年12月烏克蘭國家電網(wǎng)的突發(fā)停電事故等,均是由于數(shù)據(jù)異?;驉阂夤舳鴮?dǎo)致的嚴(yán)重電力事故,對當(dāng)?shù)氐纳鐣?、?jīng)濟(jì)產(chǎn)生了巨大的影響。因此,如何在呈指數(shù)增長的海量數(shù)據(jù)中,實現(xiàn)異常數(shù)據(jù)的快速、準(zhǔn)確檢測,是保證電力系統(tǒng)安全運行亟待解決的問題。

      針對電力數(shù)據(jù)的分析方法,目前國內(nèi)大多數(shù)電力部門仍然采用簡單的基于統(tǒng)計分析的處理手段,難以對數(shù)據(jù)隱藏的深層次特征加以利用[6-7],無法滿足實際需求。此外,電力數(shù)據(jù)是典型的與時間強耦合的高維復(fù)雜數(shù)據(jù),如果直接通過計算來實現(xiàn)異常數(shù)據(jù)的檢測,將會產(chǎn)生龐大的計算量,大大降低電力系統(tǒng)故障分析的實時性,而依賴于大容量、高精度數(shù)字計算機的異常檢測方法也會對檢測算法的靈活性產(chǎn)生不利影響。

      國內(nèi)外學(xué)者針對異常數(shù)據(jù)檢測進(jìn)行了不同程度的研究。文獻(xiàn)[8]事先構(gòu)建參數(shù)數(shù)據(jù)庫,通過檢測數(shù)據(jù)間是否滿足預(yù)先約束關(guān)系自動識別異常數(shù)據(jù)。文獻(xiàn)[9]利用狀態(tài)估計殘差進(jìn)行不良數(shù)據(jù)辨識。文獻(xiàn)[10]則是利用數(shù)據(jù)采集與監(jiān)視控制系統(tǒng)(supervisory control and data acquisition, SCADA)狀態(tài)估計結(jié)果和原始數(shù)據(jù)的殘差,結(jié)合BACON算法檢測異常數(shù)據(jù)。文獻(xiàn)[11]利用基于規(guī)則的算法和能源管理系統(tǒng)(energy management system,EMS)的開關(guān)信息,提出了一種電網(wǎng)在線拓?fù)浔孀R與檢測方法。文獻(xiàn)[12]針對SCADA系統(tǒng)遭受的APT攻擊,基于序列模式支持度建立正常日志行為輪廓,進(jìn)而提出了高持續(xù)性威脅(advanced persistent threat,APT)攻擊的檢測模型。這些算法雖然在一定程度上實現(xiàn)了電力數(shù)據(jù)的異常檢測,但這些研究或是需要預(yù)先建立數(shù)據(jù)庫,或是需要對大量數(shù)據(jù)進(jìn)行計算。由此會帶來一系列新的問題,例如,當(dāng)系統(tǒng)內(nèi)出現(xiàn)設(shè)備或線路更替時,需要更新數(shù)據(jù)庫,工作量將大幅度增加。因此,如果能夠?qū)A繑?shù)據(jù)進(jìn)行降維處理,則可以增強數(shù)據(jù)處理的實時性,但目前尚未發(fā)現(xiàn)相關(guān)研究成果。

      由以上分析可知,設(shè)計一種靈活、實時、高效的電力數(shù)據(jù)異常檢測方法,對于提高電力系統(tǒng)的安全性和可靠性具有重要意義。

      本文針對電力數(shù)據(jù)異常檢測問題,提出一種利用電力信息節(jié)點的歷史數(shù)據(jù)進(jìn)行異常檢測的方法。首先,利用基于重要點分段的時間序列提取方法,在保留數(shù)據(jù)特征的前提下,將信息節(jié)點采集到的高維數(shù)據(jù)進(jìn)行降維處理;其次,將經(jīng)過降維處理的數(shù)據(jù)映射到二維平面上,生成點集S,并構(gòu)造維諾圖分區(qū);最后,計算各數(shù)據(jù)點的離群指標(biāo),進(jìn)而檢測出時間序列中的異常數(shù)據(jù)點。本文以負(fù)荷終端遭受攻擊(負(fù)荷大幅波動)為例,通過仿真實驗驗證了所提算法的有效性?;诰S諾圖的異常檢測方法已存在多年,在電力數(shù)據(jù)異常檢測方面卻尚未有過研究應(yīng)用,本文將基于維諾圖的異常檢測方法結(jié)合時間序列提取,更進(jìn)一步降低了數(shù)據(jù)維度和算法復(fù)雜度。

      1 電力數(shù)據(jù)異常檢測

      目前,異常點(也稱孤立點、離群點、偏差點等)普遍采用的定義是:異常發(fā)生時在數(shù)據(jù)集內(nèi)偏離大部分?jǐn)?shù)據(jù)的數(shù)據(jù),使人懷疑這些數(shù)據(jù)是由不同的機制產(chǎn)生的,而非隨機偏差[13]。

      在電力系統(tǒng)運行過程中,產(chǎn)生異常數(shù)據(jù)的原因有量測和傳送過程受到攻擊、干擾,或發(fā)生故障[14];各個測量點的測量數(shù)據(jù)不同步[15]。異常數(shù)據(jù)的產(chǎn)生不僅會影響到調(diào)度和決策的制定,還會對狀態(tài)估計的收斂性,以及其他依托于SCADA數(shù)據(jù)庫的系統(tǒng)(如EMS等)產(chǎn)生影響[16]。數(shù)據(jù)挖掘技術(shù)是電力系統(tǒng)中較為常用的異常檢測方法,目前應(yīng)用比較多的有序列提取[17]、聚類分析[18]和關(guān)聯(lián)規(guī)則[19]。然而,對于海量的電力數(shù)據(jù)而言,同時間序列提取方法相比,聚類算法及關(guān)聯(lián)規(guī)則方法均面臨著計算量巨大,計算負(fù)擔(dān)沉重等缺點,極大降低了異常檢測的時效性。

      2 時間序列的特征表示

      電力數(shù)據(jù)是一種與時間緊密相關(guān)的數(shù)據(jù),具有維數(shù)高、規(guī)模大、結(jié)構(gòu)復(fù)雜等特點。如果直接對原始海量的電力數(shù)據(jù)進(jìn)行異常檢測,需要面臨巨大的計算量,檢測效率低。此外,量測噪聲(或干擾)也會影響到直接檢測的準(zhǔn)確性和可靠性。因此,有必要對原始電力數(shù)據(jù)進(jìn)行處理,從而降低數(shù)據(jù)維度和量測噪聲的影響。本文采用時間序列特征表示方法,提取出電力數(shù)據(jù)的時間序列特征,從而將高維時間序列壓縮為低維特征序列,在降低計算量的同時提高異常檢測算法的執(zhí)行效率和準(zhǔn)確性。

      時間序列的提取方法包括:傅里葉變換法、小波變換法、符號映射和分段線性表示(piecewise linear representation,PLR)。由于傅里葉變換和小波變換都是基于點距離的方法,難以刻畫時間序列的動態(tài)屬性[20],而PLR具有高數(shù)據(jù)壓縮度、時間多解析性和距離度量靈活等特點,因此本文采用該方法進(jìn)行數(shù)據(jù)壓縮,下面給出相關(guān)定義。

      定義1 時間序列

      對于給定的有限時間集T、非空狀態(tài)屬性集A={A1,A2, … ,Am}、Aj對應(yīng)的值域DAj,時間序列X表示為有序項隊列{X1,2,… ,Xn},其中Xi= {ti,a1, … ,am},ti∈T,aj∈DAj,j=1, 2, …,m[21]。

      電力數(shù)據(jù)是典型的一維時間序列,即m=1,此時時間序列可以表示為X={xi=(ti,vi)}ni=1,其中xi= (ti,vi)表示xi在ti時刻對應(yīng)的值是vi。

      定義2 分段線性表示

      時間序列X={xi=(ti,vi)}ni=1分為K段后表示為

      XPLR= {(x1L,x1R), ... ,
      (xiL,xiR), ... ,(xKL,xKR)}

      (1)

      式中:xiL和xiR分別為第i段直線的左端值和右端值;K為時間序列的劃分段數(shù)。通過將分段后所得到的直線進(jìn)行連接,則可以得到時間序列的分段線性表示形式[22]。

      直觀地說,PLR將時間序列轉(zhuǎn)換為若干相互連接的線性分段,并可以進(jìn)一步對這些線性分段進(jìn)行矢量特征提取(斜率反映時間序列的變化程度;長度反映時間序列的持續(xù)時間),從而將線性分段轉(zhuǎn)化為二維平面上的點。

      時間序列的線性分段示意圖如圖1所示。

      圖1 時間序列以及PLR示意圖Fig.1 Time series and PLR Method

      Pratt和Fink提出了一種高效的時間序列提取和編號的方法,并在股價、風(fēng)速、腦電圖等復(fù)雜數(shù)據(jù)的分析中取得了很好的測試結(jié)果[23],其基本原理為:首先,從某段時間序列中抓取序列特征,提取出重要特征點,摒棄其他非重要點,從而獲得新序列;其次,對新序列進(jìn)行重新編號,利用特征將原序列分段線性表示;最后,通過PLR方法將時間序列進(jìn)行線性分段。這些線性分段可以被轉(zhuǎn)換為二維平面上的點,從而為異常數(shù)據(jù)檢測算法提供簡化、精確的數(shù)據(jù)源。

      時間序列提取過程中的重要點定義為局部范圍內(nèi)與端點的比值超過參數(shù)R的極值點。

      (1)若?am∈(a1,…,an),且滿足:

      1)am=min(a1,…,an),其中i

      2)ai/am≥R且aj/am≥R;

      則am為局部重要最小值點。

      (2)若?am∈(a1,…,an),且滿足:

      1)am=max(a1,…,an),其中i

      2)ai/am≥R且aj/am≥R;

      則am為局部重要最大值點。其中:a代表數(shù)據(jù)點;角標(biāo)i、m、j分別代表相鄰的第i、m、j個數(shù)據(jù);R>1為序列的壓縮率。重要點的選取和線性分段的精細(xì)程度依賴于參數(shù)R,R越大,序列壓縮程度越高。R的取值與序列提取效果如圖2所示。

      3 基于維諾圖的異常檢測方法

      圖2 重要點壓縮示意圖Fig.2 Important points after compressed

      在對原始的電力數(shù)據(jù)進(jìn)行降維處理后,需要設(shè)計一種高性能的異常檢測算法。目前,常見的異常檢測方法包括[18]:統(tǒng)計法、距離法、密度法、聚類法和偏差法等。文獻(xiàn)[24]提出了一種基于維諾圖的異常檢測算法(Voronoi outlier detection,VOD),并證明了VOD方法可以避免參數(shù)選擇對結(jié)果的影響,同時將算法復(fù)雜度降低到O(NlgN),且具有較好的檢測準(zhǔn)確性?;诰S諾圖的異常檢測方法在計算機領(lǐng)域已有較多成熟應(yīng)用,而在電力領(lǐng)域的應(yīng)用尚未引起關(guān)注。

      本文首先采用前述時間序列提取方法對電網(wǎng)樣本數(shù)據(jù)進(jìn)行降維處理,而后利用VOD方法對降維后的數(shù)據(jù)進(jìn)行異常檢測。以下給出VOD法中的基本定義[24-25]。

      定義3 Voronoi多邊形

      對具有n個點的點集S={p1,p2, … ,pn}中的任意點pi,V(pi)是比S中的其他點更接近或同樣接近pi的所有點q的集合,該集合劃分出來的區(qū)域稱為點Voronoi多邊形,記作V(pi)。

      V(pi)={q|d(pi,q)≤d(pj,q),?i≠j}

      (2)

      式中d(·)表示歐氏距離。

      定義4 Voronoi圖

      給定n個點的點集S={p1,p2, … ,pn},其所有點對應(yīng)的V(pi)將平面劃分為n個區(qū)域,稱為點集S的Voronoi圖,記作Gv(S)。其中,i∈(1, 2, … ,n)。

      定義5 V-近鄰點

      ?pi∈S,V(pi)的每一條邊確定pi的一個近鄰點,pi的所有近鄰點的集合記作Vn(pi)。

      定義6 V-近鄰密度

      ?pi∈S,VN(pi)中所有的點到pi的平均距離的倒數(shù)稱為pi的V-近鄰密度,記作Vd(pi),即

      Vd(pi)=1∑o∈VN(P)d(pi,o)/VN(pi)

      (3)

      式中:|VN(pi)|為pi的近鄰點個數(shù);Vd(pi)反映了pi周圍點的分布密度。

      定義7 V-近鄰異常因子(voronoi neighbor outlier factor,VNOF)

      點pi的近鄰分布密度與該點分布密度的比值,稱為V-近鄰異常因子,記作Fv(pi),即

      Fv(pi)=1VN(pi)∑o∈VN(p)Vd(o)Vd(pi)

      (4)

      本文提出的基于序列提取與VOD的電力數(shù)據(jù)異常檢測算法流程如圖3所示。

      圖3 算法流程Fig.3 Algorithmic framework

      4 算例分析

      在各類電力數(shù)據(jù)中,負(fù)荷數(shù)據(jù)是一類典型的終端數(shù)據(jù),且對電力調(diào)度決策的制定、需求側(cè)響應(yīng)等具有較大的影響。電力日負(fù)荷曲線的特征明顯,隨時間連續(xù)變化,但存在若干個明顯的高峰段和低谷段。這樣的連續(xù)時間序列數(shù)據(jù),出現(xiàn)異常變化波動時,并非簡單的上下限越限,而需根據(jù)數(shù)據(jù)之間的相互關(guān)系,采用聚類方法進(jìn)行檢測。

      本文選取某地實際日負(fù)荷的連續(xù)200個數(shù)據(jù)樣點,作為正常序列組;通過修改負(fù)荷數(shù)據(jù)樣本60~73、170~174數(shù)據(jù)段,使得負(fù)荷曲線出現(xiàn)異常程度波動,作為異常序列組,模擬異常情形,如電力設(shè)備故障,遠(yuǎn)端數(shù)據(jù)讀取錯誤或受攻擊篡改。為模擬實際情況,在正常樣本和異常樣本中引入μ=0,σ=2的相同正態(tài)分布誤差,作為實際測量噪聲,仿真步驟如下所述。

      (1)基于時間序列提取的降維預(yù)處理。

      運用Pratt和Fink提出的時間序列提取方法,對負(fù)荷數(shù)據(jù)進(jìn)行降維預(yù)處理。如圖4所示,原樣本數(shù)據(jù)共200個樣本點;提取后的重要點用空心圓標(biāo)記,壓縮參數(shù)R=1.02。

      圖4 樣本序列及提取結(jié)果Fig.4 Time series and compressed series

      時間序列提取效果如表1所示,經(jīng)過時間序列提取的新樣本數(shù)據(jù),不僅保留了原樣本中關(guān)鍵極值點,反映了原樣本時間序列的變化走勢,同時大大減小了數(shù)據(jù)量,減輕了后續(xù)異常檢測算法的計算負(fù)擔(dān)。

      表1 提取效果
      Table 1 Compression performance

      (2)基于維諾圖的異常檢測。

      原樣本經(jīng)提取生成新的時間序列,新序列保留了原序列的數(shù)據(jù)特征。將新序列的第i個線性分段按以下規(guī)則映射到維諾圖二維平面:

      (xi,yi)=(mAi,nBi)

      (5)

      式中:權(quán)重系數(shù)m,n∈(0, 1];A,B分別是序列中線性分段的兩類特征參數(shù)。在此,Ai是第i個分段的長度,反映持續(xù)時間,Bi是第i個分段的斜率,反映變化速率,m=n=1表示兩個特征重要性相當(dāng)。若m=0.8,n=1,則表明該情形下的變化速率比持續(xù)時間更重要。根據(jù)不同場景的檢測需求,調(diào)整權(quán)重系數(shù)改變映射,可獲得理想的檢測效果。

      將正常樣本經(jīng)提取后的新序列按上述規(guī)則映射到二維平面,并按維諾圖定義劃分區(qū)域,計算出點i的V-近鄰密度,取其倒數(shù)作為離群值Oi,反映該點與毗鄰其他點的偏離程度。經(jīng)計算,正常樣本的離群值最大的5個點如表2所示。表中,i是點的序號,Oi是該點的離群值,xi、yi分別是該點在維諾圖平面內(nèi)的x坐標(biāo)和y坐標(biāo),。

      表2 正常樣本的離群值最大的5個點
      Table 2 Most five outlier points in normal series

      通過多次對原始正常樣本引入隨機正態(tài)分布誤差,并計算離群值后,發(fā)現(xiàn)正常樣本離群值最大值均不大于50,故設(shè)定正常與異常的離群閾值為50。

      同樣地,對加入檢測誤差的異常樣本進(jìn)行異常檢測計算,離群值最大的5個點如表3所示。表3中大于閾值50的點有2個,分別為第19點和第6點,視為異常點,在圖4(b)中用實心點標(biāo)出。

      表3 異常樣本的離群值最大的5個點
      Table 3 Most five outlier points in abnormal series

      正常樣本和異常樣本的異常檢測結(jié)果如圖5所示。2個異常點在圖5(b)中用實心點標(biāo)出,可從圖中明顯看出,異常點與正常點存在明顯偏離;第19點和第6點對應(yīng)的樣本序列段則為異常段,在異常樣本序列中對應(yīng)60~84、156~172數(shù)據(jù)段,而正常樣本被修改的數(shù)據(jù)段是60~73、170~174數(shù)據(jù)段,可印證異常檢測有效。

      圖5 維諾圖及異常檢測結(jié)果Fig.5 Voronoi diagram and outlier detection results

      在圖4(b)中可以觀察到,其較大的變化率、較長的變化持續(xù)時間,使得相應(yīng)異常數(shù)據(jù)的離群值偏大,且遠(yuǎn)大于其他離群值,不符合該段電力負(fù)荷樣本數(shù)據(jù)中其他大部分?jǐn)?shù)據(jù)的變化特征,異常檢測的結(jié)果可作為系統(tǒng)異常的輔助判據(jù),對此可予以系統(tǒng)告警,或進(jìn)一步詳細(xì)排查處理。

      5 結(jié) 論

      針對高維度、時間強耦合的電力數(shù)據(jù)異常檢測問題,采用計算機領(lǐng)域中成熟的數(shù)據(jù)挖掘技術(shù)和維諾圖算法,提出一種基于時間序列提取和維諾圖的異常檢測方法,應(yīng)用于電力數(shù)據(jù)的檢測分析。本方法在降低計算復(fù)雜度、提高算法靈活性方面成效顯著,實現(xiàn)了電力異常數(shù)據(jù)的準(zhǔn)確檢測。仿真實驗證明了所提方法的有效性。下一步將研究時間序列提取的壓縮率自適應(yīng)問題,并引入機器學(xué)習(xí)方法,實現(xiàn)不同場景電力數(shù)據(jù)異常判別指標(biāo)的自設(shè)定。

      [1]邱承武, 宓群超. 利用電力數(shù)據(jù)四級網(wǎng)實現(xiàn)小電廠數(shù)據(jù)的采集[J]. 電力系統(tǒng)自動化, 2006, 30(3): 105-106. QIU Chengwu, MI Qunchao. Using electric power IV network to collect power data in small power plant[J]. Automation of Electric Power Systems, 2006, 30(3): 105-106.

      [2]金肇光, 梁奇峰, 黃少先. 計算機與網(wǎng)絡(luò)儀表構(gòu)成的電力數(shù)據(jù)實時測量系統(tǒng)[J]. 電力系統(tǒng)及其自動化學(xué)報, 2004, 16(1): 89-91. JIN Zhaoguang, LIAN Qifeng, HUANG Shaoxian. The electric data real-time measurement system comprising computer and network instrument[J]. Proceedings of the Automation of Electric Power Systems, 2004, 16(1): 89-91.

      [3]王興志, 嚴(yán)正, 沈沉, 等. 基于在線核學(xué)習(xí)的電網(wǎng)不良數(shù)據(jù)檢測與辨識方法[J]. 電力系統(tǒng)保護(hù)與控制, 2012, 40(1): 50-55. WANG Xingzhi, YAN Zheng, SHEN Chen, et al. Power grid bad-data and identification based on online kernel learning method[J]. Power System Protection and Control, 2012, 40(1): 50-55.

      [4]秦璇. 電力統(tǒng)計數(shù)據(jù)的質(zhì)量評估及其異常檢測方法研究[D]. 長沙:長沙理工大學(xué), 2013. QIN Xuan. Data quality evaluation and anomaly detection research based on the statistical data of power system[D]. Changsha:Changsha University of Science & Technology, 2013.

      [5]TEN C W, LIU C C, MANIMARAN G. Vulnerability assessment of cybersecurity for SCADA systems[J]. IEEE Transactions on Power Systems, 2008, 23(4): 1836-1846.

      [6]董朝陽, 趙俊華, 文福拴, 等. 從智能電網(wǎng)到能源互聯(lián)網(wǎng): 基本概念與研究框架[J]. 電力系統(tǒng)自動化, 2014, 38(15): 1-11. DONG Zhaoyang, ZHAO Junhua, WEN Fushuan, et al. From smart grid to energy internet: Basic-concept and research framework[J]. Automation of Electric Power Systems, 2014, 38(15): 1-11.

      [7]MO Y, KIM H H, BRANCIK K, et al. Cyber-physical security of a smart grid infrastructure[J]. Proceedings of the IEEE, 2012, 100(1): 195-209.

      [8]唐新安, 胡鐵斌. SCADA系統(tǒng)中壞數(shù)據(jù)的自動檢測[J]. 電力自動化設(shè)備, 2002, 22(10): 81-82. TANG Xinan, HU Tiebin. Automation detection of bad data in SCADA system[J]. Electric Power Automation Equipment, 2002, 22(10): 81-82.

      [9]SINGH N, GLAVITSCH H. Detection and identification of topological errors in online power system analysis[J]. IEEE Transactions on Power Systems, 1991, 6(1): 324-331.

      [10]MA J, CHEN Y, HUANG Z, et al. Detect abnormal SCADA data using state estimation residuals[C]// Proceedings of IEEE Power & Energy Society General Meeting. IEEE, 2010: 1-8.

      [11]王增平,張晉芳, 錢誠. 基于同步測量信息的電網(wǎng)拓?fù)溴e誤辨識方法[J]. 電力自動化設(shè)備, 2012, 32(1):1-8. WANG Zengping, ZHANG Jinfang, QIAN Cheng. Topology error identification based on synchronized measurements for power network[J]. Electric Power |Automation Equipment, 2012, 32(1): 1-8.

      [12]王傳安, 張?zhí)鞎? 趙海燕,等. SCADA系統(tǒng)通信網(wǎng)中的高級持續(xù)性攻擊檢測方法[J]. 計算機科學(xué)與探索, 2015, 9(3): 352-359. WANG Chuanan, ZHANG Tianhui, ZHAO Haiyan, et al. Detection of advanced persistent threats in SCADA communication network[J]. Journal of Frontiers of Computer Science and Technology, 2015, 9(3): 352-359.

      [13]HAWKINS D M. Identification of Outliers[M]. Berlin: Springer Netherlands, 1980: 13-26.

      [14]劉瑞葉, 李衛(wèi)星, 李峰,等. 電網(wǎng)運行異常的狀態(tài)特征與趨勢指標(biāo)[J]. 電力系統(tǒng)自動化, 2013, 37(20):47-53. LIU Ruiye, LI Weixing, LI Feng, et al. State features and tendency indices embodying abnormal operation of power systems[J]. Automation of Electric Power Systems, 2013, 37(20):47-53.

      [15]葉鋒, 何樺, 顧全, 等. EMS中負(fù)荷預(yù)測不良數(shù)據(jù)的辨識與修正[J]. 電力系統(tǒng)自動化, 2006, 30(15):85-88. YE Feng, HE Hua, GU Quan, et al. Bad data identification and correction for load forecasting in energy management system[J]. Automation of Electric Power Systems, 2006, 30(15):85-88.

      [16]嚴(yán)英杰, 盛戈皞, 陳玉峰,等. 基于時間序列分析的輸變電設(shè)備狀態(tài)大數(shù)據(jù)清洗方法[J]. 電力系統(tǒng)自動化, 2015(7):138-144. YAN Yingjie, SHENG Gehao, CHEN Yufeng, et al. Cleaning method for big data of power transmission and transformation equipment state based on time sequence analysis[J]. Automation of Electric Power Systems, 2015(7):138-144.

      [17]BREUNIG M M, KRIEGEl H P, NG R, et al. LOF: Identifying density based local outliers[C]// Proceedings of the ACM SIGMOD International Conference on Management of Data. Dallas, 2000: 93-104.

      [18]JIN W, TUNG A K H, HAN J, et al. Ranking outliers using symmetric neighborhood relationship.[C]// Proceedings of the 10th Pacific-Asia Conference on Advances in Knowledge Discovery and Data Mining. Singapore: DBLP, 2006: 577-593.

      [19]廖俊, 于雷, 羅寰, 等. 基于趨勢轉(zhuǎn)折點的時間序列分段線性表示[J]. 計算機工程與應(yīng)用, 2010, 46(30): 50-53. LIAO Jun, YU Lei, LUO Huan, et al. Time series piecewise linear representation based on trend transition point[J]. Computer Engineering and Applications, 2010, 46(30): 50-53.

      [20]KEOGH E, CHAKRABARTI K, PAZZANI M, et al. Dimensionality reduction for fast similarity search in large time series databases[J]. Knowledge & Information Systems, 2002, 3(3): 263-286.

      [21]YI B K, FALOUTSOS C. Fast time sequence indexing for arbitrary lp norms[C]// Proceedings of the 26th International Conference on Very Large Data Bases. Morgan Kaufmann Publishers Inc. 2000: 385-394.

      [22]PRATT K B, FINK E. Search for patterns in compressed time series [J]. International Journal of Image & Graphics, 2011,2(1):89-106.

      [23]曲吉林, 寇紀(jì)淞, 李敏強, 等. 基于Voronoi圖的異常檢測算法[J]. 計算機工程, 2007, 33(23): 35-36. QU Jilin, KOU Jisong, LI Minqiang, et al. Outlier detection algorithm based on Voronoi diagram[J]. Computer Engineering, 2007, 33(23): 35-36.

      [24]PREPARATA F P, SHAMOS M I. Computational geometry- an introduction[M]. New York: Springer-Verlay, 1985:56-82.

      [25]楊莉, 李鵬舉. 基于數(shù)據(jù)挖掘的日負(fù)荷曲線預(yù)測與修正[J]. 計算機系統(tǒng)應(yīng)用, 2014, 23(12): 182-186. YANG Li, LI Pengju. Forecasting and modification of daily load curve based on data mining[J]. Computer Systems & Applications, 2014, 23(12): 182-186.

      裴湉 (1993),女,碩士,主要從事電力信息物理系統(tǒng)、電力信息安全和新能源方面的研究工作;

      齊冬蓮(1973),女,博士,教授,博士生導(dǎo)師,本文通信作者,主要研究方向為分布式能源控制、電力信息物理系統(tǒng)及非線性系統(tǒng)研究工作。

      (編輯 劉文瑩)

      Outlier Detection Method Based on Compressed Time Series and Voronoi Diagram for Power Data

      PEI Tian, QI Donglian

      (Department of Electrical Engineering, Zhejiang University, Hangzhou 310027, China)

      The deep integration of information system and physical system made power system easily affected by outlier data, while the existing outlier detection methods for power system didn’t take the advantages of data features, and had problems such as heavy computation, bad flexibility and low precision, etc. This paper proposes an outlier detection method based on compressed time series and Voronoi diagram, which adopts the time series extraction method of important points section to reduce the dimension of data in power system, map it to a two-dimensional plane, construct the Voronoi diagram partition, and then detect the abnormal data. This method can reduce the data dimension and algorithm complexity, set anomaly threshold according to the sequence features flexible, and realize the accurate detection of abnormal data. The simulation results have verified the effectiveness of the proposed method.

      time series; Voronoi diagram; outlier detection; power data

      國家高技術(shù)研究發(fā)展計劃項目(2015AA050202);國家自然科學(xué)基金項目(U1509218)

      TM 73

      A

      1000-7229(2017)05-0105-06

      10.3969/j.issn.1000-7229.2017.05.014

      2017-01-20

      Project supported by the National High Technology Research and Development of China (2015AA050202);National Natural Science Foundation of China(U1509218)

      猜你喜歡
      分段樣本算法
      一類連續(xù)和不連續(xù)分段線性系統(tǒng)的周期解研究
      用樣本估計總體復(fù)習(xí)點撥
      基于MapReduce的改進(jìn)Eclat算法
      Travellng thg World Full—time for Rree
      進(jìn)位加法的兩種算法
      分段計算時間
      推動醫(yī)改的“直銷樣本”
      隨機微分方程的樣本Lyapunov二次型估計
      3米2分段大力士“大”在哪兒?
      太空探索(2016年9期)2016-07-12 10:00:04
      一種改進(jìn)的整周模糊度去相關(guān)算法
      图木舒克市| 青阳县| 土默特左旗| 榆中县| 灵寿县| 汤阴县| 土默特左旗| 阿拉善右旗| 长宁县| 台北市| 闻喜县| 陇川县| 镇远县| 达尔| 丽江市| 璧山县| 云浮市| 汝城县| 盐边县| 信宜市| 九江县| 化德县| 宁陕县| 安丘市| 兴化市| 伊宁县| 都江堰市| 南漳县| 吴桥县| 江口县| 松原市| 太白县| 永定县| 兴城市| 会东县| 巴彦淖尔市| 定西市| 宁海县| 普兰县| 壶关县| 三门县|