王普專 鄔 桐 周 磊 張春香 吳飾斐
1(國(guó)網(wǎng)福建省電力有限公司技能培訓(xùn)中心 福建 泉州 362000)2(東北大學(xué) 遼寧 沈陽(yáng) 110819)3(國(guó)網(wǎng)遼寧省電力有限公司經(jīng)濟(jì)技術(shù)研究院 遼寧 沈陽(yáng) 110015)4(北京科東電力控制系統(tǒng)有限責(zé)任公司 北京 100192)
伴隨電力系統(tǒng)逐漸向大電網(wǎng)與高壓電方面快速發(fā)展,用戶對(duì)供電質(zhì)量的需求也逐漸向高度可靠性靠攏。電力暫態(tài)信息存在比基波分量更豐富的故障信息,暫態(tài)信息的檢測(cè)屬于保護(hù)電力系統(tǒng)、定位故障的核心問(wèn)題[1]。
由于故障暫態(tài)行波在線路中運(yùn)行時(shí)存在非線性衰減問(wèn)題,它的故障暫態(tài)信息未能完全被應(yīng)用。如果可以完全發(fā)掘暫態(tài)波形的核心暫態(tài)數(shù)據(jù),完成暫態(tài)故障情景透明式,便能夠?qū)收显驅(qū)嵭懈呔扰卸?,讓后續(xù)的輸電線路優(yōu)化與防御工作更具備針對(duì)性。輸電線路故障所存在的暫態(tài)行波具有大量故障信息,比如極性、行波幅值、故障時(shí)間、故障方位、過(guò)渡電阻等[2]。以上故障信息屬于輸電線路故障診斷的核心憑據(jù)。當(dāng)下國(guó)內(nèi)外相關(guān)研究人員的分析大多集中于故障點(diǎn)暫態(tài)波形特征參數(shù)的提取,但是針對(duì)故障角、過(guò)渡電阻等暫態(tài)信息的提取,還未形成針對(duì)性的方法,此類暫態(tài)故障信息屬于輸電線路的故障原因判斷的核心依據(jù)。為此,本文提出基于FP-growth算法的輸電線路短路故障關(guān)鍵暫態(tài)信息檢測(cè)方法,創(chuàng)新之處在于將基于FP-growth算法的頻繁項(xiàng)挖掘方法應(yīng)用于電力系統(tǒng)中,F(xiàn)P-growth算法能夠快速采集相關(guān)數(shù)據(jù),以免采集不相關(guān)數(shù)據(jù)對(duì)后期暫態(tài)信息提取存在干擾。當(dāng)FP-growth算法采集輸電線路頻繁出現(xiàn)短路故障的線路信息后,通過(guò)故障關(guān)鍵暫態(tài)信息提取方法檢測(cè)該輸電線路短路故障角、過(guò)渡電阻等暫態(tài)信息,實(shí)現(xiàn)輸電線路短路故障關(guān)鍵暫態(tài)信息的準(zhǔn)確檢測(cè)[3]。
步入大數(shù)據(jù)時(shí)期,數(shù)據(jù)挖掘方法在互聯(lián)網(wǎng)檢索引擎、醫(yī)藥科學(xué)等很多領(lǐng)域被大量使用,主要用于在海量數(shù)據(jù)里發(fā)掘內(nèi)在規(guī)律關(guān)聯(lián)性、非無(wú)用信息。FP-growth算法屬于數(shù)據(jù)挖掘方法在關(guān)聯(lián)規(guī)則發(fā)掘領(lǐng)域的核心內(nèi)容,能夠快速挖掘數(shù)據(jù)集合中的頻繁項(xiàng)集和數(shù)據(jù)間潛在關(guān)聯(lián)規(guī)則。本文所用基于FP-growth算法的頻繁項(xiàng)挖掘方法由FP-tree的構(gòu)建和遞歸挖掘FP-tree兩部分組成[4]。
1.1.1確定FP-tree支持度
FP-tree是一種輸入數(shù)據(jù)的壓縮表示法,它通過(guò)逐個(gè)讀入事務(wù),并把每個(gè)事物映射到FP-tree中的一條路徑來(lái)構(gòu)造。由于不同的事物可能會(huì)有若干個(gè)相同的項(xiàng),因此它們的路徑可能部分重疊。路徑相互重疊越多,使用FP樹結(jié)構(gòu)挖掘的輸電線路短路故障關(guān)鍵暫態(tài)信息效果越好。
設(shè)h={i1,i2,…,im}是由m個(gè)項(xiàng)組成的故障信息集合,D是一組輸電線路短路故障數(shù)據(jù)集且D中事務(wù)數(shù)據(jù)都由h中的項(xiàng)組成。給定項(xiàng)集X?h在D中的支持?jǐn)?shù)是指D中包含X的信息數(shù),X在D中的支持度是指X的支持?jǐn)?shù)占D中所有事務(wù)數(shù)的百分比。
定義1對(duì)于項(xiàng)集X?h,若X在D中的支持度sX大于等于給定的最小支持度s,則稱項(xiàng)集X為事務(wù)數(shù)據(jù)集D在最小支持度s下的頻繁項(xiàng)集。
定義2對(duì)于項(xiàng)集X?h,給定最小支持度s,若X的所有超集都是非頻繁項(xiàng)集,則稱項(xiàng)集X為事務(wù)數(shù)據(jù)集D在最小支持度s下的最大頻繁項(xiàng)集。
若R={n1,n2,…,nm}為FP-growth數(shù)據(jù)集D生成的FP-tree中的一條路徑,所有項(xiàng)集和路徑都是按照支持度降序排列的。
證明:根據(jù)集合的性質(zhì)容易得證,若X?R,由于所有項(xiàng)集和路徑都是按照支持度降序排列的,則X?R。
通過(guò)上述證明可知,采用FP-tree的挖掘結(jié)構(gòu)自頂向下的搜索策略,采用雙重循環(huán)的方式挖掘最大頻繁項(xiàng)集,若數(shù)據(jù)項(xiàng)集的支持度大于等于最小支持度閾值,則FP-tree適用于輸電線路故障診斷中。
1.1.2基于數(shù)據(jù)集合構(gòu)建FP-tree
FP-tree屬于FP-growth算法的非常規(guī)數(shù)據(jù)結(jié)構(gòu),可保存輸電線路短路故障原始數(shù)據(jù)中的相關(guān)數(shù)據(jù),只采用2次數(shù)據(jù)掃描,便能將輸電線路短路故障原始數(shù)據(jù)里的事務(wù)壓縮至一個(gè)FP-tree中,此FP-tree與前綴樹相似,相同前綴路徑可通用,以此實(shí)現(xiàn)輸電線路短路故障數(shù)據(jù)壓縮[5]。
假定輸電線路短路故障數(shù)據(jù)集A={a1,a2,…,am},a屬于其中一條事務(wù);隨機(jī)事務(wù)aj屬于輸電線路短路故障多元素構(gòu)成的組合,a2={b1,b2,…,bu},bu表示事務(wù)里的元素,本文將A設(shè)成例子,描述FP-growth的建立流程。
(1) 首次遍歷輸電線路短路故障數(shù)據(jù)集A,記載產(chǎn)生各個(gè)元素項(xiàng)bu的機(jī)率gu。把每個(gè)元素根據(jù)gu減序分布,之后把每個(gè)元素項(xiàng)bu標(biāo)識(shí)信息和存在機(jī)率gu存儲(chǔ)在頭指針表Tabhead里;提前設(shè)定最小支持度gmin,如果gu (2) 再次遍歷輸電線路短路故障數(shù)據(jù)集A,對(duì)A中各個(gè)子集aj實(shí)行篩查與排序。先把a(bǔ)j里gu (3) 通過(guò)AM建立FP-tree。自空集開始,把AM中的每個(gè)事務(wù)aj逐個(gè)加入樹中。先確定FP-tree里是否含有與事務(wù)aj一樣的前綴分支:如果含有,那么共同前綴分支存在輸電線路短路故障檢測(cè)節(jié)點(diǎn)的元素項(xiàng)計(jì)數(shù)值需要加1;如果不含有,那么在共同前綴分支最后一個(gè)節(jié)點(diǎn)的子節(jié)點(diǎn)上構(gòu)建新分支,新分支含有節(jié)點(diǎn)計(jì)數(shù)值是1。全部事務(wù)aj遞歸,直到FP-tree建立。 輸電線路短路故障數(shù)據(jù)集合A中存在9個(gè)事務(wù),當(dāng)中:a1={b1,b2,b3,b4},a2={b2,b3,b4,b5},a3={b2,b3,b4},a4={b1,b2,b3,b4,b5,b6},a5={b1,b3,b6},a6={b2,b3,b6},a7={b1,b3,b4},a8={b1,b2,b3,b4,b7},a9={b1,b2,b4,b7}。 將最小支持度設(shè)成gmin=3,根據(jù)以上步驟建立FP-tree。圖1中的頭指針表中存在輸電線路短路故障數(shù)據(jù)集的元素項(xiàng)和衍生次數(shù),同時(shí)根據(jù)曲線連接FP-tree里全部相同元素項(xiàng);直線相連節(jié)點(diǎn)描述父代和子帶關(guān)系,父代至上[7]。 圖1 FP-tree結(jié)構(gòu) 1.1.3基于FP-tree挖掘頻繁項(xiàng)集 為提升實(shí)際效率,先將Apriori算法與FP-tree結(jié)合使用,先進(jìn)行Apriori算法挖掘,找出滿足最小支持度的所有頻繁項(xiàng)集,再將由頻繁項(xiàng)集滿足最小支持度和最小置信度要求的數(shù)據(jù)項(xiàng)相關(guān)聯(lián)。Apriori算法主要集中在如何快速有效地找出滿足最小支持度的所有頻繁項(xiàng)集,Apriori算法需要多次重復(fù)地掃描數(shù)據(jù),并產(chǎn)生大量的候選項(xiàng)目集來(lái)找出所有的頻繁項(xiàng)集,因此,算法在時(shí)間和空間上的開銷太大。為了克服這些不足,使用FP-tree進(jìn)行挖掘。 頻繁項(xiàng)集發(fā)掘的中心思想為遞歸挖掘,發(fā)掘每個(gè)元素項(xiàng)的條件模式基并建立條件FP-tree,在遞歸時(shí)發(fā)掘頻繁項(xiàng)集[8]。設(shè)定條件模式基是基于某輸電線路短路故障元素項(xiàng)為收尾的路徑組合,路徑中包括了此元素項(xiàng)和根節(jié)點(diǎn)間的全部子節(jié)點(diǎn)項(xiàng)。設(shè)定條件FP-tree是根據(jù)某元素項(xiàng)的條件模式基,是輸入數(shù)據(jù)建立的FP-tree。詳細(xì)流程如下: (1) 在FP-tree里得到輸電線路短路故障某元素項(xiàng)的條件模式基。在頭指針表某元素項(xiàng)bu指向的首個(gè)節(jié)點(diǎn)開始,遍歷此元素項(xiàng)在FP-tree里具有連接關(guān)系的全部節(jié)點(diǎn)[9]。每逢一個(gè)輸電線路短路故障檢測(cè)節(jié)點(diǎn),可實(shí)行依次上溯,同時(shí)記載此節(jié)點(diǎn)到根節(jié)點(diǎn)間存儲(chǔ)的全部元素項(xiàng),衍生一個(gè)前綴路徑,將此前綴路徑設(shè)值,此值與第一個(gè)節(jié)點(diǎn)元素項(xiàng)計(jì)數(shù)值相等。此元素項(xiàng)的剩下前綴路徑集合屬于輸電線路短路故障條件模式基[10]。 (2) 通過(guò)輸電線路短路故障條件模式基建立條件FP-tree。先構(gòu)建輸電線路短路故障的頻繁項(xiàng)集列表,同時(shí)把bu導(dǎo)進(jìn)頻繁項(xiàng)集列表里,之后將根節(jié)點(diǎn)設(shè)成bu,將與bu相符的條件模式基設(shè)成輸入數(shù)據(jù),建立FP-tree,獲取結(jié)果屬于bu的條件FP-tree(條件FP-tree根節(jié)點(diǎn)從空集變成bu)。把條件FP-tree里的元素項(xiàng)(不包含根節(jié)點(diǎn))依次放進(jìn)輸電線路短路故障的頻繁項(xiàng)集列表里[11]。 (3) 遞歸發(fā)掘條件FP-tree里的頻繁項(xiàng)。將條件FP-tree里輸電線路短路故障每個(gè)元素項(xiàng)(不包含根節(jié)點(diǎn))遞歸得到條件模式基,建立條件FP-tree,存儲(chǔ)輸電線路短路故障的頻繁項(xiàng),當(dāng)FP-tree只具有一條分支便停止遞歸,獲取最后的輸電線路短路故障頻繁項(xiàng)集列表,此列表存儲(chǔ)具有bu的頻繁項(xiàng)。 (4) 將頭指針表里的元素項(xiàng)根據(jù)支持度實(shí)行升序分布[12],之后將各個(gè)元素項(xiàng)進(jìn)行步驟(1)-步驟(3)處理,獲取輸電線路短路故障每個(gè)元素項(xiàng)的頻繁項(xiàng)集,此項(xiàng)集即為頻繁出現(xiàn)故障的輸電線路,也稱故障線路。 1.2.1故障行波傳播過(guò)程 圖2是故障線路模型。 圖2 故障線路模型 故障出現(xiàn)方位存在三種狀況: (1)c1、c2之間。 (2)c1、c2或者d1、d2之間。 (3)C、c2或者D、d2之間。 文章圍繞故障點(diǎn)在兩個(gè)監(jiān)測(cè)點(diǎn)c1、d1之間實(shí)行分析。在C側(cè)設(shè)定監(jiān)測(cè)點(diǎn)c1、c2;基于D側(cè)設(shè)定檢測(cè)點(diǎn)d1、d2。C、D依次描述兩端母線,c1、c2之間間隔是eC,d1、d2之間間隔是eC|D|。 若點(diǎn)d2至母線D的間隔是edD,點(diǎn)c1、d1至故障點(diǎn)g1間隔是ecg1、edg1,c1至母線C間隔是ecC,按照d1、d2檢測(cè)的行波第一個(gè)波頭,能夠反演獲取故障點(diǎn)的初始線模電流行波,其幅值設(shè)成LQ。 因?yàn)榫€模波速不小于零模波速[13-14],在研究行波第2個(gè)波頭過(guò)程中,不分析首個(gè)行波的零模分量經(jīng)過(guò)母線反射后抵達(dá)d1、d2的行波。這時(shí)d1、d2檢測(cè)的線模電流行波第2個(gè)波頭能夠通過(guò)下述兩種狀況出現(xiàn): (1) 首個(gè)行波通過(guò)母線C反射,然后通過(guò)故障點(diǎn)折射抵達(dá)d1、d2。 (2) 首個(gè)行波通過(guò)母線D反射,然后再傳輸至d1、d2。 假定ecC+eC+ecg1 如果間隔符合ecC+eC+ecg1 如果ecC+eC+ecg1>edD+ed,則將c1、c2與d1、d2互換,研究方法與上述一樣??山⒛繕?biāo)函數(shù),判斷故障點(diǎn)的故障電阻和故障角情況,完成關(guān)鍵故障信息的詳細(xì)分析。 1.2.2目標(biāo)函數(shù)建立 綜上所述,建立目標(biāo)函數(shù)的原則是為了降低輸電線路短路故障反演獲取的行波幅值和理論運(yùn)算的行波幅值差異。以Z相接地、MN相間短路、MN相接地短路為例,建立目標(biāo)函數(shù)是: (1) (2) (3) 式中:V表示輸電系統(tǒng)各項(xiàng)電壓的最大值;φMN描述MN線電壓故障初始角;φM、φN、φZ(yǔ)描述電壓故障初始角;Wf描述故障電阻;i代表模量標(biāo)號(hào);LQi是按照d1、d2檢測(cè)獲取的第一個(gè)波頭反演獲取的故障點(diǎn)電流行波幅值;Lqi代表按照c1、c2檢測(cè)獲取的第2個(gè)波頭正演獲取的電流行波幅值;Lsi為根據(jù)d1、d2檢測(cè)到的第2個(gè)波頭正演求取的電流行波幅值;r為故障初始角;S0、S1、S2是經(jīng)過(guò)反演參數(shù)運(yùn)算獲取的輸電線路短路故障關(guān)鍵暫態(tài)信息波阻抗。則針對(duì)目標(biāo)函數(shù)P(PZ、PMN、PMNH)來(lái)講,只有故障電阻和故障初始角屬于未知參量。所以,P表示相應(yīng)的故障暫態(tài)信息。 實(shí)驗(yàn)使用21臺(tái)服務(wù)器建立某電力公司輸電線路短路故障的并行計(jì)算環(huán)境,分別模擬覆蓋較廣范圍輸電線路以及較長(zhǎng)時(shí)間的輸電線路。服務(wù)器的主頻是2.41 GHz,操作系統(tǒng)是64位的Debian Linux。通過(guò)IBM DataGen[15]創(chuàng)造輸電線路短路故障測(cè)試數(shù)據(jù)集,在當(dāng)前模擬環(huán)境中,存在的項(xiàng)目總數(shù)是1 000種,各條記載的長(zhǎng)度均值是10,隨機(jī)選取數(shù)據(jù)參數(shù)進(jìn)行仿真實(shí)驗(yàn)。 采用本文方法檢測(cè)實(shí)驗(yàn)輸電線路不同短路故障情況的關(guān)鍵暫態(tài)信息,測(cè)試本文方法的檢測(cè)效果,結(jié)果如表1所示。 表1 不同故障情況下本文方法應(yīng)用效果 續(xù)表1 根據(jù)表1數(shù)據(jù)顯示,本文方法檢測(cè)結(jié)果中故障角的誤差最大值是0.79°,這時(shí)真實(shí)相角是91°;故障電阻的誤差最大值是1.5 Ω,這時(shí)真實(shí)電阻是11 Ω。由此可知,本文方法的魯棒性較優(yōu),在不同故障環(huán)境中均能夠準(zhǔn)確檢測(cè)輸電線路短路故障關(guān)鍵暫態(tài)信息。 為了進(jìn)一步判斷本文方法的應(yīng)用性能,設(shè)定暫態(tài)信息種類依次是A:斷路器操作、B:電容投切、C:?jiǎn)蜗蚨搪贰:一次電弧、E:雷擊。采用本文方法、基于行波反演的輸電線路單相接地故障重演方法,以及基于奇異值分解理論的輸電線路故障檢測(cè)方法對(duì)五種故障關(guān)鍵暫態(tài)信息進(jìn)行檢測(cè),三種方法對(duì)五種故障關(guān)鍵暫態(tài)信息的檢測(cè)結(jié)果對(duì)比見(jiàn)表2。 表2 三種方法對(duì)五種故障關(guān)鍵暫態(tài)信息的檢測(cè)結(jié)果對(duì)比 分析表2可知,三種方法對(duì)比之下,本文方法檢測(cè)輸電線路五種短路故障關(guān)鍵暫態(tài)信息時(shí),對(duì)單向短路、一次電弧、雷擊三種短路故障關(guān)鍵信息檢測(cè)所耗費(fèi)的時(shí)間最短,且與理論時(shí)刻相同,表明本文方法在檢測(cè)輸電線路短路不同故障關(guān)鍵暫態(tài)信息時(shí)的效率較快。 三種方法檢測(cè)暫態(tài)信號(hào)的誤差測(cè)試結(jié)果如表3所示。 根據(jù)表3數(shù)據(jù)可知,當(dāng)需要檢測(cè)的輸電線路短路故障關(guān)鍵暫態(tài)信息是斷路器操作和電容投切所導(dǎo)致時(shí),本文方法的檢測(cè)誤差最小,僅有0.000 006,另外兩種方法的檢測(cè)誤差均為0.000 013;而在剩余三種情況下,本文方法的檢測(cè)誤差僅有0.000 001,則本文方法檢測(cè)精度最高。 設(shè)定海量輸電線路短路故障信息,測(cè)試三種方法在大量故障數(shù)據(jù)檢測(cè)結(jié)果,見(jiàn)圖3。 圖3 三種方法抗干擾性測(cè)試結(jié)果 根據(jù)圖3可知,本文方法的檢測(cè)數(shù)據(jù)量最大值高達(dá)0.97 GB,另外兩種方法的檢測(cè)數(shù)據(jù)量最大值依次是0.88 GB、0.86 GB。對(duì)比可知,本文方法的檢測(cè)能力優(yōu)于常規(guī)兩種方法。 輸電線路出現(xiàn)故障后的暫態(tài)行波屬于一個(gè)具有突變型、奇異性的信號(hào),準(zhǔn)確檢測(cè)輸電線路短路故障關(guān)鍵暫態(tài)信息能夠有效發(fā)掘輸電線路短路故障問(wèn)題。本文提出基于FP-growth算法的輸電線路短路故障關(guān)鍵暫態(tài)信息檢測(cè)方法,在不同故障環(huán)境中均能夠準(zhǔn)確檢測(cè)輸電線路短路故障關(guān)鍵暫態(tài)信息,且在檢測(cè)輸電線路短路故障信息時(shí),本文方法的故障信息檢測(cè)時(shí)間和故障節(jié)點(diǎn)數(shù)據(jù)量存在線性關(guān)系,具有較高的加速比;本文檢測(cè)輸電線路故障關(guān)鍵暫態(tài)信息時(shí)檢測(cè)精度高,在增強(qiáng)電網(wǎng)供電可靠性、避免大停電事故方面具有重要意義。1.2 輸電線路短路故障關(guān)鍵暫態(tài)信息提取
2 仿真實(shí)驗(yàn)分析
2.1 實(shí)驗(yàn)準(zhǔn)備
2.2 多數(shù)據(jù)下設(shè)計(jì)方法實(shí)驗(yàn)結(jié)果與分析
2.3 多檢測(cè)狀態(tài)下測(cè)試結(jié)果
2.4 誤差測(cè)試
2.5 大量故障信息下測(cè)試結(jié)果
3 結(jié) 語(yǔ)