林焱,林芳,黃道姍,方曉玲,郭凱
(1.國網(wǎng)福建省電力有限公司電力科學(xué)研究院,福建 福州 350000;2.四川大學(xué)電氣工程學(xué)院,四川 成都 610065)
隨著電網(wǎng)中敏感設(shè)備的不斷增加,電壓暫降問題越來越突出[1]。對電壓暫降對設(shè)備和用戶造成的影響進行評估,可以為電力公司和用戶采取合理措施、減少敏感用戶的經(jīng)濟損失提供理論依據(jù)[2-3]。
現(xiàn)存的電壓暫降嚴重程度評估方法主要可分為兩大類,分別是隨機預(yù)估法[4-7]和實測統(tǒng)計法[8-11]。其中,隨機預(yù)估法包括解析法[4]、故障點法[5]和蒙特卡洛法[6-7]。解析法通過構(gòu)建阻抗矩陣計算暫降電壓幅值,但是所建模型與實際情形差異較大。故障點法通過假定系統(tǒng)中發(fā)生的故障位置,分析電壓暫降的嚴重性,適用于各類故障運算,但需要進行大量仿真運算,在網(wǎng)絡(luò)結(jié)構(gòu)較大時不適用。蒙特卡洛法通過模擬預(yù)估計算網(wǎng)絡(luò)中各節(jié)點的暫降指標,其無法同時滿足較高的精度和效率。實測統(tǒng)計法基于實際的測量數(shù)據(jù),可以準確地反映電壓暫降嚴重程度,可分為綜合評估法[8-9]和數(shù)據(jù)挖掘分析法[10-11]。綜合評估法將多個指標進行權(quán)重組合來評估電壓暫降影響,但是,忽略了指標之間的同質(zhì)性且指標框架難以考慮全面。數(shù)據(jù)挖掘分析法通過數(shù)據(jù)挖掘方法挖掘不同電壓暫降特征屬性與電壓暫降嚴重程度之間的關(guān)聯(lián)規(guī)則,對電壓暫降嚴重程度進行評估。文獻[10]采用數(shù)據(jù)挖掘方法進行電壓暫降數(shù)據(jù)挖掘,并通過灰靶理論對電壓暫降嚴重度進行匹配評估。文獻[11]在文獻[10]的基礎(chǔ)上提出了基于互信息與改進灰靶理論的電壓暫降嚴重度數(shù)據(jù)挖掘分析方法。但是文獻[10]和文獻[11]都采用了基于傳統(tǒng)Apriori 數(shù)據(jù)挖掘方法,Apriori 算法在對數(shù)據(jù)庫進行掃描之前會加載較多的候選集,導(dǎo)致其計算效率較低,而且采用電壓暫降嚴重度指標來評估暫降的嚴重程度,只考慮了系統(tǒng)側(cè)的電壓擾動,沒有考慮敏感用戶負荷特性。
針對上述情況,本文提出一種基于改進FPGrowth 和層次分析法(analytic hierarchy process,AHP)算法的數(shù)據(jù)挖掘分析方法來評估電壓暫降影響度。對于評估區(qū)域電網(wǎng)的每次電壓暫降事件,從電能質(zhì)量監(jiān)測記錄中提取各節(jié)點的電壓暫降特征屬性,然后計算各節(jié)點對應(yīng)的電壓暫降影響度。運用數(shù)據(jù)挖掘方法挖掘電壓暫降特征屬性與電壓暫降影響度之間的關(guān)聯(lián)規(guī)則。對于任何實際的電壓暫降場景,可以構(gòu)造一組與該故障場景相對應(yīng)的特征屬性值,將該場景的特征屬性與挖掘出的關(guān)聯(lián)規(guī)則進行匹配,從而得到該場景下的電壓暫降影響度。
本文所提方法選取電壓暫降特征屬性并對其進行分類,并且結(jié)合考慮電壓暫降嚴重性和敏感用戶負荷特性的影響度指標構(gòu)建數(shù)據(jù)挖掘分析框架;采用改進的FP-Growth 算法對電壓暫降事件進行數(shù)據(jù)挖掘,該方法避免了傳統(tǒng)FPGrowth 算法產(chǎn)生無效規(guī)則的問題,有效提升了數(shù)據(jù)挖掘的效率;通過層次分析法構(gòu)建關(guān)聯(lián)規(guī)則匹配模型,對電壓暫降影響度進行評估,提高了評估結(jié)果的準確性。最后,通過實例分析驗證了所提方法的實用性。
電能質(zhì)量監(jiān)測系統(tǒng)收集了大量反映電壓暫降事件的數(shù)據(jù),隨著時間的積累最終形成了一個龐大的、信息豐富的數(shù)據(jù)庫。在這些數(shù)據(jù)中,需要遵守一定的原則來篩選出與電壓暫降嚴重程度相關(guān)的因素,以提高挖掘效率并且避免挖掘出“無意義”的關(guān)聯(lián)規(guī)則。本文選取如表1 所示的6個維度因素參與和節(jié)點電壓暫降影響度的關(guān)聯(lián)規(guī)則挖掘。當然,用戶也可以根據(jù)自身需求選取其他電壓暫降特征屬性。
表1 電壓暫降特征屬性Tab.1 Characteristic attribute of voltage sag
在表1 中,“觀測位置”為變電站在電網(wǎng)中的地理位置;“電壓等級”為關(guān)聯(lián)母線的額定電壓;“天氣”為暫降發(fā)生時變電站位置處的天氣情況;“故障原因”為引起此次暫降的原因;“季節(jié)”為暫降發(fā)生的季節(jié);“時間”為暫降在一天當中發(fā)生的時間。
對于關(guān)聯(lián)規(guī)則的挖掘而言,需要將電壓暫降特征屬性轉(zhuǎn)化為定性量進行表示。在表1中,“電壓等級”、“天氣”、“故障原因”為定性的語言描述類數(shù)據(jù);“季節(jié)”和“時間”可以根據(jù)社會生活習慣進行定性劃分;對于“觀測位置”數(shù)據(jù),采用K-means 聚類方法離散為東北、東南、中部、西北、西部、西南6個定性量。
為了衡量電壓暫降對敏感用戶造成的影響,需要從電壓暫降的嚴重程度和敏感用戶負荷特性兩個方面考慮。電壓暫降的嚴重程度除了應(yīng)考慮暫降的幅值和持續(xù)時間外,還應(yīng)考慮敏感設(shè)備的電壓耐受能力,本文采用不兼容度指標[12]來衡量電壓暫降的嚴重程度,該指標計算如下:
式中:DC為不兼容度值;U為電壓幅值標幺值;t為暫降持續(xù)時間;Ucurve(t)為暫降持續(xù)時間為t時耐受曲線上的電壓幅值標幺值,本文采用SEMI F47曲線。
對于敏感用戶來說,除了考慮了電壓暫降的嚴重程度,還需要考慮設(shè)備的優(yōu)先級、容量和運行狀態(tài)等敏感用戶負荷特性。因此定義電壓暫降影響度為
式中:Ck為第k臺設(shè)備容量占節(jié)點總?cè)萘康陌俜直?;ξ為設(shè)備故障率;ω為負荷重要性權(quán)重系數(shù)。
根據(jù)敏感設(shè)備的電壓耐受曲線,如圖1所示,采用考慮能量損失的設(shè)備故障敏感度概率模型,基于能量損失計算設(shè)備故障率ξ[8]。敏感設(shè)備的耐受曲線可以通過實驗獲取[13]。
圖1 敏感設(shè)備耐受曲線Fig.1 The tolerance curve of sensitive equipment
圖1 中,Umax,Umin為敏感設(shè)備對暫降電壓的耐受閾值;Tmax,Tmin為敏感設(shè)備對暫降持續(xù)時間的耐受閾值。敏感設(shè)備對電壓暫降的響應(yīng)可分為正常運行區(qū)域、設(shè)備故障區(qū)域和不確定區(qū)域。曲線1 的外部區(qū)域(U>Umax,T<Tmin)為設(shè)備正常運行區(qū)域;曲線2 的內(nèi)部區(qū)域(U<Umin,T>Tmax)為設(shè)備故障區(qū)域;曲線1 和曲線2 之間為設(shè)備運行不確定區(qū)域,包括A 區(qū)域(Umin<U<Umax,Tmin<T<Tmax)、B 區(qū)域(U<Umin,Tmin<T<Tmax)和C 區(qū)域(Umin<U<Umax,T>Tmax)三個部分。
實際電壓暫降位于負荷耐受曲線的位置是隨機的,即U,T必定滿足累積分布概率函數(shù)。而對敏感設(shè)備而言,設(shè)備故障與否取決于暫降能量損失大小,用能量損失公式E=構(gòu)造累積分布函數(shù)則可得設(shè)備故障率計算公式為
若B 區(qū)域和C 區(qū)域內(nèi)隨機變量T,U的概率密度分別為fx(U),fy(T),則A 區(qū)域內(nèi)隨機變量U,T的聯(lián)合概率密度函數(shù)為fx,y(T,U)=fx(U)fy(T),所以可得A區(qū)域內(nèi)的設(shè)備故障率計算公式為
若該節(jié)點上連接有多種敏感設(shè)備,則該節(jié)點電壓暫降的綜合影響度為
式中:DIk為第k臺設(shè)備的影響度;m為第j種設(shè)備的總臺數(shù);n為敏感設(shè)備的種類。根據(jù)電壓暫降綜合影響度的大小,將其劃分為5個等級:優(yōu)(0 ≤DI<1)、良(1 ≤DI<2)、中(2 ≤DI<3)、較差(3 ≤DI<4)、差(DI≥4)。
關(guān)聯(lián)規(guī)則形式為:X→Y,其中X?Y=?[14]。通常采用支持度(S(X→Y))和置信度(C(X→Y))兩個指標來進行關(guān)聯(lián)規(guī)則的挖掘,其中規(guī)則支持度表示規(guī)則在數(shù)據(jù)庫中出現(xiàn)的頻率,規(guī)則置信度表示規(guī)則的可靠性。二者的計算公式為
式中:N(X?Y)為同時包含X和Y的事務(wù)的數(shù)目;N(D)為數(shù)據(jù)庫D包含事務(wù)的數(shù)目。
式(7)表示同時包含X和Y的事務(wù)數(shù)占數(shù)據(jù)庫D中事務(wù)的比值;式(8)為在數(shù)據(jù)庫D中同時包含X和Y的事務(wù)占所有包含X的事務(wù)的比值。
FP-Growth 算法[15]將數(shù)據(jù)庫中轉(zhuǎn)化為一棵頻繁模式樹(frequent pattern tree,F(xiàn)P-Tree),在保留原數(shù)據(jù)庫中各項目間關(guān)聯(lián)信息的同時,實現(xiàn)了數(shù)據(jù)庫的壓縮,并且提高了數(shù)據(jù)挖掘效率。相較于傳統(tǒng)的關(guān)聯(lián)規(guī)則挖掘Apriori 算法,該算法不會產(chǎn)生候選項集,并且可以減少掃描數(shù)據(jù)庫的次數(shù),可以有效提高挖掘效率,尤其在數(shù)據(jù)庫較大時[16]。
傳統(tǒng)的FP-Growth 算法可以挖掘任意屬性之間的關(guān)聯(lián)規(guī)則,對于關(guān)聯(lián)特性的條件和結(jié)果沒有限制。但是,當采用關(guān)聯(lián)規(guī)則來評估電壓暫降的影響度時,關(guān)聯(lián)規(guī)則的結(jié)果必須是電壓暫降的影響度指標,而條件為電壓暫降特征屬性。所以采用傳統(tǒng)的FP-Growth 算法挖掘特征屬性與影響度指標時會產(chǎn)生大量的無效規(guī)則[17],所以本文提出一種改進的FP-Growth 算法以避免這種情形,算法的步驟如下:
1)掃描數(shù)據(jù)庫,找出并統(tǒng)計每個特征屬性項出現(xiàn)的次數(shù)。根據(jù)特征屬性項出現(xiàn)的次數(shù)進行降序排列以得到特征屬性項頻繁列表,同時刪除不滿足設(shè)定最小支持度的數(shù)據(jù)項。以表2中數(shù)據(jù)集為例,數(shù)據(jù)項a,b,c,d,e 和f 為特征屬性項,數(shù)據(jù)項g 和h 為影響度指標項,掃描全部特征屬性項并計算出不同數(shù)據(jù)項出現(xiàn)的頻次。其中特征屬性項a 出現(xiàn)了6 次,特征屬性項c 和b 出現(xiàn)了5次,特征屬性項e 出現(xiàn)了4 次,特征屬性項d 出現(xiàn)了3 次,而特征屬性項f 則出現(xiàn)了1 次。設(shè)定最小支持度為0.25,亦即項目最少出現(xiàn)次數(shù)為2次。
表2 數(shù)據(jù)庫Tid表Tab.2 Tid table of database
2)將所得滿足最小支持度的特征屬性項放到頻繁項集表中,如表3 所示。按照每個特征屬性項出現(xiàn)的次數(shù)將表2中數(shù)據(jù)集從大到小進行重新排序,且將影響度指標排到末尾,重新排列后的數(shù)據(jù)庫如表4所示。
表3 頻繁項集表Tab.3 Frequent itemsets table
表4 整理后數(shù)據(jù)庫Tid表Tab.4 The restructured Tid table of database
3)再一次掃描數(shù)據(jù)庫,創(chuàng)建FP-Tree 的根節(jié)點,以Null 表示。將再次掃描所得的每條事務(wù)按照頻繁項列表的排列順序(影響度指標排到末尾)插入到FP-Tree 中,以此來創(chuàng)建一條路徑。如果在建立FP-Tree 的過程中出現(xiàn)了相同項,則在相關(guān)項的節(jié)點數(shù)上加1。根據(jù)整理后的數(shù)據(jù)列表4,按照表3 給出特征屬性項順序依次將表4 中的項目集加入FP-Tree中,即可得到如圖2所示的樹狀圖。
圖2 FP-Tree樹狀圖Fig.2 FP-Tree graphs
4)對于圖2 所示的每一條樹枝,統(tǒng)計尾節(jié)點影響度指標項數(shù)目。若該節(jié)點指標項數(shù)目滿足最小支持度,則將此節(jié)點為結(jié)尾的路徑與影響度指標項作為候選規(guī)則輸出。其中,影響度指標項的數(shù)目占總事件數(shù)目的比值為該規(guī)則的支持度,影響度指標項的數(shù)目與上一節(jié)點特征屬性項的數(shù)目之比為該規(guī)則的置信度。
如樹枝③節(jié)點的影響度指標項g的數(shù)目為2,滿足最小支持度,且置信度為1。則a,e,d,g作為候選規(guī)則集。根據(jù)圖2得到的候選規(guī)則集如表5所示。
表5 候選規(guī)則集Tab.5 Candidate rulesets
對于挖掘出的關(guān)聯(lián)規(guī)則,若要用于指導(dǎo)實際生產(chǎn),則還需要與實際故障場景相匹配,通過建立合適的匹配模型,在與實際場景不完全相同時,輸出相似結(jié)果。
本文采用層次分析法來構(gòu)建關(guān)聯(lián)規(guī)則的匹配模型,采用層次分析法[18-19]構(gòu)建關(guān)聯(lián)規(guī)則匹配模型的步驟如下:
1)根據(jù)實際場景與關(guān)聯(lián)規(guī)則匹配體系,將匹配度最大確定為目標層,將電壓暫降特征屬性各維度隸屬度確定為準則層,挖掘出的關(guān)聯(lián)規(guī)則庫為方案層。
2)根據(jù)指標層各指標間的關(guān)系確定判斷矩陣。通過文獻[18]中的標度來定義判斷矩陣A。最后構(gòu)成判斷矩陣A中元素的定義如下:
式中:n為指標數(shù)目。
3)由判斷矩陣A得到該矩陣的最大特征值λmax及其對應(yīng)的特征向量ξ,將特征向量進行歸一化以得到權(quán)重矩陣W:
式中:wi為第i個指標的權(quán)重。
4)檢驗判斷矩陣的一致性比率是否滿足要求,首先通過最大特征值λmax和指標數(shù)目n計算一致性指標CI,計算公式如下:
然后查找文獻[18]中一致性指標RI,并計算一致性比例CR,計算公式如下:
當CR<1.0 時,則判斷矩陣滿足要求,否則應(yīng)適當修正判斷矩陣,重新計算一致性比例CR,直至滿足要求為止。
5)計算關(guān)聯(lián)規(guī)則暫降特征屬性各維度隸屬度,通過權(quán)重矩陣W計算關(guān)聯(lián)規(guī)則與實際場景之間的匹配度,計算公式如下式:
式中:μki為第k條關(guān)聯(lián)規(guī)則第i個特征屬性隸屬度。根據(jù)匹配度的大小對關(guān)聯(lián)規(guī)則進行排序,并將匹配度最大的關(guān)聯(lián)規(guī)則作為結(jié)果輸出。
以某電力公司電能質(zhì)量監(jiān)測記錄為原始數(shù)據(jù),提取電壓暫降的特征屬性作為事件分析的歷史數(shù)據(jù)庫。該數(shù)據(jù)庫時間跨度為2016 年1 月—2019年12月,包括220 kV及以上母線節(jié)點99個,其他節(jié)點402個。
使用K-MEANS 聚類方法對電壓暫降觀測位置的經(jīng)緯度值進行聚類,得到6 個定性部分。根據(jù)當?shù)貧庀缶中畔⒂涗浀玫綍航禃r的天氣信息。由監(jiān)測數(shù)據(jù)得到每次暫降事件的故障原因和時間信息,并進行分類。結(jié)合故障事件報告、監(jiān)測數(shù)據(jù)與電網(wǎng)拓撲,計算所有事件所有母線節(jié)點的電壓幅值;并根據(jù)已知歷史暫降事件的電壓幅值、持續(xù)時間與敏感設(shè)備耐受能力,結(jié)合關(guān)心節(jié)點所接敏感負荷特性,計算該節(jié)點電壓暫降影響度。
為驗證關(guān)聯(lián)規(guī)則的有效性,將2016 年1 月—2018 年12 月的數(shù)據(jù)作為訓(xùn)練樣本集,建立電壓暫降影響度數(shù)據(jù)庫。再以2019 年1 月—2019 年12 月的數(shù)據(jù)作為測試集,進行關(guān)聯(lián)規(guī)則的匹配與驗證。當依據(jù)2016 年—2018 年數(shù)據(jù)庫挖掘出的關(guān)聯(lián)規(guī)則在2019 年的暫降事件中仍具有相似的置信度時,則說明挖掘出的關(guān)聯(lián)規(guī)則可以指導(dǎo)用戶采取相應(yīng)措施降低損失。
首先對作為訓(xùn)練樣本集的數(shù)據(jù)進行數(shù)據(jù)挖掘,從挖掘出的關(guān)聯(lián)規(guī)則內(nèi)隨機選取30條關(guān)聯(lián)規(guī)則,參考式(8)定義關(guān)聯(lián)規(guī)則在測試集中的置信度CS(i)和定義準確率η(i),如下式所示:
式中:N(Xi)為測試場景中滿足故障場景Xi各暫降特征屬性的節(jié)點電壓暫降記錄數(shù);N(Xi→Yi)為滿足關(guān)聯(lián)規(guī)則Xi→Yi各暫降特征屬性的節(jié)點電壓暫降記錄數(shù);C(i)為關(guān)聯(lián)規(guī)則自身置信度;CS(i)為關(guān)聯(lián)規(guī)則在測試集中的置信度。
選取的30 條關(guān)聯(lián)規(guī)則的置信度和準確率如圖3所示。規(guī)則自身置信度C(i)與規(guī)則在測試集中置信度CS(i)具有相同的變化趨勢;準確率η(i)在95%附近波動。說明挖掘出的關(guān)聯(lián)規(guī)則不局限于所挖掘的數(shù)據(jù)庫,具有普遍性。
圖3 關(guān)聯(lián)規(guī)則準確率Fig.3 Association rule accuracy
針對區(qū)域內(nèi)某關(guān)心節(jié)點,設(shè)置其故障場景為{東南,110 kV,冬季,早上,陰,單相接地},將故障場景與關(guān)聯(lián)規(guī)則庫中各規(guī)則進行匹配,當特征屬性相同時,隸屬度取1,其他情況都取0。運用層次分析法獲得特征屬性各維度隸屬度權(quán)重如表6所示。根據(jù)表6中各特征屬性隸屬度的權(quán)重計算關(guān)聯(lián)規(guī)則的匹配度,根據(jù)匹配度的大小輸出關(guān)聯(lián)規(guī)則,匹配結(jié)果如表7所示。
表6 特征屬性隸屬度權(quán)重Tab.6 The weight of membership degree of characteristic attribute
表7 關(guān)聯(lián)規(guī)則匹配結(jié)果Tab.7 The match result of the association rule
根據(jù)表7可以得出在此故障場景下的電壓暫降影響度。序號1的關(guān)聯(lián)規(guī)則具有較高的置信度和匹配度,可以用序號1 對應(yīng)的關(guān)聯(lián)規(guī)則中的電壓暫降影響度等級衡量該節(jié)點在此故障場景下的電壓暫降嚴重程度。即該節(jié)點在此故障場景下的電壓暫降嚴重程度為“優(yōu)”,說明在此故障場景下發(fā)生電壓暫降對該節(jié)點所接用戶影響較小。
本文提出一種基于FP-Growth 算法和層次分析法的數(shù)據(jù)挖掘分析方法來評估電壓暫降影響度。所提方法可以挖掘電壓暫降特征屬性與電壓暫降影響度之間的關(guān)聯(lián)規(guī)則,并且可以通過將實際故障場景與挖掘出的關(guān)聯(lián)規(guī)則相匹配來獲得該故障場景下的電壓暫降影響度。同時,根據(jù)挖掘出的關(guān)聯(lián)規(guī)則還可以指導(dǎo)敏感用戶選擇合適的入網(wǎng)點。最后,通過實例分析驗證了所提方法的實用性。
但是,與電壓暫降影響度相關(guān)的特征屬性較多,僅根據(jù)文中提到的特征屬性無法完整地進行描述。因此如何選取合適的電壓暫降特征屬性將會是下一步的研究方向。