郭飛,吳佳靜,周怡,高利燕,麥曉慶
(1.國網(wǎng)寧夏電力有限公司,寧夏 銀川 750001;2.寧夏信通網(wǎng)絡(luò)科技有限公司,寧夏 銀川 750001;3.國網(wǎng)寧夏電力有限公司信息通信公司,寧夏 銀川 750001;4.濟南銀華信息技術(shù)有限公司,山東 濟南 250000;5.國網(wǎng)寧夏電力有限公司中衛(wèi)供電公司,寧夏 中衛(wèi) 755000)
臺區(qū)線損管理水平綜合反映了電力系統(tǒng)規(guī)劃設(shè)計、生產(chǎn)運行和經(jīng)營管理的水平,是電網(wǎng)經(jīng)營的一項重要經(jīng)濟指標(biāo)。目前影響臺區(qū)線損的主要因素有技術(shù)因素和管理因素。文獻(xiàn)[1]研究了基于機器學(xué)習(xí)的電網(wǎng)臺區(qū)線損異常診斷方法,提出利用機器學(xué)習(xí)構(gòu)建臺區(qū)線損異常分析模型,從計量差錯分析、臺區(qū)串戶等技術(shù)方面分析了線損異常的原因。文獻(xiàn)[2]利用概率分布的方法對線損異常進行識別,從用戶側(cè)判斷評估管理對線損的影響程度。文獻(xiàn)[3]針對計量失誤、計量故障等原因產(chǎn)生的臺區(qū)線損問題,提出線損在線監(jiān)管,并給出具體解決方案。文獻(xiàn)[4]研究了基于數(shù)據(jù)知識融合的輸電線路線損計算方法,分析了環(huán)境影響量對導(dǎo)線損耗的影響和降雨強度對導(dǎo)線表面最大場強、電暈損耗的影響。文獻(xiàn)[5]研究了基于K 最鄰近法(K-nearest neighbor,KNN)和局部離群因子(local outlier factor,LOF)算法的臺區(qū)線損異常監(jiān)測方法,有效提高了供電企業(yè)對臺區(qū)線損的判斷效率,但現(xiàn)有研究結(jié)果中,很少考慮在地形較為偏遠(yuǎn)、氣候多變的山區(qū),氣象因素對臺區(qū)線損異常波動的影響?;诖耍疚慕⒘丝紤]氣象因素的臺區(qū)線損異常智能識別模型,利用離群點檢測算法建立考慮氣象因素的臺區(qū)線損異常智能識別模型,判斷某一段時間內(nèi)日線損易受異常天氣影響的臺區(qū),并評估影響程度的大小。最后以某縣供電公司532 個臺區(qū)91天內(nèi)日線損數(shù)據(jù)為基礎(chǔ),結(jié)合實時和預(yù)報氣象數(shù)據(jù),量化分析異常天氣對某縣臺區(qū)日線損波動的影響,識別日線損容易受天氣影響的臺區(qū),實現(xiàn)線損異常預(yù)警分析,為各專業(yè)完善線損指標(biāo)的風(fēng)險防控機制提供科學(xué)依據(jù),助力提升線損精益化管理水平。
線損是線路損耗的簡稱,即電能通過輸電線路傳輸而產(chǎn)生的能量損耗,包括變壓器等配變設(shè)備,也會產(chǎn)生電能的損耗。臺區(qū)線損是指整個臺區(qū)能量損耗的總和,一般情況下,可根據(jù)臺區(qū)供電量與售電量計算臺區(qū)的線損情況,即:
臺區(qū)線損異常主要有高損臺區(qū)和負(fù)損臺區(qū)。一般情況下,將偏遠(yuǎn)山區(qū)線損率大于10%的臺區(qū)定義為高損臺區(qū),線損率小于-0.5%的臺區(qū)定義為負(fù)損臺區(qū)。臺區(qū)線損異常的具體表現(xiàn)有以下方面:
1)“此消彼長”型。某臺區(qū)線損率連續(xù)異常增大,同時,相鄰臺區(qū)的線損率明顯較低甚至出現(xiàn)負(fù)值,線損率呈現(xiàn)互補的現(xiàn)象。
2)“異常波動”型。臺區(qū)在某段時間內(nèi)線損率變化幅度較大,線損率總體不穩(wěn)定。
3)“異常突變”型。臺區(qū)線損在一段時間內(nèi)保持穩(wěn)定,突然在某一時刻發(fā)生突變,之后保持在一定水平。
線損異常關(guān)系到電網(wǎng)供電效率,影響供電企業(yè)服務(wù)質(zhì)量和經(jīng)濟效益,嚴(yán)重時,會造成巨大的電能浪費,對企業(yè)的發(fā)展產(chǎn)生負(fù)面影響。臺區(qū)線損異常的主要原因有技術(shù)因素和管理因素,但是在某些氣候多變的山區(qū),臺區(qū)線損異常波動也受氣象因素的影響。
離群點檢測是基于統(tǒng)計、頻率、深度、距離等多角度對異常數(shù)據(jù)進行識別的大數(shù)據(jù)挖掘算法之一,可快速實現(xiàn)異常信息的高效提取[6]。LOF算法是基于距離和密度的離群點檢測方法中一個比較有代表性的算法,該算法對數(shù)據(jù)集中的每個點計算一個離群因子LOF,通過判斷LOF 是否接近于1來判定是否為離群因子[7-8]。具體算法步驟如下。
2.1.1 計算對象p的k距離
對于正整數(shù)k,對象p的k距離可記作distk(p)。在樣本空間D中,存在對象o,它與對象p之間的距離為d(p,o)。如果滿足以下兩個條件,則認(rèn)為distk(p)=d(p,o)。
1)在樣本空間D中,至少存在k個對象q,使得d(p,q) ≤d(p,o);
2)在樣本空間D中,至多存在k-1個對象q,使得d(p,q) <d(p,o)。
本文選用歐式距離計算p的k距離:
使用distk( )p量化對象p的局部空間區(qū)域范圍,對于對象密度較大的區(qū)域,distk( )p值較小;而對象密度較小的區(qū)域,distk( )p值較大,因此用distk( )p值大小可初步識別離群點。
2.1.2 確定對象p的第k距離鄰域
在樣本空間D中,將與對象k之間的距離小于等于distk( )p的對象集合稱為對象p的k距離鄰域,記作Nk(p)。該鄰域是以p為中心,distk( )p為半徑的區(qū)域內(nèi)所有對象的集合(不包括p本身)。由于可能同時存在多個第k距離的數(shù)據(jù),因此該集合至少包括k個對象。
2.1.3 計算對象p相對于對象o的可達(dá)距離
如果對象p遠(yuǎn)離對象o,則兩者之間的可達(dá)距離就是它們之間的實際距離,如果它們足夠近,則實際距離用o的k距離代替。
2.1.4 計算局部可達(dá)密度
對象p的局部可達(dá)密度定義為p的k最近鄰點的平均可達(dá)密度的倒數(shù)。
2.1.5 計算局部離群點因子
式中:Nk(p)是對象p的k距離鄰域;lrdk(o)是對象o的局部可達(dá)密度;lrdk(p)是對象p的局部可達(dá)密度。
如果對象p不是局部離群點,則LOF(p)接近于1,即p是局部離群點的程度較小,對象o的局部可達(dá)密度和對象p的局部可達(dá)密度相似,最后所得的LOF(p)值接近于1;反之,p是局部離群點的程度越大,LOF(p)值越高。
數(shù)據(jù)處理主要是對原始數(shù)據(jù)的清洗,包括數(shù)據(jù)的完整性、有效性、可代表性等處理過程,使數(shù)據(jù)包含的信息能更準(zhǔn)確、更有效地反映真實情況。
2.2.1 完整性處理
對于提取的原始數(shù)據(jù),篩選出所需相關(guān)字段,按日期進行重新組合,形成完整的數(shù)據(jù)表。
2.2.2 有效性處理
對于數(shù)據(jù)表中的空值數(shù)據(jù)和錯誤數(shù)據(jù),根據(jù)實際情況選擇刪除該異常值所在記錄或?qū)ζ溥M行平滑處理,保證數(shù)據(jù)的有效性。
2.2.3 歸一化處理
各臺區(qū)日線損數(shù)據(jù)間存在數(shù)量級差別大的問題,在數(shù)據(jù)分析之前,對其進行歸一化處理,避免“大數(shù)據(jù)吞沒小數(shù)據(jù)”的情況,造成最終分析結(jié)果的偏差。本文采用Z-score 標(biāo)準(zhǔn)化方法對數(shù)據(jù)進行處理,表達(dá)式為
式中:xˉ為樣本數(shù)據(jù)的均值,S為樣本數(shù)據(jù)的標(biāo)準(zhǔn)差。
通過離群點檢測算法建立基于氣象因素的臺區(qū)線損異常智能識別模型,判斷日線損易受異常天氣影響的臺區(qū),并評估影響程度的大小。具體模型運行步驟如下:
1)對臺區(qū)日線損數(shù)據(jù)進行完整性、有效性和歸一化處理,同時將氣象數(shù)據(jù)按異常天氣和正常天氣兩種情況進行判別分類。
2)將處理后的日線損數(shù)據(jù)作為樣本數(shù)據(jù)構(gòu)建樣本空間D,依次計算D中所有樣本數(shù)據(jù)x的k距離、k距離鄰域Nk(x)、可達(dá)距離reachdist(x)、可達(dá)密度lrdk( )x,最終計算出離群點因子LOFk(x)。
3)對LOF 進行判斷,當(dāng)LOF 接近于1 時,則日線損正常;當(dāng)LOF遠(yuǎn)大于1時,則日線損屬于波動較為明顯的異常值。
4)將LOF遠(yuǎn)大于1的線損數(shù)據(jù)與已分類的氣象數(shù)據(jù)根據(jù)日期進行匹配,并按當(dāng)天是異常天氣的日線損異常點,當(dāng)天是異常天氣前后一天的日線損異常點,其他天氣的線損異常點三種情況進行分類統(tǒng)計。
5)篩選當(dāng)天是異常天氣的日線損異常點和當(dāng)天是異常天氣前后一天的日線損異常點兩種統(tǒng)計類型,根據(jù)業(yè)務(wù)實際情況,判斷線損受異常天氣影響程度z的大小。然后篩選出樣本空間D中異常點占比大于z的情況,即篩選的結(jié)果是樣本空間中容易受異常天氣影響的臺區(qū)。
6)將易受異常天氣影響的臺區(qū)建立新臺賬,根據(jù)氣象預(yù)報數(shù)據(jù),定期對這些臺區(qū)線損波動異常情況進行預(yù)警,為臺區(qū)巡視檢查及線損治理提供依據(jù)。如圖1所示。
圖1 臺區(qū)線損異常識別與預(yù)警模型運行步驟
對于線損波動的分析,當(dāng)時間跨度過長時,不易排除技術(shù)因素和管理因素的影響,而在一段時間內(nèi),比如一個季度,當(dāng)氣象因素差異不大,例如都是晴天時,線損波動不明顯,則可忽略技術(shù)因素和管理因素對臺區(qū)線損異常波動的影響。因此,可利用上述模型對偏遠(yuǎn)山區(qū)某段時間內(nèi)頻發(fā)的異常氣象因素導(dǎo)致線損波動的臺區(qū)進行識別,并根據(jù)實際情況判斷影響程度的大小。將上述臺區(qū)線損異常識別與預(yù)警模型運行步驟利用Python 工具編寫成相應(yīng)的代碼,實現(xiàn)快速高效智能識別易受異常天氣影響的臺區(qū),并形成相應(yīng)的臺賬,根據(jù)當(dāng)?shù)仡l發(fā)的異常天氣情況,建立相應(yīng)的預(yù)警機制。
某縣供電公司共管轄532 個臺區(qū),對其根據(jù)實際情況進行預(yù)處理后,有效臺區(qū)520 個。其所屬縣地處偏遠(yuǎn)山區(qū),氣候多變,晴雨不定。二季度的天氣中,溫度波動不大,較為穩(wěn)定,因此按天氣情況進行分類,多云天氣33 天、雨天28 天、晴天26 天、陰天2 天、揚沙1 天、陰轉(zhuǎn)晴1 天,如圖2所示。其中異常天氣中的雨天包含了小雨、中雨及雷陣雨三種情況,且占比較大。
圖2 某縣二季度天氣情況
某縣將偏遠(yuǎn)地區(qū)臺區(qū)線損率大于10%的值定義為高損,但是因為技術(shù)和管理方面的因素,存在連續(xù)時間段日線損均大于10%的臺區(qū),因此本文利用基于距離和密度的離群點檢測算法識別異常天氣時線損突然升高或降低的臺區(qū),并進行篩選標(biāo)記。
利用基于氣象因素的臺區(qū)線損異常智能識別模型對某縣520 個有效臺區(qū)91 天的日線損數(shù)據(jù)進行識別,并根據(jù)識別結(jié)果與氣象數(shù)據(jù)進行匹配,判斷線損易受異常天氣影響的臺區(qū)。選取離群點檢測結(jié)果中存在LOF 遠(yuǎn)大于1 的某臺區(qū),繪制其91 天日線損數(shù)據(jù)散點圖,如圖3 所示。圓圈內(nèi)的離群點較為明顯,即此臺區(qū)二季度中部分日期日線損確實存在異常值,說明離群點檢測可有效識別海量日線損數(shù)據(jù)中的異常值。
圖3 某臺區(qū)91天日線損離群點
隨機選取某臺區(qū)相近的時間點,對離群點檢測分析結(jié)果與天氣情況進行匹配,結(jié)果如表1所示。
表1 基于離群點檢測算法的某臺區(qū)部分分析結(jié)果
在分析的47 320 個數(shù)據(jù)點中,分析發(fā)現(xiàn)異常點共計17 175 個,與氣象數(shù)據(jù)匹配后總體情況如表2 所示。揚沙引起的日線損均值最高,其次是雨天,第三是雨天前后的陰天或陰轉(zhuǎn)晴。說明在某縣二季度內(nèi),揚沙天氣對臺區(qū)線損影響波動最大,雨天對臺區(qū)線損波動影響次之。
表2 某縣二季度異常天氣日線損波動情況
在某縣二季度的天氣中,揚沙天氣只有一天,占比太小,無法再次進行驗證,且揚沙天氣對某縣臺區(qū)線損整體波動無法形成預(yù)警,因此對某縣異常氣象因素的分析主要以雨天為主進行分析。對28 天雨天對應(yīng)的日線損異常數(shù)據(jù)進行篩選,發(fā)現(xiàn)28 天雨天中,至少有17 天部分臺區(qū)線損率波動明顯,說明在某縣偏遠(yuǎn)山區(qū),雨天對部分臺區(qū)日線損的影響至少有60.72%,且影響超過60.72%的臺區(qū)共計38個,如圖4所示。
圖4 受雨天影響的38個臺區(qū)線損異常次數(shù)
提取某縣7月份天氣情況的數(shù)據(jù),雨天共計9天。根據(jù)上述離群點檢測模型預(yù)測上述38 個臺區(qū)在7 月份雨天發(fā)生日線損異常的數(shù)量,并與實際發(fā)生日線損數(shù)據(jù)進行比對,判斷模型的擬合程度和效果,如圖5 所示。雖然預(yù)測值與實際值由于不同時間段負(fù)荷波動存在一定的誤差,但是在可信度范圍內(nèi),具有一定的實際意義。
圖5 某縣臺區(qū)日線損異常值預(yù)測數(shù)量與實際數(shù)量
上述模型驗證,說明基于距離和密度的離群點檢測算法適用于基于氣象因素的臺區(qū)日線損異常判斷。因此,在氣候多變的山區(qū),利用離群點檢測算法智能識別日線損異常值,并與當(dāng)?shù)啬扯螘r間內(nèi)頻發(fā)的異常天氣情況進行匹配,當(dāng)異常天氣對應(yīng)的線損異常超過60%(根據(jù)實際情況確定z值),且正常天氣線損率波動不大時,將此類臺區(qū)定義為易受異常天氣影響的臺區(qū),然后根據(jù)時間段內(nèi)的天氣預(yù)報,在異常天氣前夕,重點關(guān)注此類臺區(qū),做到及時巡視檢修,可有效減少因為當(dāng)?shù)靥厥鈵毫犹鞖庠斐傻碾娏繐p失,保障電網(wǎng)安全。
利用離群點檢測算法構(gòu)建臺區(qū)線損異常分析模型,實現(xiàn)考慮氣象因素條件下的臺區(qū)線損異常智能識別。通過對某縣臺區(qū)日線損數(shù)據(jù)的分析,有效識別臺區(qū)線損容易受當(dāng)?shù)仡l發(fā)雨天影響的臺區(qū),并評估影響程度的大小。結(jié)果表明,針對氣候多變的偏遠(yuǎn)山區(qū),將當(dāng)?shù)仡l發(fā)的異常氣象因素納入臺區(qū)線損指標(biāo)的風(fēng)險防控機制,并建立氣象因素對日線損的預(yù)警機制,可為開展臺區(qū)線損治理提供依據(jù),有效提升線損的精益化管理水平,達(dá)到節(jié)能降損的目的。隨著數(shù)據(jù)采集終端的升級和數(shù)量的積累,未來該方法可以納入更多對配電網(wǎng)供電質(zhì)量的外在影響因素分析,助力提升配電網(wǎng)供電質(zhì)量。