于建林 張虎林
(甘肅藍(lán)野建設(shè)監(jiān)理有限公司,甘肅 蘭州 743000)
輸電線路的線損由2 個部分構(gòu)成,其一是線路實際電能損耗,其二是計量誤差。線路實際損耗可通過理論計算來確認(rèn),如計算地線損耗、電暈損耗和電阻損耗[1]。計量誤差來自比值誤差、粗大數(shù)據(jù)誤差和相角誤差等。然而,線路實際損耗的影響因素較復(fù)雜,部分損耗難以通過理論方法進(jìn)行計算,例如地形變化、線路老化、導(dǎo)線相序差異以及天氣因素等可造成一定的線損,但相關(guān)數(shù)據(jù)難以統(tǒng)計。理論計算方法能夠較準(zhǔn)確地反映出新投用線路的線損,隨著時間的延長,理論線損與實際線損的偏差會有所增大,根據(jù)現(xiàn)有的研究成果,該偏差可達(dá)5%~10%。因此,應(yīng)該改進(jìn)現(xiàn)有的線損計算方法。
2.1.1 數(shù)據(jù)知識融合
電阻、電暈和地線造成的損耗是線路實際電能損耗的主要來源,因此線損理論計算結(jié)果決定了線損的平均趨勢。非理論影響因素具有一定的隨機(jī)性,導(dǎo)致線損在理論計算平均趨勢的基礎(chǔ)上發(fā)生隨機(jī)波動。數(shù)據(jù)知識融合要求在線損計算中合并理論影響因素和非理論影響因素,利用大數(shù)據(jù)生成隨時間變化的數(shù)據(jù)特征,融合過程如圖1所示。
圖1 數(shù)據(jù)知識融合路徑
2.1.2 BOA-GBDT 線損計算模型
梯度提升樹(Gradient Boosting Decision Tree,GBDT)屬于機(jī)器學(xué)習(xí)方法,由多個決策樹集成而來,用于數(shù)據(jù)分類或者回歸,可將GBDT 作為輸電線路線損計算的建?;A(chǔ)。貝葉斯優(yōu)化算法(Bayesian Optimization Algorithm,BOA)可用于優(yōu)化線損計算模型中的參數(shù)。該文研究融合了BOA 算法和GBDT 算法,構(gòu)建了BOAGBDT 算法模型,將經(jīng)過融合的輸電線路運行數(shù)據(jù)作為BOA-GBDT 模型的輸入?yún)?shù),再經(jīng)過訓(xùn)練、優(yōu)化,形成更精確的線損計算模型,其實施過程如圖2所示。
圖2 BOA-GBDT 模型
2.2.1 數(shù)據(jù)來源
線路桿塔數(shù)據(jù)、氣象數(shù)據(jù)、電能數(shù)據(jù)以及潮流數(shù)據(jù)等構(gòu)成了輸電線路的主要運行數(shù)據(jù),部分?jǐn)?shù)據(jù)與時間存在緊密的聯(lián)系,因此稱為時序數(shù)據(jù),典型的如電能數(shù)據(jù)。將輸電系統(tǒng)的真實運行數(shù)據(jù)作為模型訓(xùn)練的數(shù)據(jù)來源,顯然,不同類型的數(shù)據(jù)在結(jié)構(gòu)上存在差異,需要進(jìn)行預(yù)處理,以便提高模型訓(xùn)練的效率。
2.2.2 數(shù)據(jù)預(yù)處理
2.2.2.1 提取日電量數(shù)據(jù)
電流互感器能夠計量輸電線路中的正反向有功電能,計量維度可精確到每條線路,計數(shù)方式為累計計數(shù),因此不能直接讀取每日的電量,可根據(jù)公式(1)提取日電量數(shù)據(jù)。
式中:Mt-1為電流互感器在第t-1日的累計計量值;Mt為在第t日的累計計量值;Vt為第t日的日電量;β為電流互感器的倍率值記。
2.2.2.2 數(shù)據(jù)顆粒度同化
電流互感器數(shù)據(jù)按日計量,潮流數(shù)據(jù)每分鐘計量一次,氣象數(shù)據(jù)每小時采集一次,由此會造成數(shù)據(jù)的時間粒度不統(tǒng)一,需要對其進(jìn)行時間顆粒度同化。3種數(shù)據(jù)的最大時間粒度為日,因此潮流數(shù)據(jù)和氣象數(shù)據(jù)也要轉(zhuǎn)化為按日采集。潮流數(shù)據(jù)按日采集的方法為求取當(dāng)日所有數(shù)據(jù)的平均值。氣象數(shù)據(jù)涵蓋溫度、氣壓、降水量和風(fēng)力等,其數(shù)據(jù)顆粒度同化的方式有所差異[2]。例如溫度數(shù)據(jù)可取當(dāng)日的極值,在高溫天取最高溫度,在嚴(yán)寒日取最低溫度。再如,風(fēng)力數(shù)據(jù)可取當(dāng)日的平均值。
2.2.2.3 異常線損數(shù)據(jù)清洗
原始數(shù)據(jù)中有可能存在粗大數(shù)值,能夠干擾模型訓(xùn)練的效果,因此需要進(jìn)行數(shù)據(jù)清洗,剔除不合理的數(shù)據(jù)點。判斷粗大誤差時采用拉依達(dá)準(zhǔn)則,其原理為求得線損數(shù)據(jù)的標(biāo)準(zhǔn)差,設(shè)置合理的數(shù)據(jù)偏差范圍(標(biāo)準(zhǔn)差3 倍以內(nèi)),將超過合理范圍的數(shù)據(jù)視作粗大誤差,具體實施過程如下。
假設(shè)線損數(shù)據(jù)為等精度的獨立有限測量序列,將其記為Y,則有Y={y(k)|k=1,2,...,n}。該測量序列的算數(shù)平均值和殘余誤差分別為yavg、gk,標(biāo)準(zhǔn)差σ的計算方法與yavg、gk有關(guān),具體如公式(2)~公式(4)所示。
式中:gk為線損數(shù)據(jù)y(k)的剩余誤差。
如果|gk|>3σ,說明數(shù)據(jù)y(k)超過合理范圍,屬于粗大誤差。
2.2.3 輸電線路線損非理論影響因素特征提取
線損非理論影響因素缺乏理論模型,難以直接計算,因此引入大數(shù)據(jù)方法對其進(jìn)行分析,提取非理論影響因素的數(shù)據(jù)特征是進(jìn)行模型訓(xùn)練的前提[3]。根據(jù)數(shù)據(jù)知識融合的路徑,線損歷史數(shù)據(jù)、輸電線路桿塔數(shù)據(jù)、潮流數(shù)據(jù)以及氣象數(shù)據(jù)具有不同的特征提取方式。
2.2.3.1 提取線損歷史數(shù)據(jù)的EWMA 特征
指數(shù)加權(quán)移動平均值特征(Exponentially Weighted Moving Average,EWMA)能反映中短期時間序列的發(fā)展趨勢,通常而言,近期的歷史數(shù)據(jù)在趨勢預(yù)測中具有更強(qiáng)的參考價值,因此對其設(shè)置更高的權(quán)重。更早的歷史數(shù)據(jù)對未來的預(yù)測效果相對較差,因此降低其權(quán)重,以提高趨勢預(yù)測的準(zhǔn)確性,EWMA 特征提取方法如下。
假設(shè)任一輸電線路的日線損數(shù)據(jù)序列集合為L,其中存在n個序列樣本,lj為集合L中的一個元素,則有j∈[0,n]。將該線路在第i天的線損EWMA 特征記為ei,則ei的計算方法如公式(5)所示。
式中:α為平滑參數(shù)記,并且α∈(0,1];li為線路在第i天的線損數(shù)據(jù);li-1為線路在第i-1 天的線損數(shù)據(jù);en為線路在第n天的EWMA 特征。
參數(shù)α的取值根據(jù)公式(6)進(jìn)行計算。
2.2.3.2 提取時序數(shù)據(jù)的曲線特征
輸電線路相關(guān)的時序數(shù)據(jù)主要包括潮流數(shù)據(jù)和氣象數(shù)據(jù),用于精確描述輸電線路的工況。時序數(shù)據(jù)具體又可細(xì)分為有功功率、無功功率、降雨量、環(huán)境溫度、輸電電壓、輸電電流以及風(fēng)速等。曲線特征包括多種數(shù)據(jù)指標(biāo),其平均值反映時序數(shù)據(jù)的平均趨勢,最大值和最小值描述了時序數(shù)據(jù)的極值,平均差值體現(xiàn)出不同時序數(shù)據(jù)的變化趨勢[4]。將時序數(shù)據(jù)的線損影響量記為V,觀察時窗記為w(7 天為一個觀察時窗),vw i表示時序影響因素在時窗w內(nèi)的第i天所引起的線損時序影響數(shù)據(jù),特征曲線的平均值和平均差值分別記為Vmean、Vmean_diff,則有公式(7)、公式(8)。
式中:vw i-1為時序影響因素在時窗內(nèi)第i-1 天的線損時序影響數(shù)據(jù)。
2.2.3.3 提取輸電線路桿塔特征
桿塔特征屬于線路本體信息,與之類似的信息包括輸電線路的電壓等級、相序和線路的投運時間等,線路特征集中體現(xiàn)于線路本體信息中的固定信息。數(shù)值類信息是每基桿塔的基本信息,不同桿塔的數(shù)值類信息存在一定差異,對線損計算的應(yīng)用價值相對較低。因此將桿塔特征作為線路的本體信息,桿塔特征按照如下方法進(jìn)行提?。?)桿塔的數(shù)值型信息并不統(tǒng)一,如桿塔線路的呼稱高,針對此類信息,將平均值作為桿塔特征的描述方式。2)對桿塔的類別型信息,可利用獨熱編碼進(jìn)行構(gòu)造。將桿塔的某一種類別信息記為K,其狀態(tài)集合為Nk,假設(shè)K為第i條輸電線路的第j個桿塔的類別信息,K當(dāng)前處于l 狀態(tài),此時對K進(jìn)行獨熱編碼,則有Kij=[0,0,...,1,...,0][5]。對線路中每個桿塔的對應(yīng)狀態(tài)進(jìn)行求和,即可獲取該條線路針對類別信息K的桿塔特征,如公式(9)所示。
式中:將輸電線路i上的桿塔數(shù)量記為Ntower。按照以上方法,假設(shè)某條高壓交流輸電線路中設(shè)計有4 個桿塔,高壓線采用三相三線制,則相序存在6 種可能,對4 個桿塔的相序進(jìn)行獨熱編碼,得到的結(jié)果見表1,此時可求得該條線路的相序特征,結(jié)果為[2,2,0,0,0,0]。
表1 線路桿塔相序特征獨熱編碼示例
2.2.3.4 構(gòu)建GBDT 線損計算模型
GBDT 線損計算模型以輸電線路的理論計算線損和非理論影響量的特征為基礎(chǔ),構(gòu)建基于數(shù)據(jù)知識融合的GBDT 模型,根據(jù)梯度提升樹算法的實現(xiàn)原理,線損計算模型的數(shù)學(xué)表達(dá)式如公式(10)所示。
式中:Zi為該集合中的一個元素,i=1,2,...,N;γ為模型損失函數(shù)的參數(shù);f0(Zi)為初始模型;T為模型的迭代次數(shù);Rjt為樹模型中的葉子節(jié)點;J為葉子節(jié)點的總數(shù),則j=1,2,...,J;I為指示函數(shù),I的取值為1 或者0,如果Zi屬于葉子節(jié)點Rjt,則I=1,否則I=0。
2.2.3.5 BOA-GBDT 線損計算模型構(gòu)建方法
采用BOA 算法優(yōu)化上一步建立的GBDT 線損計算模型,以離散隨機(jī)采樣的方式在區(qū)間[1,7]內(nèi)搜索回歸樹的深度,葉子數(shù)量的區(qū)間為[2,128],學(xué)習(xí)率的區(qū)間為[0.001,0.5]。利用BOA 算法實現(xiàn)模型優(yōu)化的步驟為選擇初始參數(shù)組合樣本集、計算樣本損失函數(shù)的高斯過程、新樣本采樣、更新樣本損失函數(shù)的高斯過程、判斷是否達(dá)到迭代次數(shù)直到輸出最優(yōu)樣本[6]。
以國內(nèi)某城市的真實線路運行數(shù)據(jù)為模型訓(xùn)練和效果測試的數(shù)據(jù)源,訓(xùn)練數(shù)據(jù)的采集時間為2023年1月10日至2023年4月19日,共計100 天。從2023年4月20日開始,再連續(xù)采集50 天的運行數(shù)據(jù),用于模型檢驗。
為了檢驗該文所建立模型的效果,為其設(shè)置對照組,組1采用傳統(tǒng)的理論計算方法,組2 采用BOA-GBDT 線損計算模,分別評估2 種線損計算模型的精確度,將其作為性能對比的依據(jù)。精確度的計算方法如公式(11)所示。
式中:Vob為第i個樣本的實際線損;Vpre為模型計算線損;M為樣本總數(shù)量;Ermse為精確度。
相同數(shù)據(jù)下2 種模型的性能指標(biāo)測試結(jié)果見表2,從中可知,BOA-GBDT 線損計算模型精確度更好。
模型中不同影響量權(quán)重分配的合理性是評價其應(yīng)用價值的重要考量因素,不同影響量的權(quán)重的計算如公式(12)所示。
式中:vi為影響量;Imp(vi)為vi對應(yīng)的影響權(quán)重;vi.10·j為vi位于數(shù)據(jù)第10·j個百分位的數(shù)值;lossmean為日均統(tǒng)計殘損值;loss為函數(shù),用于統(tǒng)計線損的理論計算值;mean(x)為影響量x在訓(xùn)練時間內(nèi)的均值。
2 種模型的影響量權(quán)重計算結(jié)果見表3,從中可知,和傳統(tǒng)的理論計算模型相比,基于數(shù)據(jù)知識融合的BOA-GBDT 計算模型增加了環(huán)境溫度、風(fēng)速和線電壓溫度的權(quán)重,而這3 個影響量均為非理論影響量,說明該模型在線損計算中強(qiáng)化了對非理論影響考量,達(dá)到了設(shè)計目標(biāo)。
表2 2 種模型的測試結(jié)果
表3 2 種模型的影響量權(quán)重計算結(jié)果
現(xiàn)有的輸電線路線損計算方法存在一定缺陷,與實際損失偏差較大,主要原因在于未能充分統(tǒng)計各種非理論因素造成的線損。為了解決該問題,可廣泛收集輸電線路的基本數(shù)據(jù),包括氣象數(shù)據(jù)、潮流數(shù)據(jù)、桿塔數(shù)據(jù)以及各種理論線損數(shù)據(jù),實現(xiàn)知識數(shù)據(jù)的廣泛融合。再利用GBDT 算法和BOA 算法建立新的計算模型。經(jīng)過檢驗,基于數(shù)據(jù)知識融合的BOAGBDT 模型能夠達(dá)到預(yù)期效果,其線損計算精度明顯優(yōu)于傳統(tǒng)的理論計算方法。