毛為真 李永攀 陸軼祺 解大
1.深圳供電局有限公司 2.上海交通大學(xué)電子信息與電氣工程學(xué)院
伴隨著電動汽車的迅猛發(fā)展,其帶來的問題也逐漸浮現(xiàn),尤其是對電網(wǎng)帶來的影響已引起電力工作者的關(guān)注。大規(guī)模的電動汽車接入充放電對電網(wǎng)的負(fù)荷平衡、容量規(guī)劃以及電能質(zhì)量等均會產(chǎn)生影響[1]。
不斷增加的充電負(fù)荷正在影響著配電網(wǎng)的穩(wěn)定性及可靠性。對此,很多研究在了解充電負(fù)荷變化的前提下,通過調(diào)控技術(shù)、市場機(jī)制以及基礎(chǔ)設(shè)施的聯(lián)合工作,提出了很多協(xié)調(diào)充電需求與電網(wǎng)實際情況,實現(xiàn)削峰填谷、調(diào)頻、備用等有益功能的方案[2]。通過對充電負(fù)荷的預(yù)測或跟蹤制定分時電價,從而依靠需求側(cè)響應(yīng)來利用充電負(fù)荷平抑電網(wǎng)原本的峰谷負(fù)荷[3,4]。根據(jù)實時負(fù)荷分布宏觀調(diào)控電動汽車充電負(fù)荷的分布,從而使配電網(wǎng)的網(wǎng)損最小化[5]。不難看出,為了完成電動汽車對電網(wǎng)的平緩接入,充電負(fù)荷的預(yù)測是首要解決的課題。
在此方面,有不少學(xué)者已進(jìn)行了充分的研究。在研究初期,充電負(fù)荷預(yù)測多集中于對于電動汽車用戶行為的模擬,具體有結(jié)合不同類型汽車、不同停放目的地的停車特性的時空分布預(yù)測方法,能夠預(yù)測電動汽車充電負(fù)荷的時空分布特性[6];根據(jù)電動汽車行駛出行鏈的充電負(fù)荷預(yù)測方法,主要分析充電負(fù)荷的季節(jié)性、假日性等特征[7];通過基于位置的充電行為表征可以一定程度上預(yù)測特定區(qū)域內(nèi)的充電負(fù)荷[8]。此類方法雖能完成部分的充電負(fù)荷預(yù)測功能,但卻很少涉及具體充電站的實時負(fù)荷變化情況,也無法確定是否可以應(yīng)用于電動汽車大量普及后改變的充電系統(tǒng)中。
隨著電動汽車的逐漸普及,充電站逐漸增多,充電數(shù)據(jù)不斷累積,以及機(jī)器學(xué)習(xí)的快速發(fā)展,在充電負(fù)荷預(yù)測方面的研究方向漸漸轉(zhuǎn)向大數(shù)據(jù)方面[9]。通過支持向量機(jī)按照人工提取的數(shù)據(jù)特征,便能初步實現(xiàn)單日充電負(fù)荷波動情況的預(yù)測。
與之不同,本文使用的隨機(jī)森林算法曾被應(yīng)用于電力用戶側(cè)負(fù)荷預(yù)測,通過隨機(jī)森林實現(xiàn)的并行化數(shù)據(jù)處理模式擁有高效的特點[10]。然而由于實際充電站類型及分布很不規(guī)律,充電預(yù)測較難涉及全面。涉及隨機(jī)森林算法在充電負(fù)荷預(yù)測上的應(yīng)用以及具體效果分析的文獻(xiàn)還很少。由于隨機(jī)森林算法在缺失數(shù)據(jù)的數(shù)據(jù)集以及不平衡的數(shù)據(jù)集中仍能維持準(zhǔn)確度,不容易過擬合的特性,很適合用于充電負(fù)荷的短期預(yù)測。
本文的創(chuàng)新點:(1)提出了提高預(yù)測算法準(zhǔn)確度所需要的所有特征參數(shù);(2)應(yīng)用隨機(jī)森林算法實現(xiàn)了對充電負(fù)荷的短期準(zhǔn)確預(yù)測。
隨機(jī)森林是一種集成學(xué)習(xí)方法,它將多個弱學(xué)習(xí)器決策樹集成,消除特征數(shù)據(jù)間的關(guān)聯(lián)性,構(gòu)成強(qiáng)學(xué)習(xí)器隨機(jī)森林。同時,該算法也因為此集成的方式可以并行化運行。
隨機(jī)森林通過隨機(jī)地選擇樣本和特征,降低了決策樹之間的相關(guān)性。首先,隨機(jī)在原始訓(xùn)練數(shù)據(jù)中有放回地選取等量的數(shù)據(jù)作為訓(xùn)練樣本,其次,在建立決策樹時,隨機(jī)地選取一部分特征建立決策樹。這兩種隨機(jī)使各個決策樹之間的相關(guān)性小,從而減少了決策樹本身發(fā)生過擬合時可能帶來的誤差,進(jìn)一步提高模型的準(zhǔn)確性。
本文所用算法為CART(Classification And Regression Tree)算法,即分類與回歸樹,因為CART算法在有缺失數(shù)據(jù)或變量較多的數(shù)據(jù)集中表現(xiàn)相比其它算法(ID3、C4.5等)更加穩(wěn)健。
(1)在一個節(jié)點Node上載入數(shù)據(jù)集D;
(3)若D已經(jīng)沒有可選特征,則將此時D中樣本個數(shù)最多的類別作為該Node的類別;
循環(huán)以上7個步驟,生成一顆滿足具體設(shè)定目標(biāo)的決策樹。
回歸樹的生成與分類樹的差別是節(jié)點劃分標(biāo)準(zhǔn)以及輸出選擇的不同。其劃分標(biāo)準(zhǔn)為最小二乘法。對于某一特征,掃描其可能的取值,作為二分標(biāo)準(zhǔn),將劃分為和兩部分,分別在輸出y中找到取值和,直至得到滿足式(5)最小值的二分點,即為對特征的劃分結(jié)果。
決策樹生成完成之后,輸入需要進(jìn)行處理的樣本特征值,便能得到相應(yīng)的輸出。
直觀理解隨機(jī)森林,可以將其視為對原始總體數(shù)據(jù)樣本的每一個隨機(jī)抽樣樣本數(shù)據(jù)集生成決策樹,并按投票或取平均的策略對眾多決策樹輸出的結(jié)果進(jìn)行統(tǒng)合,作為最終輸出結(jié)果。
對城市綠地系統(tǒng)進(jìn)行科學(xué)管理。城市綠化是城市現(xiàn)代化的重要基礎(chǔ)設(shè)施之一,應(yīng)確立生態(tài)環(huán)境在城市規(guī)劃及管理中的首要地位,只有改變城市規(guī)劃及管理理念,把綠地系統(tǒng)規(guī)劃納入城市總體規(guī)劃之中,才能使生態(tài)綠地系統(tǒng)規(guī)劃變被動為主動,使城市綠地布局趨于合理。
這種隨機(jī)抽樣的方法并對結(jié)果進(jìn)行統(tǒng)合輸出的方法被稱為套袋法(Bagging),其具體算法過程如下:
(1)使用Bootstrap的方法,即可重復(fù)地從原始樣本集中隨機(jī)抽取n個訓(xùn)練樣本;
(2)有放回地共進(jìn)行k輪抽取,得到k個訓(xùn)練集;
(3)對于k個訓(xùn)練集,分別訓(xùn)練k個決策樹模型;
(4)對于充電負(fù)荷預(yù)測這一類問題:由每個模型預(yù)測結(jié)果的均值作為最后預(yù)測結(jié)果。隨機(jī)森林算法示意圖見圖1。
圖1隨機(jī)森林算法示意圖
圖1 可以直觀地理解隨機(jī)森林算法。注意到不同充電站不同時間的日充電量有著離散的特性,即其充電量大小非常分散,因此考慮首先對原始的充電數(shù)據(jù)進(jìn)行階梯劃分,即根據(jù)具體充電量數(shù)據(jù)的取值范圍劃定區(qū)間,從而在消除小干擾的同時將提升隨機(jī)森林充電負(fù)荷預(yù)測算法的有效性和準(zhǔn)確度。區(qū)間的劃分原則有以下兩種:
(1)每一區(qū)間內(nèi)數(shù)據(jù)量相同,可以保證劃分后的每一級階梯在歷史數(shù)據(jù)上占據(jù)相同的比例;
(2)區(qū)間長度相同,一般分的區(qū)間較多,需要大量數(shù)據(jù)支撐。
對預(yù)處理后的數(shù)據(jù)樣本進(jìn)行Bagging處理后分為k個數(shù)據(jù)袋。對每一個數(shù)據(jù)袋,分別進(jìn)行回歸決策樹的構(gòu)建:從起始節(jié)點(根節(jié)點)開始,通過Cart算法,對回歸類型的以最小化基尼系數(shù)(也即不確定性)為目標(biāo),不斷二分節(jié)點直至達(dá)到劃分目標(biāo)或是設(shè)置的最大深度為止。
最終不再二分的節(jié)點被稱為葉節(jié)點,每一個葉節(jié)點被分配一個輸出值,此值的設(shè)定與分類決策樹算法不同,使用這個葉節(jié)點所包含的樣本數(shù)據(jù)在階梯化前的平均值作為葉結(jié)點的輸出。從根節(jié)點開始,(包括根節(jié)點)到達(dá)任意一個葉節(jié)點需要經(jīng)過的劃分次數(shù)被稱為樹的深度。圖1中的樹深度為3。將此劃分過程應(yīng)用于每一個數(shù)據(jù)袋中,便實現(xiàn)了隨機(jī)森林模型的學(xué)習(xí)過程。
在進(jìn)行預(yù)測時,將需要預(yù)測的數(shù)據(jù)特征輸入模型,每一棵決策樹將生成獨立的預(yù)測結(jié)果,而整個隨機(jī)森林將以其中包含的所有決策樹的結(jié)果平均值作為最終的預(yù)測結(jié)果。
對于單個充電站的充電負(fù)荷預(yù)測,針對充電站負(fù)荷預(yù)測的實際需求,使用1.2節(jié)中應(yīng)用回歸樹生成方法的隨機(jī)森林對充電負(fù)荷進(jìn)行預(yù)測。設(shè)計相應(yīng)模型的特征屬性,輸入輸出數(shù)據(jù)信息如表1所示。其中特征屬性包括以下幾類:
(1)日期指標(biāo):溫度、濕度等氣候條件對于電動汽車行為的影響其實很難做出一個精確的判斷,因此直接將該類屬性融合于日期中,在大數(shù)據(jù)下可最小化氣候條件帶來的影響;
(2)15分鐘數(shù):用數(shù)值表示重要程度,該指標(biāo)可以精確至15分鐘時間段內(nèi);
(3)當(dāng)日重要活動指標(biāo):可以用數(shù)值表示重要程度,該指標(biāo)可以精確至15分鐘時間段內(nèi)。重要的活動可能使區(qū)域充電負(fù)荷激增;
(4)區(qū)域繁華指標(biāo):繁華指數(shù)中的基礎(chǔ)設(shè)施指數(shù),該指數(shù)將隨建筑物及道路的改建而波動。這是影響電動汽車用戶充電習(xí)慣的重要指標(biāo);
(5)已充電量:當(dāng)日現(xiàn)在的15分鐘時間段前,已經(jīng)給出的電量,很多電動汽車用戶的充電區(qū)域以及一段時間內(nèi)的充電量相對固定,因此記錄每日充電站已累積的充電負(fù)荷量也將對當(dāng)日的剩余負(fù)荷預(yù)測產(chǎn)生影響。
表1 隨機(jī)森林算法輸入輸出數(shù)據(jù)信息表
整個預(yù)測過程的流程圖如圖2所示。處理好原始數(shù)據(jù)之后,通過Bagging算法獲取k個樣本集,在經(jīng)由1.2節(jié)中的算法生成k個決策樹便構(gòu)成了隨機(jī)森林。借由此森林便能通過預(yù)測時間段內(nèi)的特征輸入輸出預(yù)測的充電負(fù)荷情況。
2.3.1 誤差分析
對于預(yù)測的結(jié)果,采用平均絕對誤差百分比(Mean Absolute Percentage Error,MAPE)和均方根誤差(Root Mean Square Error,RMSE)進(jìn)行評估,誤差計算式分別參照式(7)和(8)所示。
其中,PN(i)和( =1,2,3,…,n)分別為第 個數(shù)據(jù)點的實際測量值和預(yù)測值,n表示用于驗證的數(shù)據(jù)的長度。
圖2 充電預(yù)測算法流程圖
對輸入特征的重要性進(jìn)行評估,驗證特征輸入的實際有效性。對每一棵回歸決策樹來說,某一特征在某一節(jié)點的重要性指該節(jié)點分支前后基尼系數(shù)的該變量,其定義式可以表示為式(9)。
其中的n和p分別代表節(jié)點m生成的兩個子節(jié)點。任意一顆決策樹i的特征重要性可以通過對求和得到:
對深圳市2016年至2018年的大量不同規(guī)模的充電站點不同時間充電負(fù)荷數(shù)據(jù)進(jìn)行分析,并針對單個充電站以及不同充電站進(jìn)行了充電負(fù)荷預(yù)測仿真,以此對電動汽車負(fù)荷目前的情況以及隨機(jī)森林算法的應(yīng)用效果進(jìn)行分析。
深圳市下轄羅湖區(qū)、福田區(qū)、龍崗區(qū)等10個區(qū),各區(qū)占地面積以及充電站分布如圖3所示。充電站在南山區(qū)、福田區(qū)、羅湖區(qū)分布最密集,寶安區(qū)與龍崗區(qū)則是充電站數(shù)量最多的兩個區(qū)。南山、福田、龍崗、寶安分別是深圳經(jīng)濟(jì)最為發(fā)達(dá)的地區(qū),很明顯充電站分布與各區(qū)經(jīng)濟(jì)實力有關(guān)。如今,市內(nèi)新能源汽車總量已超過8萬輛。依據(jù)《深圳市2017年新能源汽車推廣應(yīng)用財政支持政策》,政府工作重心轉(zhuǎn)向電動汽車配套設(shè)施的建設(shè)。這也預(yù)示著電動汽車這一新負(fù)荷的分析和調(diào)控研究工作,已經(jīng)進(jìn)入政府工作的計劃中。
圖3 深圳市轄區(qū)充電設(shè)施分布
為驗證前文所提到的隨機(jī)森林電動汽車充電負(fù)荷預(yù)測方法的有效性,選取了深圳市南山區(qū)的一個容量524kW的充電站兩年內(nèi)的負(fù)荷數(shù)據(jù)作為算例進(jìn)行仿真驗證。訓(xùn)練樣本的特征屬性選擇如表1中的年、月、日、15分鐘數(shù)、雙休日標(biāo)志、節(jié)假日標(biāo)志、活動指標(biāo)以及已充電量。
3.2.1 15分鐘時間間隔充電數(shù)據(jù)訓(xùn)練
將日負(fù)荷數(shù)據(jù)改為每15min充電站的負(fù)荷,并添加表1中的15分鐘數(shù)樣本特征,將輸出改為每15分鐘一個充電量,其余控制不改變,由此訓(xùn)練得出的隨機(jī)森林模型在10%測試樣本下的預(yù)測曲線與實際曲線對比如圖4所示。預(yù)測結(jié)果:為10.27%,值為5.02。
對模型的訓(xùn)練便已完成,僅從訓(xùn)練集中的預(yù)測效果看,模型可以實現(xiàn)單一充電站充電預(yù)測10%以內(nèi)的平均絕對誤差。
圖4 充電站充電負(fù)荷預(yù)測訓(xùn)練曲線圖
訓(xùn)練完隨機(jī)森林的模型后,便能通過該模型以及2018年6月份新采集到的充電站負(fù)荷數(shù)據(jù)實現(xiàn)其預(yù)測的功能,實際處理時將預(yù)測的日負(fù)荷和日充電次數(shù)也納入了輸入特征。對于6月14日至6月26日內(nèi)的充電數(shù)據(jù)隨機(jī)抽取10項進(jìn)行充電預(yù)測,結(jié)果如表2所示。
表2 單一充電站15min充電預(yù)測數(shù)據(jù)表
由于已充電量數(shù)據(jù)這項特征輸入只有在前一個時間段已經(jīng)過去后才能獲取,因此使用本算法進(jìn)行充電預(yù)測時,僅實時預(yù)測未來15min的充電負(fù)荷。由此可見,預(yù)測值與實際值很接近,總體為9.76%,為2.27,預(yù)測效果符合預(yù)期成效。當(dāng)然,可以使用充電量的預(yù)測值作為已充電量部分繼續(xù)循環(huán)進(jìn)行未來更多時間段的充電負(fù)荷,然而累計誤差將會逐漸變得無法忽略。
本文提出了基于隨機(jī)森林算法的電動汽車充電負(fù)荷預(yù)測分析方法,并通過深圳市的實際充電數(shù)據(jù)及應(yīng)用場景進(jìn)行仿真,得出以下結(jié)論:
(1)目前電動汽車行業(yè)仍處在發(fā)展階段,充電負(fù)荷具有小量分散的特性。而經(jīng)過大量的充電數(shù)據(jù)分析,可以觀察出電動汽車的充電負(fù)荷還具有時間以及空間分布特性。在現(xiàn)有數(shù)據(jù)的基礎(chǔ)上選擇了有最大區(qū)分度的數(shù)據(jù)特征為隨機(jī)森林在充電預(yù)測中的應(yīng)用提供了基礎(chǔ)。
(2)提出的單一充電站充電預(yù)測算法在實際記錄的數(shù)據(jù)基礎(chǔ)上,能有效跟蹤該充電站每15min的預(yù)計充電量,根據(jù)仿真結(jié)果,預(yù)測可以達(dá)到9.76%,為2.27??梢宰鳛槌潆婎A(yù)測手段為各種電動汽車充電負(fù)荷控制策略提供參考依據(jù)。