閆威,李南,沈月秀,施力欣,胡濱,周舟
(國(guó)網(wǎng)浙江省電力有限公司嘉興供電公司,浙江 嘉興 314000)
隨著石油、煤炭等資源的大量消耗,生態(tài)環(huán)境所受到的負(fù)面影響日益嚴(yán)重。在美國(guó),三分之一的溫室氣體排放來(lái)自交通運(yùn)輸[1],為減少溫室氣體排放,大多數(shù)國(guó)家開(kāi)始注意到電動(dòng)汽車這一綠色交通工具。電動(dòng)汽車與電網(wǎng)之間的聯(lián)系也愈加緊密。由于電動(dòng)汽車用戶充電行為的隨機(jī)性以及電動(dòng)汽車充電功率的波動(dòng)性,電動(dòng)汽車充電行為對(duì)電力系統(tǒng)安全穩(wěn)定運(yùn)行提出了重要挑戰(zhàn)[2]。而可靠的電動(dòng)汽車充電負(fù)荷預(yù)測(cè)技術(shù)可以幫助電力系統(tǒng)調(diào)度中心有效應(yīng)對(duì)電動(dòng)汽車隨機(jī)充電所帶來(lái)的影響。因此,研究可靠穩(wěn)定的電動(dòng)汽車充電負(fù)荷預(yù)測(cè)技術(shù)具有重要意義。
另一方面,由于電動(dòng)汽車用戶的習(xí)慣需求不同,電動(dòng)汽車的充電行為也會(huì)出現(xiàn)一定的差異。不同的電動(dòng)汽車充電行為以及駕駛規(guī)律會(huì)對(duì)電動(dòng)汽車日充電負(fù)荷產(chǎn)生很大的影響。因此,對(duì)不同電動(dòng)汽車用戶的不同充電行為進(jìn)行聚類分析,可以建立更有針對(duì)性的電動(dòng)汽車充電模型,便于提取典型用戶。由此可見(jiàn),合理的電動(dòng)汽車用戶聚類分析工作可以提高對(duì)于不同用戶群體的特征分析水平,有利于更好地搭建不同群體的充電負(fù)荷模型。
目前,許多學(xué)者已經(jīng)在電動(dòng)汽車充電負(fù)荷預(yù)測(cè)和電動(dòng)汽車用戶聚類分析領(lǐng)域取得了很大的進(jìn)展。文獻(xiàn)[3]提出了一種基于隨機(jī)森林算法的模型,用于充電站電動(dòng)汽車充電負(fù)荷預(yù)測(cè)。文獻(xiàn)[4]展示了一種考慮用戶后悔心理影響的充電負(fù)荷預(yù)測(cè)方法。文獻(xiàn)[5]提出了一種基于出行起訖點(diǎn)矩陣、考慮時(shí)空分布的電動(dòng)汽車負(fù)荷預(yù)測(cè)方法,由于采用蒙特卡洛法建立負(fù)荷預(yù)測(cè)模型,如參數(shù)選擇不合適,會(huì)出現(xiàn)誤差過(guò)大從而降低預(yù)測(cè)準(zhǔn)確度的情況。文獻(xiàn)[6-7]考慮氣象等多種因素對(duì)于充電負(fù)荷變化的影響。文獻(xiàn)[8-9]采用Bass模型,考慮汽車保有量、季節(jié)特性等因素進(jìn)行電動(dòng)汽車充電負(fù)荷預(yù)測(cè),而B(niǎo)ass 模型通常用于中長(zhǎng)期充電負(fù)荷預(yù)測(cè),在短期、日前預(yù)測(cè)中表現(xiàn)并不突出。近年來(lái),機(jī)器學(xué)習(xí)領(lǐng)域發(fā)展迅速,各種機(jī)器學(xué)習(xí)方法被應(yīng)用到各類功率、流量、負(fù)荷預(yù)測(cè)中。同時(shí),部分學(xué)者使用機(jī)器學(xué)習(xí)方法搭建電動(dòng)汽車負(fù)荷預(yù)測(cè)模型,取得了一定的成果。文獻(xiàn)[10]提出了基于圖WaveNet 的模型,考慮電動(dòng)汽車充電樁節(jié)點(diǎn)信息進(jìn)行電動(dòng)汽車充電負(fù)荷預(yù)測(cè)。文獻(xiàn)[11]搭建LS-SVM(最小二乘支持向量機(jī))、LSTM(長(zhǎng)短期記憶)網(wǎng)絡(luò)進(jìn)行充電負(fù)荷預(yù)測(cè)。文獻(xiàn)[12]中利用譜聚類對(duì)電動(dòng)汽車負(fù)荷曲線進(jìn)行聚類,針對(duì)每一組曲線進(jìn)行對(duì)應(yīng)預(yù)測(cè)。但上述模型在面對(duì)復(fù)雜信息時(shí)難以挖掘分析數(shù)據(jù)之間的深層關(guān)系,并且網(wǎng)絡(luò)中參數(shù)較多,訓(xùn)練網(wǎng)絡(luò)模型時(shí)待優(yōu)化參數(shù)過(guò)多,使得訓(xùn)練時(shí)間過(guò)長(zhǎng)。
目前,GAN(生成對(duì)抗網(wǎng)絡(luò))是機(jī)器學(xué)習(xí)領(lǐng)域新興的的神經(jīng)網(wǎng)絡(luò)算法,GAN可有效捕捉輸入信息之間的深層聯(lián)系,面對(duì)復(fù)雜信息的輸入時(shí),擁有較強(qiáng)的特征分析能力。文獻(xiàn)[13]中使用GAN實(shí)現(xiàn)壓縮采樣馬賽克圖像的顏色恢復(fù)。文獻(xiàn)[14]搭建了用于股票價(jià)格信息預(yù)測(cè)的GAN 模型。文獻(xiàn)[15]提出了一種輕量級(jí)actor-critic 的生成對(duì)抗網(wǎng)絡(luò),將GAN 模型與actor-critic 相連,使得GAN有著更好的動(dòng)態(tài)性能以及在線學(xué)習(xí)能力,提高微電網(wǎng)的魯棒性與適應(yīng)性。
GAN 已經(jīng)在其他領(lǐng)域取得了大量的應(yīng)用成果,但是在電動(dòng)汽車充電負(fù)荷預(yù)測(cè)領(lǐng)域的研究并不深入。因此,考慮到充電負(fù)荷受到用戶群體充電習(xí)慣差異、氣象信息、歷史負(fù)荷等因素的影響,建立了基于CNN-GAN(卷積神經(jīng)網(wǎng)絡(luò)-生成對(duì)抗網(wǎng)絡(luò))的電動(dòng)汽車充電負(fù)荷預(yù)測(cè)模型,通過(guò)對(duì)比多種機(jī)器學(xué)習(xí)算法,驗(yàn)證本文所提出方法的可行性。
GAN是由生成模型G與判別模型D組成的神經(jīng)網(wǎng)絡(luò)模型[16]。其中,生成模型目標(biāo)是分析真實(shí)樣本的深層分布信息,模擬真實(shí)樣本的詳細(xì)分布,制造與真實(shí)樣本極其相似的虛擬樣本;判別模型的目標(biāo)是能夠準(zhǔn)確識(shí)別輸入樣本是虛擬樣本或真實(shí)樣本,并輸出對(duì)應(yīng)結(jié)果。GAN結(jié)構(gòu)如圖1所示。
圖1 GAN結(jié)構(gòu)Fig.1 GAN structure
生成模型和判別模型通過(guò)最大、最小博弈,在更新優(yōu)化過(guò)程中,對(duì)生成模型和判別模型分別進(jìn)行更新,最終達(dá)到納什均衡狀態(tài)。由于當(dāng)輸入數(shù)據(jù)是x或G(z)時(shí),判別模型的最后結(jié)果只能為1或0,所以判別模型基于交叉熵的損失函數(shù)如式(1)所示:
式中:E為期望函數(shù);log為自然對(duì)數(shù)。
生成模型目標(biāo)為生成能過(guò)“騙過(guò)”判別模型的虛擬樣本,因此其損失函數(shù)如式(2)所示:
生成模型與判別模型持續(xù)進(jìn)行最大最小博弈,不斷提高對(duì)應(yīng)的生成能力或判別能力,直到完成更新優(yōu)化練過(guò)程,因此GAN基于交叉熵的損失函數(shù)為:
基于CNN-GAN 的電動(dòng)汽車負(fù)荷預(yù)測(cè)流程如圖2所示,主要包括GMM(高斯混合模型)聚類分析、數(shù)據(jù)集構(gòu)建、GAN更新訓(xùn)練過(guò)程。
至于太陽(yáng)中為何為會(huì)有“雞”呢?自宋代以來(lái),更有不少學(xué)者曾試圖為其尋找可能的說(shuō)解與答案。如在《云笈七籖》卷五十六《諸家氣法》中說(shuō):
圖2 預(yù)測(cè)流程Fig.2 Prediction flow
GMM聚類分析是針對(duì)大量電動(dòng)汽車充電樣本進(jìn)行聚類分析。數(shù)據(jù)集構(gòu)建過(guò)程依據(jù)GMM 聚類分析結(jié)果,針對(duì)每一組進(jìn)行對(duì)應(yīng)數(shù)據(jù)預(yù)處理,選擇多種對(duì)于充電負(fù)荷預(yù)測(cè)影響較大的元素,確定輸入數(shù)據(jù)形式以及訓(xùn)練樣本與測(cè)試樣本個(gè)數(shù)。在GAN更新訓(xùn)練過(guò)程中,由完成數(shù)據(jù)預(yù)處理的訓(xùn)練樣本作為真實(shí)樣本,將一組隨機(jī)高斯噪聲向量作為生成模型初始輸入;生成模型將生成虛擬樣本與真實(shí)樣本共同送入判別模型,判別模型輸出判別結(jié)果,通過(guò)半監(jiān)督回歸得到預(yù)測(cè)值;根據(jù)各模型的損失函數(shù)計(jì)算各層網(wǎng)絡(luò)誤差,反向傳遞誤差,順序更新D與G,最終獲得各參數(shù)最優(yōu)權(quán)重。
完成訓(xùn)練后,使用各組對(duì)應(yīng)GAN預(yù)測(cè)模型進(jìn)行預(yù)測(cè),并與其他方法進(jìn)行對(duì)比。在對(duì)比驗(yàn)證環(huán)節(jié),各對(duì)比方法使用相同的測(cè)試樣本數(shù)據(jù)集,采用百分比偏差λMAPE與均方根誤差λRMSE兩項(xiàng)指標(biāo)評(píng)價(jià)各方法準(zhǔn)確性。
電動(dòng)汽車充電負(fù)荷的時(shí)間分布主要由充電電量、充電速度和充電時(shí)間3個(gè)方面決定。因此,選取上述3種因素作為GMM聚類分析的特征向量。
GMM由多個(gè)高斯分布函數(shù)線性組合[17]。其基本形式如式(4)所示:
式中:u代表三維特征向量;λ代表GMM 模型參數(shù),包括均值、協(xié)方差、權(quán)重;K代表子高斯分布個(gè)數(shù);Ck為第k個(gè)模型概率,?(x|λk)為第k個(gè)子模型高斯分布密度函數(shù)。
通過(guò)EM(期望最大化)算法計(jì)算得到各項(xiàng)參數(shù),該算法分為E和M兩個(gè)步驟。
在E 步驟中依據(jù)當(dāng)前參數(shù)計(jì)算第j個(gè)數(shù)據(jù)uj來(lái)自于模型k的概率rjk,即:
在M 步驟,計(jì)算新一輪迭代參數(shù),包括更新均值、協(xié)方差矩陣和權(quán)重系數(shù),可分別表示為:
式中:N為樣本數(shù)量。重復(fù)E 步驟與M 步驟,直到│λi+1-λi│<ε,結(jié)束迭代。
完成GMM聚類分析后得到3組聚類結(jié)果,根據(jù)不同的用戶標(biāo)簽,分別計(jì)算第一、二、三組的日充電負(fù)荷;重復(fù)計(jì)算得到多周的各組充電負(fù)荷日數(shù)據(jù)。
根據(jù)聚類結(jié)果,構(gòu)建每組數(shù)據(jù)集。多數(shù)用戶的出行存在一些周期性規(guī)律,同時(shí)與氣溫、降雨量等氣象因素密切相關(guān)。因此,為了提取用戶出行規(guī)律與預(yù)測(cè)日充電負(fù)荷的內(nèi)在關(guān)系,選擇氣溫、降雨量、濕度、歷史負(fù)荷等信息作為輸入數(shù)據(jù),如表1所示。
表1 輸入數(shù)據(jù)構(gòu)成Table 1 Input data composition
表中預(yù)測(cè)日日期周一至周五設(shè)置為0.2~0.6,周六、周日為2.2 與2.7,可以更好區(qū)分工作日與非工作日。
傳統(tǒng)的深度學(xué)習(xí)模型由于網(wǎng)絡(luò)架構(gòu)較為復(fù)雜,導(dǎo)致網(wǎng)絡(luò)待訓(xùn)練參數(shù)過(guò)多,出現(xiàn)優(yōu)化時(shí)間較長(zhǎng)甚至網(wǎng)絡(luò)崩潰的問(wèn)題。CNN 擁有較強(qiáng)的特征提取能力,共享卷積核以及權(quán)值共享技術(shù),很大程度上減少了待訓(xùn)練參數(shù)的個(gè)數(shù),因此采用CNN搭建生成模型與判別模型,可以提高GAN模型的特征提取能力以及面對(duì)陌生樣本時(shí)的泛化能力,提高模型訓(xùn)練效率及充電負(fù)荷的預(yù)測(cè)準(zhǔn)確性。
2.3.1 生成模型
生成模型目標(biāo)為學(xué)習(xí)模擬x的深層特征信息,提高自身的模擬能力,使得其生成的虛擬樣本G(z)可以混淆判別模型的識(shí)別,因此使用反卷積層搭建生成模型,便于放大樣本的真實(shí)分布。同時(shí)考慮到二維卷積模型在面對(duì)大量樣本時(shí),抗噪能力優(yōu)于一維卷積模型,因此采用全連接層以及重組層將輸入數(shù)據(jù)轉(zhuǎn)換為二維數(shù)據(jù),然后利用多個(gè)反卷積層以及ReLU(線性整流函數(shù)層)[18]提取深層特征信息,增強(qiáng)虛擬樣本的真實(shí)性,最后通過(guò)全連接層以及tanh 函數(shù)激活轉(zhuǎn)換為虛擬樣本的輸出規(guī)格,獲得虛擬樣本。生成模型的具體結(jié)構(gòu)如圖3所示。
圖3 生成模型結(jié)構(gòu)Fig.3 Structure of the generative model
本文生成模型的目標(biāo)為模擬真實(shí)輸入樣本,生成與真實(shí)樣本相似的虛擬樣本,因此,生成模型的損失函數(shù)如式(9)所示:
式中:f(·)為判別模型中間層對(duì)應(yīng)輸出。生成模型將通過(guò)不斷優(yōu)化減小LG使得虛擬樣本與真實(shí)樣本差別不斷縮小。
2.3.2 判別模型
判別模型同樣采用CNN進(jìn)行搭建,由于判別模型主要進(jìn)行特征提取的工作,方便判別模型識(shí)別x與G(z)之間的差別,增強(qiáng)其對(duì)于輸入樣本的識(shí)別能力,因此在網(wǎng)絡(luò)結(jié)構(gòu)中采用卷積層進(jìn)行搭建,如圖4所示。首先,將輸入的虛擬樣本與真實(shí)樣本通過(guò)全連接層與重組層轉(zhuǎn)換為二維數(shù)據(jù),便于二維CNN計(jì)算;然后通過(guò)多個(gè)卷積層,池化進(jìn)行卷積計(jì)算,提取樣本關(guān)鍵特征信息;最后通過(guò)全連接層輸出判別模型結(jié)果,通過(guò)半監(jiān)督回歸輸出充電負(fù)荷預(yù)測(cè)值。
圖4 判別模型結(jié)構(gòu)Fig.4 Structure of the discriminative model
在判別模型中,輸出分為兩部分,第一部分為傳統(tǒng)判別模型輸出,其損失函數(shù)表示為L(zhǎng)unsup;第二部分為半監(jiān)督回歸輸出,損失函數(shù)表示為L(zhǎng)sup;則總損失函數(shù)LD表示如下:
2.3.3 更新訓(xùn)練
本文GAN 預(yù)測(cè)模型通過(guò)Adam 交替更新訓(xùn)練D與G,其中學(xué)習(xí)率設(shè)定為0.01,迭代次數(shù)設(shè)置為50,訓(xùn)練步驟如下:
1)一組噪聲向量輸入至生成模型,得到一組虛擬樣本。
2)將虛擬樣本及其對(duì)應(yīng)的真實(shí)樣本送入GAN判別模型,利用半監(jiān)督回歸得到充電負(fù)荷預(yù)測(cè)結(jié)果。
3)通過(guò)式(12)與鏈?zhǔn)椒▌t計(jì)算判別模型中各層的誤差,判別模型的參數(shù)將通過(guò)Adam算法進(jìn)行更新。
4)將判別模型的預(yù)測(cè)誤差反向傳回至生成模型,計(jì)算G各層誤差,更新生成模型的各層網(wǎng)絡(luò)參數(shù)。
5)進(jìn)行下一批訓(xùn)練樣本,并重復(fù)步驟1—4,直到所有電動(dòng)汽車充電負(fù)荷訓(xùn)練樣本遍歷一次。
6)當(dāng)完成預(yù)設(shè)的迭代次數(shù)時(shí),可以結(jié)束模型的訓(xùn)練更新。否則,再次重復(fù)步驟1—5,更新訓(xùn)練GAN模型,結(jié)構(gòu)如圖5所示。
圖5 訓(xùn)練結(jié)構(gòu)Fig.5 Training structure
本文采用平均百分比偏差λMAPE與均方根誤差λRMSE兩項(xiàng)評(píng)價(jià)指標(biāo)評(píng)價(jià)各方法預(yù)測(cè)效果,具體形式如下:
式中:與分別為i時(shí)刻充電負(fù)荷預(yù)測(cè)值與真實(shí)值。
為驗(yàn)證本文所提出的CNN-GAN 預(yù)測(cè)模型的可行性,采用華東某地8 周的電動(dòng)汽車充電樣本,將其分為兩部分,其中前6周電動(dòng)汽車樣本作為訓(xùn)練樣本,用于訓(xùn)練CNN-GAN 預(yù)測(cè)模型,后2 周電動(dòng)汽車樣本作為測(cè)試樣本,測(cè)試模型預(yù)測(cè)效果。首先通過(guò)GMM聚類分析,得到3組聚類結(jié)果,構(gòu)建數(shù)據(jù)集。針對(duì)每1組用戶,將對(duì)應(yīng)數(shù)據(jù)集送入各方法預(yù)測(cè)模型,各方法預(yù)測(cè)模型所輸入的訓(xùn)練樣本集與測(cè)試樣本集完全相同。其中,負(fù)荷數(shù)據(jù)的時(shí)間步長(zhǎng)為15 min,即每日可分為96 個(gè)時(shí)刻,采用本文所提出的預(yù)測(cè)方法與ANN(人工神經(jīng)網(wǎng)絡(luò))、SVM(支持向量機(jī))和ELM(極限學(xué)習(xí)機(jī))3種預(yù)測(cè)方法進(jìn)行對(duì)比,各組預(yù)測(cè)結(jié)果如圖6—8所示。
圖6 第一組預(yù)測(cè)結(jié)果Fig.6 The first set of prediction results
圖7 第二組預(yù)測(cè)結(jié)果Fig.7 The second set of prediction results
圖8 第三組預(yù)測(cè)結(jié)果Fig.8 The third set of prediction results
由圖6—8 可以看出,第一組與第三組用戶充電時(shí)間主要集中在白天,夜間存在少部分用戶,其中,第一組用戶充電負(fù)荷峰值出現(xiàn)在12:00 左右,充電負(fù)荷峰值較大,同時(shí),該組用戶快充比例較大,充電時(shí)間較短并且主要集中于午間;第三組用戶充電負(fù)荷峰值出現(xiàn)在2:00 左右,相比第一組用戶,該組慢充用戶比例略有上升,充電時(shí)間主要集中于下午,夜間存在部分用戶;第二組用戶充電負(fù)荷變化趨勢(shì)與其他兩組相反,在白天出現(xiàn)低谷,該組用戶更傾向于長(zhǎng)時(shí)間慢充,充電時(shí)間多集中于夜間。在預(yù)測(cè)效果方面,由圖6可以看到,第一組黑色區(qū)域中,ELM方法出現(xiàn)了較為明顯的偏差,同時(shí)ANN 方法相比SVM 與CNNGAN方法也存在較大的偏差。在第二組預(yù)測(cè)效果方面,圖7 中黑圈范圍內(nèi)ANN 方法存在較大的預(yù)測(cè)波動(dòng),SVM方法預(yù)測(cè)波動(dòng)較為頻繁,而本文所提出的CNN-GAN 方法與實(shí)際充電負(fù)荷曲線較為貼近,實(shí)際負(fù)荷偏差較小。在第三組中,由于樣本數(shù)量較少,導(dǎo)致各方法預(yù)測(cè)精度出現(xiàn)一定的下降,但CNN-GAN 方法相比其他方法與真實(shí)曲線更為貼近。
表2為各項(xiàng)指標(biāo)的對(duì)比,可以發(fā)現(xiàn),本文所提出方法的λMAPE、λRMSE明顯優(yōu)于其他預(yù)測(cè)方法。各組用戶群體預(yù)測(cè)中CNN-GAN模型的λMAPE分別為3.69%、3.41%、4.34%,對(duì)比ELM 方法的λMAPE最大提升7.7%,λRMSE也低于其他3 種預(yù)測(cè)方法,由此可見(jiàn),CNN-GAN 預(yù)測(cè)方法的精度高于其他方法。
本文考慮電動(dòng)汽車用戶的充電習(xí)慣對(duì)于充電負(fù)荷的影響,采用GMM 對(duì)電動(dòng)汽車充電樣本進(jìn)行聚類分析,分析不同電動(dòng)汽車用戶群體之間的充電行為差異區(qū)別,提取典型用戶行為特征;針對(duì)各組用戶群體建立基于CNN-GAN 與半監(jiān)督回歸的模型進(jìn)行電動(dòng)汽車充電負(fù)荷預(yù)測(cè),該模型以天氣因素及歷史負(fù)荷數(shù)據(jù)為輸入,經(jīng)過(guò)生成模型與判別模型的對(duì)抗訓(xùn)練,最終通過(guò)半監(jiān)督回歸輸出預(yù)測(cè)結(jié)果,提高了預(yù)測(cè)準(zhǔn)確率。在結(jié)果分析中,本文對(duì)比了多種方法在各組用戶群體充電負(fù)荷預(yù)測(cè)的結(jié)果,證明了本文提出的方法在預(yù)測(cè)精度上的優(yōu)勢(shì)。電動(dòng)汽車負(fù)荷影響因素較多,本文用戶數(shù)據(jù)樣本僅考慮了充電電量,充電速度以及充電時(shí)間3個(gè)主要因素的影響,后續(xù)工作將針對(duì)用戶不同的駕駛需求進(jìn)行分析研究。