楊朝赟, 夏圣峰,江南,黃毅標(biāo),李渴,張逸
(1.國(guó)網(wǎng)福建省電力有限公司福州供電公司,福州市 350009;2.福州大學(xué)電氣工程與自動(dòng)化學(xué)院,福州市 350108)
分布式電源、電力電子負(fù)荷和各種新型負(fù)荷大量接入配電網(wǎng),使得配電臺(tái)區(qū)源荷的非線性和隨機(jī)性程度日漸加劇,各種電能質(zhì)量問(wèn)題越發(fā)顯著[1-2]。電壓指標(biāo)對(duì)電能質(zhì)量技術(shù)研究、生產(chǎn)管理而言具有重要意義。準(zhǔn)確預(yù)測(cè)和分析電壓偏差、電壓總諧波畸變率等穩(wěn)態(tài)電壓質(zhì)量監(jiān)測(cè)數(shù)據(jù)的變化趨勢(shì)[3],提早發(fā)現(xiàn)指標(biāo)異?;虺瑯?biāo)問(wèn)題,對(duì)于優(yōu)化電網(wǎng)運(yùn)行方式、實(shí)施精確治理、提高配電臺(tái)區(qū)電能質(zhì)量水平尤為關(guān)鍵[4-5]。
近年來(lái),穩(wěn)態(tài)電能質(zhì)量指標(biāo)的預(yù)測(cè)分析研究受到廣泛關(guān)注[6-7]。基于穩(wěn)態(tài)電能質(zhì)量監(jiān)測(cè)數(shù)據(jù)本身的規(guī)律,現(xiàn)有文獻(xiàn)分別從不同時(shí)間尺度對(duì)其進(jìn)行了預(yù)測(cè)研究。文獻(xiàn)[8-9]均建立了基于灰色預(yù)測(cè)模型、線性回歸模型和隨機(jī)時(shí)間序列模型的優(yōu)選組合預(yù)測(cè)模型,但局限于月穩(wěn)態(tài)指標(biāo)的預(yù)測(cè),時(shí)間尺度大;文獻(xiàn)[4]從日指標(biāo)時(shí)間序列入手,實(shí)現(xiàn)未來(lái)15天的指標(biāo)預(yù)測(cè);文獻(xiàn)[10]基于長(zhǎng)短時(shí)記憶(long short-term memory,LSTM)網(wǎng)絡(luò)進(jìn)行了諧波監(jiān)測(cè)數(shù)據(jù)預(yù)測(cè),涉及10 min、1 min和10 s這3種時(shí)間尺度的電壓總諧波畸變率和各次諧波電壓含有率等監(jiān)測(cè)值,能夠預(yù)測(cè)到秒級(jí)、分鐘級(jí)的指標(biāo)數(shù)據(jù),但只能得到未來(lái)1天內(nèi)的預(yù)測(cè)結(jié)果。上述文獻(xiàn)并未考慮穩(wěn)態(tài)指標(biāo)與外部信息的相關(guān)性。文獻(xiàn)[11]利用離網(wǎng)系統(tǒng)中穩(wěn)態(tài)指標(biāo)與溫度、電池狀態(tài)的關(guān)聯(lián)性進(jìn)行預(yù)測(cè)。文獻(xiàn)[12]在指標(biāo)預(yù)測(cè)時(shí),更多地考慮了風(fēng)電場(chǎng)天氣因素。文獻(xiàn)[13]考慮有功功率和穩(wěn)態(tài)日指標(biāo)之間的相關(guān)性,在得到有功功率預(yù)測(cè)值的基礎(chǔ)上,再將其輸入到神經(jīng)網(wǎng)絡(luò)中用于電能質(zhì)量指標(biāo)預(yù)測(cè),但存在的缺陷是直接處理時(shí)序數(shù)據(jù),沒有依據(jù)兩種數(shù)據(jù)之間的相關(guān)性進(jìn)行特征量篩選,有功功率的預(yù)測(cè)值極大程度上影響著穩(wěn)態(tài)指標(biāo)的預(yù)測(cè)結(jié)果,并且不同指標(biāo)預(yù)測(cè)精度差別較大。
在預(yù)測(cè)對(duì)象及場(chǎng)景限定上,為了降低考慮各種相關(guān)因素時(shí)帶來(lái)的預(yù)測(cè)分析復(fù)雜性,文獻(xiàn)[4]選取負(fù)荷類型和容量等處于相對(duì)恒定的分析時(shí)段。文獻(xiàn)[14]針對(duì)具有非線性、單相獨(dú)立性和隨機(jī)波動(dòng)性等電鐵一類的用電負(fù)荷,提出了一種基于蒙特卡洛(Monte Carlo)抽樣的電鐵電能質(zhì)量預(yù)測(cè)方法,先處理牽引負(fù)荷的隨機(jī)波動(dòng)性,再基于實(shí)測(cè)數(shù)據(jù)對(duì)諧波、負(fù)序電壓不平衡等指標(biāo)作預(yù)測(cè)分析。上述文獻(xiàn)所提的預(yù)測(cè)方法由于限定了分析場(chǎng)景,并不適用配電臺(tái)區(qū)實(shí)際源荷的特點(diǎn)。
實(shí)際中公共連接點(diǎn)(point of common coupling,PCC)的穩(wěn)態(tài)電壓質(zhì)量水平與主要干擾源用戶的用電行為有明顯關(guān)系[15]。由于配電臺(tái)區(qū)負(fù)荷變化具有較強(qiáng)隨機(jī)性和周期性[16],電能質(zhì)量監(jiān)測(cè)數(shù)據(jù)會(huì)隨干擾源用戶生產(chǎn)用電行為表現(xiàn)出明顯的變化規(guī)律。在進(jìn)行穩(wěn)態(tài)指標(biāo)預(yù)測(cè)建模時(shí),預(yù)測(cè)精度在一定程度上依賴于建模數(shù)據(jù)合理性和全面性[17],如果忽略臺(tái)區(qū)不同用戶用電特征這一重要因素,在干擾源負(fù)荷發(fā)生一定變動(dòng)時(shí),電壓質(zhì)量監(jiān)測(cè)數(shù)據(jù)的單變量預(yù)測(cè)將丟失一些有價(jià)值的外部預(yù)測(cè)信息,會(huì)有較大偏差。
針對(duì)以上問(wèn)題,本文將干擾源用戶用電和電壓質(zhì)量指標(biāo)變化結(jié)合起來(lái),并且篩選出最具代表性的特征量,通過(guò)改進(jìn)多變量預(yù)測(cè)提高預(yù)測(cè)模型性能和效率。本文提出一種基于相關(guān)性分析和LSTM網(wǎng)絡(luò)的電壓質(zhì)量穩(wěn)態(tài)指標(biāo)預(yù)測(cè)模型。所提方法首先通過(guò)相關(guān)性分析篩選出強(qiáng)相關(guān)用戶數(shù)據(jù),并基于此得到模型訓(xùn)練的輸入量,接著建立基于LSTM的預(yù)測(cè)模型。最后,運(yùn)用模型得到各個(gè)時(shí)刻的穩(wěn)態(tài)數(shù)據(jù),并對(duì)預(yù)測(cè)結(jié)果進(jìn)行分析評(píng)價(jià)。
電能質(zhì)量監(jiān)測(cè)系統(tǒng)的監(jiān)測(cè)數(shù)據(jù)和用電信息采集系統(tǒng)的平均有功功率數(shù)據(jù)分別反映了系統(tǒng)及所供電用戶綜合作用的電能質(zhì)量水平[15]和用戶用電特性。文獻(xiàn)[15]將這兩類數(shù)據(jù)相結(jié)合,分析了用戶平均有功功率與電壓總諧波畸變率的時(shí)序相關(guān)性。對(duì)于其他的穩(wěn)態(tài)電壓質(zhì)量指標(biāo)數(shù)據(jù),如電壓偏差、電壓不平衡等,也能借鑒數(shù)據(jù)相關(guān)性思想得到類似的關(guān)聯(lián)規(guī)律。
福建某配電臺(tái)區(qū)中接入電網(wǎng)PCC的各用戶實(shí)際有功功率如圖1所示。從圖1可以看出,各用戶的實(shí)際有功功率曲線數(shù)據(jù)表現(xiàn)出不同的時(shí)序特點(diǎn),在用電行為上表現(xiàn)出夜間用電、單峰用電、雙峰用電等類型[16]。該P(yáng)CC處監(jiān)測(cè)終端采集到的實(shí)測(cè)穩(wěn)態(tài)指標(biāo)有電壓總諧波畸變率和電壓偏差等,圖2為同一天內(nèi)2種穩(wěn)態(tài)電壓質(zhì)量指標(biāo)實(shí)測(cè)數(shù)據(jù)的95%概率大值變化曲線?!峨娔苜|(zhì)量 公用電網(wǎng)諧波》(GB/T 14549—1993)中給出了實(shí)測(cè)值的95%概率值的近似獲取方法,即將實(shí)測(cè)值按降序排列,舍棄前面5%的大值,取剩余實(shí)測(cè)值中的大值。圖2(a)的電壓總畸變率時(shí)序呈現(xiàn)出夜間高峰、白天低平的形態(tài),而圖2(b)的電壓偏差在凌晨維持相對(duì)較高的數(shù)值,并且在午間有明顯突變。
圖1 不同用戶同一天內(nèi)有功功率曲線Fig.1 Curves of active power of different users on the same day
圖2 穩(wěn)態(tài)電壓質(zhì)量指標(biāo)曲線Fig.2 Curves of voltage quality steady-state indices
從直觀上可以看出,在圖1所示這一天內(nèi),用戶4的用電負(fù)荷曲線和電壓總諧波畸變率的變化規(guī)律具有相似性,在夜間時(shí)段有峰值而白天保持平穩(wěn)且低值的特征,可認(rèn)為用戶4的用電行為與電壓總諧波畸變率存在正相關(guān)性。對(duì)比電壓偏差曲線和不同用戶有功功率曲線,用戶8對(duì)應(yīng)曲線的時(shí)序特點(diǎn)和電壓偏差趨勢(shì)正好相反,粗略認(rèn)為這一天中兩者有負(fù)相關(guān)性。
從實(shí)際數(shù)據(jù)的時(shí)間序列曲線來(lái)看,穩(wěn)態(tài)指標(biāo)和有功功率存在一定的關(guān)聯(lián)性,由此可進(jìn)一步定量這2種數(shù)據(jù)之間的相關(guān)性,從而進(jìn)行穩(wěn)態(tài)電壓質(zhì)量預(yù)測(cè)分析。
動(dòng)態(tài)時(shí)間規(guī)整算法(dynamic time warping,DTW)[18],能夠衡量2個(gè)非對(duì)齊時(shí)間序列的相似程度。通過(guò)序列之間的動(dòng)態(tài)化匹對(duì),可以得到電壓質(zhì)量監(jiān)測(cè)數(shù)據(jù)和各個(gè)用戶有功功率時(shí)間序列之間的距離矩陣,從而定量分析各用戶平均有功功率與電能質(zhì)量指標(biāo)的相關(guān)性。
設(shè)分析時(shí)段內(nèi)電能質(zhì)量監(jiān)測(cè)終端采集的時(shí)段總數(shù)為n,用電采集系統(tǒng)采集的時(shí)段總數(shù)為η,則有2個(gè)時(shí)間序列的矩陣形式,分別表示為式(1)和式(2)。
X=[x1,x2,…,xi,…,xn]
(1)
Pk=[p1,p2,…,pj,…,pηk]
(2)
式中:X代表某類型電壓質(zhì)量穩(wěn)態(tài)監(jiān)測(cè)數(shù)據(jù)序列;xi代表第i個(gè)數(shù)值,共有n個(gè)數(shù);Pk代表某個(gè)用戶k的有功功率時(shí)序;pj代表第j個(gè)數(shù)值,共有ηk個(gè)數(shù)。監(jiān)測(cè)數(shù)據(jù)類型有電壓總諧波畸變率(total voltage harmonic distortion,THDu)、各次諧波電壓含有率、電壓偏差、電壓不平衡等。
定量計(jì)算電壓質(zhì)量監(jiān)測(cè)數(shù)據(jù)和某個(gè)用戶有功功率數(shù)據(jù)之間的距離時(shí),定義一個(gè)大小為n×ηk的距離矩陣D,其中D[i,j]表示矩陣X中第i個(gè)數(shù)xi與用戶k的Pk矩陣中第j個(gè)數(shù)pj之間的歐氏距離,計(jì)算表達(dá)式為式(3)。
(3)
DTW距離基于距離矩陣D中的元素迭代而得,記累積距離矩陣為S,迭代初值S[1,1]為D[1,1]。
先計(jì)算矩陣S中第一行和第一列的所有元素項(xiàng),第一列中第二行起行元素S[i,1]表達(dá)式為式(4),第一行中第二列起列元素S[1,j]表達(dá)式為式(5)。
S[i,1]=D[i,1]+S[i-1,1],2≤i≤n
(4)
S[1,j]=D[1,j]+S[1,j-1],2≤j≤ηk
(5)
然后,針對(duì)2≤i≤n,2≤j≤ηk的情況,基于矩陣S中已知的行元素和列元素,比較3個(gè)元素S[i,j-1],S[i-1,j],S[i-1,j-1]的最小值,將最小累積距離項(xiàng)加上此時(shí)的D[i,j],作為新元素S[i,j],再依次迭代計(jì)算新的累積距離項(xiàng),更新S中的元素。具體的計(jì)算表達(dá)式如式(6)所示。
(6)
直至i=n且j=ηk時(shí),S[n,ηk]的數(shù)值是整體最小累積距離[15],即為2個(gè)序列的DTW距離,代表該用戶k與電能質(zhì)量監(jiān)測(cè)數(shù)據(jù)在趨勢(shì)特征和時(shí)間特征上的相似度,距離值越小,則兩者相似度越高。
通過(guò)以上分析,本文篩選出與穩(wěn)態(tài)電壓質(zhì)量數(shù)據(jù)相關(guān)性強(qiáng)的用戶有功數(shù)據(jù),將其作為預(yù)測(cè)模型的輸入量。在臺(tái)區(qū)負(fù)荷種類多且容量變化大、電能質(zhì)量問(wèn)題復(fù)雜的背景下,結(jié)合2種數(shù)據(jù)的時(shí)序特性和內(nèi)在關(guān)聯(lián)性,能夠有效預(yù)測(cè)穩(wěn)態(tài)指標(biāo)的變化趨勢(shì)。
LSTM作為循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)的改進(jìn)形式,隱含層更為復(fù)雜。與RNN一樣,LSTM網(wǎng)絡(luò)專門用于處理序列數(shù)據(jù),且能夠處理過(guò)長(zhǎng)的輸入序列[19]。LSTM網(wǎng)絡(luò)可設(shè)置為多輸入單輸出模型,適用于本文中的序列分析問(wèn)題,即通過(guò)多特征量時(shí)序數(shù)據(jù)(穩(wěn)態(tài)電壓質(zhì)量指標(biāo)監(jiān)測(cè)數(shù)據(jù)、用戶有功功率數(shù)據(jù)等)進(jìn)行穩(wěn)態(tài)電壓質(zhì)量預(yù)測(cè)。LSTM存在多種變體形式[20-22],最基本的LSTM網(wǎng)絡(luò)中包括3個(gè)門控結(jié)構(gòu),通過(guò)遺忘門、輸入門和輸出門實(shí)現(xiàn)對(duì)信息的添加和刪除操作。
LSTM的內(nèi)部結(jié)構(gòu)如圖3所示,每個(gè)門包含一個(gè)Sigmoid神經(jīng)網(wǎng)絡(luò)層和一個(gè)點(diǎn)乘操作,用σ表示Sigmoid激活函數(shù)。
圖3 LSTM內(nèi)部結(jié)構(gòu)示意圖Fig.3 Schematic of LSTM cell structure
1)由遺忘門的Sigmoid層決定是否舍棄一些信息,其運(yùn)算結(jié)果為1時(shí)代表保留,為0時(shí)即為舍棄信息。
ft=σ(Wf·[ht-1,xt]+bf)
(7)
式中:ft為遺忘門運(yùn)算結(jié)果;Wf為遺忘門權(quán)重矩陣;xt、ht-1分別為當(dāng)前時(shí)刻的輸入與上一時(shí)刻LSTM的輸出;bf為遺忘門偏置項(xiàng)。
2)根據(jù)輸入門的Sigmoid層加入新信息,并結(jié)合tanh層得到的候選值,得到狀態(tài)更新量。
it=σ(Wi·[ht-1,xt]+bi)
(8)
(9)
綜合考慮1)中丟棄的信息,可以得到當(dāng)前時(shí)刻的單元狀態(tài)。
(10)
3)由輸出門的Sigmoid層決定輸出哪些信息,再結(jié)合經(jīng)tanh層處理后的候選單元狀態(tài),得到輸出。
Ot=σ(Wo·[ht-1,xt]+bo)
(11)
ht=Ot·tanh(Ct)
(12)
式中:Ot為輸出門的運(yùn)算結(jié)果;ht為當(dāng)前時(shí)刻的輸出;Wo和bo分別為輸出門的權(quán)重矩陣和偏置項(xiàng)。
具體到本文,LSTM網(wǎng)絡(luò)模型的輸入x為電力用戶有功功率數(shù)據(jù)和穩(wěn)態(tài)電壓質(zhì)量歷史監(jiān)測(cè)數(shù)據(jù),最終預(yù)測(cè)模型輸出量即為穩(wěn)態(tài)監(jiān)測(cè)數(shù)據(jù)預(yù)測(cè)值。
本文預(yù)測(cè)模型的構(gòu)建步驟包含以下幾個(gè)內(nèi)容:
1)數(shù)據(jù)預(yù)處理,對(duì)某時(shí)段10 kV母線PCC處監(jiān)測(cè)終端采集的電壓質(zhì)量監(jiān)測(cè)數(shù)據(jù)和所接用戶的有功功率數(shù)據(jù)作缺失值填充和歸一化處理。
2)根據(jù)DTW算法,對(duì)各類用戶的有功功率數(shù)據(jù)與穩(wěn)態(tài)電壓質(zhì)量數(shù)據(jù)進(jìn)行相關(guān)性分析,選擇關(guān)聯(lián)性較強(qiáng)的用戶用電數(shù)據(jù),和穩(wěn)態(tài)監(jiān)測(cè)數(shù)據(jù)一同作為構(gòu)建LSTM模型的數(shù)據(jù)集。
3)將數(shù)據(jù)集劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,并基于LSTM網(wǎng)絡(luò)構(gòu)建DTW-LSTM預(yù)測(cè)模型。
4)在訓(xùn)練好預(yù)測(cè)模型的基礎(chǔ)上,利用測(cè)試數(shù)據(jù)集獲得預(yù)測(cè)值,并作反歸一化處理,對(duì)比真實(shí)值來(lái)評(píng)估模型性能。
3.1.1原始數(shù)據(jù)集
2020年4月15日至21日的原始THDu時(shí)序數(shù)據(jù)圖4所示,同一時(shí)段內(nèi)10個(gè)用戶的有功功率時(shí)序數(shù)據(jù)如圖5所示,圖5中用2個(gè)子圖依次展示大工業(yè)用戶(用戶2、用戶9、用戶10)和普通工業(yè)用戶的生產(chǎn)用電情況。
圖4 電壓總諧波畸變率時(shí)間序列Fig.4 Time series of total harmonic distortion of the voltage
圖5 多用戶有功功率時(shí)間序列Fig.5 Time-series of active power of the users
3.1.2關(guān)聯(lián)性篩選
由圖4和圖5可知,2種時(shí)序數(shù)據(jù)都表現(xiàn)出一定的變化規(guī)律。經(jīng)歸一化等預(yù)處理以后,序列之間通過(guò)DTW算法進(jìn)行動(dòng)態(tài)化匹配,取滑窗T=96,可以得到相關(guān)系數(shù),即DTW距離。THDu與有功功率的相關(guān)性測(cè)度如表1所示。根據(jù)1.2節(jié)的相關(guān)性測(cè)度思想,DTW距離值越小,則相應(yīng)用戶有功數(shù)據(jù)與THDu相似度越高。表1中用戶x2、x9、x10對(duì)應(yīng)的DTW數(shù)值相對(duì)較小,可以認(rèn)為,在分析時(shí)段內(nèi),用戶2、用戶9和用戶10的有功功率時(shí)序與THDu時(shí)序具有較強(qiáng)相關(guān)性,后續(xù)將這3個(gè)用戶的有功功率數(shù)據(jù)作為模型輸入量。
表1 THDu與有功功率的相關(guān)性測(cè)度Table 1 Correlation measure between THDu and active power
3.1.3數(shù)據(jù)集拆分
考慮到用戶采集數(shù)據(jù)與監(jiān)測(cè)數(shù)據(jù)的存儲(chǔ)周期不同,前者每個(gè)數(shù)據(jù)點(diǎn)間隔15 min,后者為每3 min一個(gè)點(diǎn),所以在同一分析時(shí)段內(nèi),2種數(shù)據(jù)的總數(shù)是不一致的。為了使輸入特征量和預(yù)測(cè)輸出量的時(shí)刻一一對(duì)應(yīng),在此作簡(jiǎn)化處理,對(duì)于穩(wěn)態(tài)電壓質(zhì)量指標(biāo)依次間隔15 min,即每5個(gè)數(shù)據(jù)點(diǎn),取相應(yīng)監(jiān)測(cè)數(shù)據(jù)作為新的數(shù)據(jù)點(diǎn)。由此,把篩選出的用戶群有功功率數(shù)據(jù)和THDu數(shù)據(jù)整合成若干組對(duì)應(yīng)同一時(shí)刻的數(shù)據(jù)集。
預(yù)測(cè)模型樣本輸入特征量包括經(jīng)篩選后若干用戶的有功功率數(shù)據(jù)和PCC處穩(wěn)態(tài)電壓質(zhì)量歷史監(jiān)測(cè)數(shù)據(jù),各輸入特征量的樣本總數(shù)均為1 343。同一時(shí)刻的數(shù)據(jù)點(diǎn)看作一組數(shù)據(jù),則得到對(duì)應(yīng)1 343個(gè)時(shí)刻的輸入樣本對(duì)。本文構(gòu)建的預(yù)測(cè)模型為單輸出模型,以每一組輸入特征量數(shù)據(jù)作為前一狀態(tài)量,輸出下一時(shí)間點(diǎn)的穩(wěn)態(tài)電壓質(zhì)量監(jiān)測(cè)數(shù)據(jù)。
針對(duì)為期2周的數(shù)據(jù)集,本文取前7天的數(shù)據(jù)按6:2:2的比例劃分為模型訓(xùn)練集、驗(yàn)證集和測(cè)試集,訓(xùn)練集和驗(yàn)證集數(shù)據(jù)用于建模,剩下數(shù)據(jù)作為測(cè)試數(shù)據(jù),用來(lái)檢驗(yàn)LSTM模型的預(yù)測(cè)準(zhǔn)確性。
評(píng)估模型預(yù)測(cè)結(jié)果時(shí),本文采用平均絕對(duì)誤差(mean absolute error,MAE)和均方根誤差(root mean square error,RMSE),分別按式(13)、(14)計(jì)算,值越小則代表預(yù)測(cè)值與實(shí)際值越接近,預(yù)測(cè)模型性能好。
為了消除刀片淬火時(shí)產(chǎn)生的內(nèi)應(yīng)力以及得到硬度較高、穩(wěn)定性好的回火馬氏體,采用回火溫度為150~250℃的低溫回火,試驗(yàn)中選擇170℃進(jìn)行低溫回火。
(13)
(14)
本文通過(guò)Keras深度學(xué)習(xí)框架搭建一個(gè)2層隱層的LSTM網(wǎng)絡(luò),首先建立一個(gè)Keras序列模型Sequential[10],在此框架中依次加入輸入層、隱含層和輸出層。分為以下2種情況進(jìn)行分析,標(biāo)識(shí)為“情況一”“情況二”。
3.3.1用戶日用電行為相對(duì)恒定(情況一)
這里以3.1.2節(jié)的篩選結(jié)果為例,所以輸入層有4個(gè)特征量,即3個(gè)強(qiáng)相關(guān)的用戶數(shù)據(jù)和歷史THDu數(shù)據(jù);設(shè)置2個(gè)隱層,分別有50、32個(gè)神經(jīng)元,激活函數(shù)均為線性整流函數(shù)(rectified linear unit,ReLU);預(yù)測(cè)模型為單輸出,故輸出層包含1個(gè)神經(jīng)元,選擇線性函數(shù)作為激活函數(shù)。優(yōu)化算法利用自適應(yīng)時(shí)刻估計(jì)法[23](adaptive moment estimation, ADAM)。當(dāng)監(jiān)測(cè)數(shù)據(jù)類型或監(jiān)測(cè)點(diǎn)類型發(fā)生變化時(shí),需要調(diào)整模型結(jié)構(gòu)參數(shù),以達(dá)到較好的預(yù)測(cè)效果。
本文將前7天的數(shù)據(jù)按6:2:2的比例劃分,測(cè)試集記為測(cè)試樣本1。為了驗(yàn)證預(yù)測(cè)模型的泛化性,將后6天的數(shù)據(jù),即2020年4月23日至28日的數(shù)據(jù)全部作為測(cè)試集,記為測(cè)試樣本2。
基于相關(guān)性分析得到的訓(xùn)練數(shù)據(jù)集,考慮了監(jiān)測(cè)點(diǎn)處歷史穩(wěn)態(tài)電壓指標(biāo)監(jiān)測(cè)數(shù)據(jù)和用戶有功功率數(shù)據(jù)這2種類型數(shù)據(jù)的關(guān)聯(lián)關(guān)系,篩選高相關(guān)度的用戶數(shù)據(jù)作為輸入量,即為改進(jìn)多輸入量的輸入方式,并將此構(gòu)建的模型記為DTW-LSTM模型。對(duì)比另外2種情況構(gòu)建的LSTM模型,一是僅依據(jù)穩(wěn)態(tài)電壓指標(biāo)歷史監(jiān)測(cè)數(shù)據(jù)進(jìn)行預(yù)測(cè),即為單輸入量模型;二是在歷史監(jiān)測(cè)數(shù)據(jù)的基礎(chǔ)上,引入對(duì)應(yīng)監(jiān)測(cè)點(diǎn)下所有用戶有功變量作為輸入量,即為多輸入量模型。情況一中THDu的預(yù)測(cè)誤差統(tǒng)計(jì)結(jié)果如表2所示。
表2 情況一中THDu的預(yù)測(cè)誤差統(tǒng)計(jì)Table 2 Forecast error statistics of THDu in the first case
類似地,根據(jù)電壓偏差與用戶用電數(shù)據(jù)相關(guān)性分析結(jié)果,篩選出特征數(shù)據(jù),并仍以6:2:2的比例構(gòu)建數(shù)據(jù)集,進(jìn)行該穩(wěn)態(tài)指標(biāo)的模型訓(xùn)練和預(yù)測(cè)分析。表3展示了3種預(yù)測(cè)模型的誤差結(jié)果,其中“測(cè)試樣本1”和“測(cè)試樣本2”對(duì)應(yīng)的時(shí)段與表2中2個(gè)測(cè)試樣本數(shù)據(jù)的一樣。
表3 情況一中電壓偏差的預(yù)測(cè)誤差統(tǒng)計(jì)Table 3 Forecast error statistics of voltage deviation in the first case
通過(guò)對(duì)比該監(jiān)測(cè)點(diǎn)的電壓總諧波畸變率和電壓偏差預(yù)測(cè)結(jié)果,可以看出:
1)當(dāng)所有用戶數(shù)據(jù)都作為模型訓(xùn)練集時(shí)(LSTM+多輸入量),RMSE數(shù)值相對(duì)較大,甚至不如單純依靠歷史監(jiān)測(cè)數(shù)據(jù)時(shí)(LSTM+單輸入量)的預(yù)測(cè)結(jié)果;
2)選取和穩(wěn)態(tài)數(shù)據(jù)相關(guān)性較強(qiáng)的干擾源用戶數(shù)據(jù),也就是DTW-LSTM,基于測(cè)試樣本1得到的誤差指標(biāo)MAE和RMSE數(shù)值小,改善了穩(wěn)態(tài)監(jiān)測(cè)數(shù)據(jù)的短期預(yù)測(cè)效果;
3)預(yù)測(cè)模型在預(yù)測(cè)未來(lái)時(shí)段的穩(wěn)態(tài)指標(biāo)數(shù)據(jù)(測(cè)試樣本2)時(shí),MAE和RMSE指標(biāo)數(shù)值變大,DTW-LSTM模型預(yù)測(cè)精度有明顯降低趨勢(shì)。
本文從多輸入量中舍棄與穩(wěn)態(tài)電壓質(zhì)量指標(biāo)弱相關(guān)或無(wú)關(guān)的用戶用電數(shù)據(jù),充分利用了對(duì)指標(biāo)預(yù)測(cè)有價(jià)值的數(shù)據(jù)。將相關(guān)程度高的變量作為訓(xùn)練參數(shù),在提高模型短期預(yù)測(cè)精度上有優(yōu)勢(shì)。但在所分析的時(shí)間尺度下,該監(jiān)測(cè)點(diǎn)負(fù)荷類型和容量等相對(duì)恒定,無(wú)法涵蓋用戶所有的運(yùn)行工況,且可能遺漏了監(jiān)測(cè)數(shù)據(jù)重要的趨勢(shì)特征和變化規(guī)律,使模型在預(yù)測(cè)樣本2時(shí)的效果不夠好。
3.3.2用戶日用電行為發(fā)生變化(情況二)
針對(duì)3.3.1節(jié)DTW-LSTM在預(yù)測(cè)測(cè)試樣本2時(shí)效果不佳的情況,鑒于該建模數(shù)據(jù)集對(duì)應(yīng)時(shí)間段內(nèi)各個(gè)用戶日用電特性較為穩(wěn)定,故選取另一監(jiān)測(cè)點(diǎn)的電壓質(zhì)量監(jiān)測(cè)數(shù)據(jù)和用戶用電數(shù)據(jù)作預(yù)測(cè)分析。該點(diǎn)接有明顯用電行為變化的用戶,由此盡可能多地捕捉用戶用電與電能質(zhì)量數(shù)據(jù)之間的關(guān)聯(lián)特征,進(jìn)一步檢驗(yàn)DTW-LSTM模型在預(yù)測(cè)未來(lái)時(shí)段穩(wěn)態(tài)指標(biāo)的效果。
用戶“飛龍塑鋼”有功功率時(shí)間序列如圖6所示,不同于圖5中各個(gè)用戶每天保持相對(duì)穩(wěn)定的生產(chǎn)作業(yè)情況,該用戶存在周末停產(chǎn)休息的工況。
圖6 某用戶有功功率時(shí)間序列Fig.6 Time series of active power of a power user
本文同樣構(gòu)建了單輸入量、多輸入量LSTM模型以及DTW-LSTM模型來(lái)預(yù)測(cè)該點(diǎn)穩(wěn)態(tài)電壓質(zhì)量指標(biāo)數(shù)值。
預(yù)測(cè)模型需要使用新的數(shù)據(jù),類似于3.3.1節(jié)中的數(shù)據(jù)集拆分規(guī)則,依次劃分出訓(xùn)練集和測(cè)試樣本。同樣在新數(shù)據(jù)集中形成2份測(cè)試樣本,規(guī)則為:前7天的新數(shù)據(jù)集按訓(xùn)練集、驗(yàn)證集、測(cè)試集三者比例為6:2:2劃分,其中測(cè)試集記為測(cè)試樣本3;將后6天的數(shù)據(jù)全部作為測(cè)試集,記為測(cè)試樣本4。并設(shè)置模型參數(shù),重新訓(xùn)練后再進(jìn)行預(yù)測(cè)。以新監(jiān)測(cè)點(diǎn)的THDu和電壓偏差為例,其預(yù)測(cè)誤差結(jié)果見表4、表5。
表4 情況二中THDu的預(yù)測(cè)誤差統(tǒng)計(jì)Table 4 Forecast error statistics of THDu in the second case
根據(jù)表4、表5中的預(yù)測(cè)誤差結(jié)果可以得出,與3.3.1節(jié)存在一致性的2點(diǎn)結(jié)論,即:1)對(duì)比分別以單輸入量和多輸入量作為訓(xùn)練數(shù)據(jù)集的LSTM模型,后者預(yù)測(cè)誤差指標(biāo)MAE和RMSE均大于前者,換句話說(shuō),多輸入量的LSTM模型并不能提升預(yù)測(cè)性能;2)通過(guò)改進(jìn)多輸入量建立的DTW-LSTM模型,在預(yù)測(cè)短期測(cè)試樣本數(shù)據(jù)(測(cè)試樣本3)時(shí),MAE及RMSE指標(biāo)數(shù)值比其他2種預(yù)測(cè)模型的小,預(yù)測(cè)效果好。
表5 情況二中電壓偏差的預(yù)測(cè)誤差統(tǒng)計(jì)Table 5 Forecast error statistics of voltage deviation in the second case
同時(shí),通過(guò)對(duì)比測(cè)試樣本3和測(cè)試樣本4的預(yù)測(cè)誤差可知,在用戶用電特性變化大時(shí),考慮了強(qiáng)相關(guān)特征量的DTW-LSTM模型在預(yù)測(cè)未來(lái)的穩(wěn)態(tài)指標(biāo)數(shù)據(jù)變化情況時(shí)效果顯著。
本文建立了基于DTW-LSTM網(wǎng)絡(luò)的穩(wěn)態(tài)電壓質(zhì)量指標(biāo)預(yù)測(cè)模型,通過(guò)對(duì)實(shí)際數(shù)據(jù)應(yīng)用與分析,得到以下結(jié)論:
1)不加以特征篩選的多輸入量LSTM模型,會(huì)引入對(duì)預(yù)測(cè)分析意義不大的特征量,使得預(yù)測(cè)誤差較大;
2)不同場(chǎng)景下,DTW-LSTM預(yù)測(cè)模型都使得穩(wěn)態(tài)指標(biāo)短期預(yù)測(cè)誤差減??;
3)當(dāng)分析時(shí)段內(nèi),用戶每日用電特征具有明顯差異時(shí),改進(jìn)多輸入量DTW-LSTM模型由于結(jié)合了監(jiān)測(cè)點(diǎn)下各類用電負(fù)荷不同的運(yùn)行情況,所以能夠更好地挖掘出與穩(wěn)態(tài)指標(biāo)關(guān)聯(lián)的數(shù)據(jù)特點(diǎn),提高了穩(wěn)態(tài)指標(biāo)短期及長(zhǎng)期預(yù)測(cè)精度。
后續(xù)將考慮臺(tái)區(qū)用戶長(zhǎng)期用電特性,結(jié)合監(jiān)測(cè)點(diǎn)下各個(gè)用戶不同的用電特點(diǎn)進(jìn)行特征提取和篩選,并研究多尺度數(shù)據(jù)融合技術(shù),得到數(shù)據(jù)量和信息量比較完整的建模數(shù)據(jù)集。同時(shí)針對(duì)除電壓質(zhì)量指標(biāo)以外的其他穩(wěn)態(tài)電能質(zhì)量指標(biāo),開展進(jìn)一步的應(yīng)用研究。