何必仕,熊曉鋒,蔡華強,洪嘉鳴
(杭州電子科技大學自動化學院,浙江 杭州 310018)
城市供水DMA短期需水量預測比較研究
何必仕,熊曉鋒,蔡華強,洪嘉鳴
(杭州電子科技大學自動化學院,浙江 杭州 310018)
針對城市供水獨立計量區(qū)域(DMA)實例,運用自回歸積分滑動平均模型、Elman神經(jīng)網(wǎng)絡、廣義回歸神經(jīng)網(wǎng)絡以及最小二乘支持向量機模型進行城市供水管網(wǎng)短期需水量預測.結合節(jié)假日、天氣狀況及溫度等因素對用水量的影響,修正了相應模型,進一步提高了需水量預測精度.實例計算結果表明,4種模型均能用于城市供水短期需水量預測,其中結合天氣及節(jié)假日因素的最小二乘支持向量機模型具有更高的預測精度.
城市供水;需水量預測;ARIMA;ELMAN;GRNN;LSSVM
城市供水獨立計量區(qū)域(District Metering Area,DMA)短期預測是實現(xiàn)供水生產(chǎn)科學管理、動態(tài)調(diào)度以及管網(wǎng)異常偵測的重要依據(jù).但是局部用水量的波動和不確定性給需水量預測帶來了困難.需水量短期預測方法一般分為時間序列方法、結構分析方法和系統(tǒng)方法[1].其中移動平均法[2]、指數(shù)平滑法[3]、趨勢外推法[4]、季節(jié)變動法[4]等屬于時間序列方法;回歸分析法[5-6]等屬于結構分析方法;灰色預測[7]、人工神經(jīng)網(wǎng)絡[8]、支持向量機[9-10]等屬于系統(tǒng)方法.其中,回歸分析法模型簡單、方便但受多種因素綜合影響,導致難以選擇影響因素;時間序列模型預測精度較好、數(shù)據(jù)處理簡單但是并不適用于變化較大的情況;系統(tǒng)方法具有自學習能力強、非線性處理好等優(yōu)點,具有較高的需水量預測精度,但存在模型復雜、訓練時間長等問題.
近年來,研究學者通過引入天氣,節(jié)假日等用水量影響因素來優(yōu)化需水量預測模型[11-15],以提高需水量短期預測精度.本文運用自回歸積分滑動平均模型(Autoregressive Integrated Moving Average Model, ARIMA),Elman神經(jīng)網(wǎng)絡(Elman Neural Network, ELMAN),廣義回歸神經(jīng)網(wǎng)絡(Generalized Regression Neural Network, GRNN)和最小二乘支持向量機(Least Squares Support Vector Machine, LSSVM),并結合節(jié)假日、天氣狀況、溫度等外部影響因素,對某市DMA短期需水量進行預測.
短期需水量的預測一般是根據(jù)城市歷史用水量建立各種用水量模型,預測未來24 h或48 h的需水量.先對本文選用的4種短期需水量預測模型作簡單介紹.
1.1 ARIMA模型
ARIMA模型通過尋找序列之間的規(guī)律,并用適當?shù)臄?shù)學模型來描述該規(guī)律,對未來進行分析及預測[16].非平穩(wěn)序列ARIMA(p,d,q)通過初始值y1,y2,…,yd和平穩(wěn)的ARMA(p,q)序列zt來表示,由于y1,y2,…,yd與yt是相互獨立的,所以對zt的預測不受y1,y2,…,yd的影響,并且已知yt及其以前時刻的值,由此得到ARIMA(p,d,q)序列{yt}的預測模型.
(1)
需水量預測中所遇到的非平穩(wěn)序列問題,通常都是低階的,即d=1或d=2.特別地,令d=1,預測模型式子簡化為:
(2)
1.2ELMAN模型
ELMAN模型是一種帶反饋的BP網(wǎng)絡,其短期記憶功能使模型對歷史狀態(tài)敏感;模型以任意精度逼近任何非線性映射,并且能較好地處理動態(tài)信息.此外,ELMAN模型可以不考慮外部噪聲的影響,只需給出系統(tǒng)的輸入輸出便可以對系統(tǒng)進行建模[17].模型的狀態(tài)空間表達式為:
(3)
其中,y為輸出向量,x為中間層單元向量,u為輸入向量,xc為反饋狀態(tài)向量,ω3,ω2,ω1分別表示中間層到輸出層,輸入層到中間層以及承接層到中間層的連接權值,g(*)和f(*)分別表示輸出層和中間層神經(jīng)元的傳遞函數(shù).
1.3GRNN模型
GRNN模型是一種具有良好非線性映射能力、容錯性、魯棒性以及柔性網(wǎng)絡結構的徑向基網(wǎng)絡.GRNN由輸入層、模式層、求和層和輸出層構成.網(wǎng)絡輸入X=[x1,x2,…,xn],其輸出為Y=[y1,y2,…,yk][18].模式層傳遞函數(shù)為:
(4)
其中,i為輸入神經(jīng)元個數(shù),Xi為第i個神經(jīng)元對應學習樣本,σ為光滑因子.求和層分別對所有模式層神經(jīng)元輸出求解算術求和值傳遞函數(shù)SD和加權求和值傳遞函數(shù)SNj,最后得到輸出層傳遞函數(shù)yj,其中j表示輸出神經(jīng)元個數(shù).
(5)
1.4LSSVM模型
LSSVM繼承了SVM的結構風險最小化原則,但在優(yōu)化目標中采取誤差的二范數(shù)作為損失函數(shù),在預測方面,LSSVM有更好的精度和更快的速度[10].假設訓練樣本為(xi,yi)i=1l,其中,xi∈Rn為輸入數(shù)據(jù),yi∈R為相應的目標值.文獻[19]將誤差ei的二范數(shù)定義為損失函數(shù)J(ω,e),利用損失函數(shù)最小化原則確定最優(yōu)線性決策y的參數(shù),LSSVM優(yōu)化問題變?yōu)椋?/p>
(6)
式中,b為偏差量,Φ(xi)為LSSVM核空間映射函數(shù),將原空間Rn映射到高維的空間Rm,那么權矢量ω∈Rm.LSSVM常用的核函數(shù)有多項式核函數(shù)、RBF核函數(shù)和Sigmoid函數(shù),其中RBF核函數(shù)的參數(shù)較為容易,且當參數(shù)有效范圍內(nèi)改變時,空間復雜度變化小,易于實現(xiàn).
短期需水量的預測依賴于用水量的歷史數(shù)據(jù),具有較強的周期性、趨勢性.此外,需水量還受溫度、濕度、節(jié)假日、日照、降雨量、風力等因素的影響,這些因素具有不確定性.下面對本文實例中模型輸入輸出量進行介紹.
2.1 實例輸入量
本文采集了2014-12-02至2014-12-30某市某DMA的用水量數(shù)據(jù),同時采集了天氣、節(jié)假日等數(shù)據(jù),主要包括日最高氣溫、日最低氣溫、天氣、風力、節(jié)假日.本文中的ELMAN,GRNN,LSSVM模型將使用天氣、節(jié)假日數(shù)據(jù),部分數(shù)據(jù)如表1所示.
表1 天氣、節(jié)假日的部分數(shù)據(jù)表
使用歷史數(shù)據(jù)和用水量影響因素對ELMAN,GRNN,LSSVM模型進行訓練,輸入內(nèi)容包括訓練輸入樣本SInputtrain、訓練輸出樣本SInputtest和預測輸入樣本SInputforecast,分別為:
a(i)=[a1,a2,…,a24]
(7)
d(i)=[a(i),b(i),c(i),c(i+1)]
(8)
(9)
SInputtest=[a(n+1)a(n+2) …a(m)]
(10)
SInputforcast=[d(m-n)d(m-n+2) …d(m)]
(11)
其中,a(i)為第i天歷史需水量,a1,a2,…,ai為每小時的需水量數(shù)值,b(i)為第i天節(jié)假日情況,c(i),c(i+1)分別為第i天天氣情況、第i+1天天氣情況,由此得到第i天綜合數(shù)據(jù)d(i).N為訓練模型的天數(shù),m值由歷史數(shù)據(jù)訓練樣本天數(shù)決定,本文中,n=3,m=28.
對于ARIMA模型,輸入向量由歷史用水量數(shù)據(jù)組成:
e(i)=[a(1)a(2) …a(td)]
(12)
其中,td為連續(xù)的天數(shù).對e(i)進行差分,通過自相關系數(shù)和偏自相關系數(shù)來判斷ARIMA的3個參數(shù)p,d,q.
2.2 實例輸出量
實例輸出量為2014-12-30的小時需水量預測值,輸出量格式與a(i)一致.預測后,將使用實例輸出量與2014-12-30實際小時用水量進行比較,判斷預測模型的優(yōu)劣.
根據(jù)上述輸入輸出數(shù)據(jù),分別運用ARIMA,GRNN,ELMAN,LSSVM預測模型進行實例預測.實驗中,采用2014-12-02至2014-12-29共28 d共計672 h的用水量數(shù)據(jù),分別建模預測2014-12-30的需水量.
3.1 ARIMA模型預測結果
首先對原數(shù)據(jù)進行周期性差分去除周期性和趨勢性,差分后的數(shù)據(jù)與未差分數(shù)據(jù)比較如圖1所示,此處進行的是一階差分,即d=1.差分后的穩(wěn)定數(shù)據(jù)的自相關系數(shù)和偏自相關系數(shù)如圖2所示.
圖1 差分前后數(shù)據(jù)
圖2 樣本自相關系數(shù)和偏自相關系數(shù)
從圖2可以看出,自相關系數(shù)和偏自相關系數(shù)均具有“拖尾”性,則認定差分后的穩(wěn)定數(shù)據(jù)為ARMA序列.本模型中使用最小信息準則(Akaike Information Criterio,AIC)來確定ARMA(p,q)中p,q的階數(shù),p=1,q=1,由此可以得出此次實驗中模型為ARIMA(1,1,1).
根據(jù)式(12)得到ARIMA(1,1,1)預測曲線如圖3所示,預測值曲線能夠較好的與實際值曲線擬合.
3.2 ELMAN,GRNN,LSSVM模型預測結果
本文中ELMAN,GRNN,LSSVM模型分別根據(jù)式(7)-(11)創(chuàng)建訓練樣本和預測樣本,樣本訓練方式為3 d的用水量數(shù)據(jù)預測1 d的需水量.3種模型預測曲線(包括含天氣節(jié)假日因素和不含天氣節(jié)假日因素)分別如圖6-8所示.
3.3 預測結果分析
本文采用平均絕對百分誤差(Mean Absolute Percentage Error, MAPE)、平均絕對誤差(Mean Absolute Error, MAE)和均方根誤差(Root Mean Square Error, RMSE)三個評價指標對預測結果進行分析.各類指標值越小,精度越高.相關系數(shù)反映的是2個變量之間的相互關系及其相關方向,其值越接近1,表示其相關性越好.各模型預測結果對比如表2所示.
圖3 ARIMA預測曲線與實際曲線
圖4 ELMAN預測曲線和實際曲線
圖5 GRNN預測曲線和實際曲線
圖6 LSSVM預測曲線與實際曲線
預測模型類別是否考慮用水量影響因素MAPE/%MAE/m3RMSE/m3相關系數(shù)ARIMAN 7.5937.0446.430.976ELMANN 6.2126.5331.680.987Y 5.3821.4226.560.991GRNNN13.4357.5469.740.947Y11.6652.5 68.330.965LSSVMN 5.8926.3333.210.986Y 5.4423.1830.880.987
根據(jù)表2及圖3-6可知,4種預測方法從相關性和圖形近似擬合上判斷,均可用于實際需水量的預測.圖5中,GRNN模型在8:00至14:00出現(xiàn)了較大的誤差,其原因在于節(jié)假日2014-12-30當天早高峰用水比前幾天的用水量減少很多,變化較大.而GRNN模型最后收斂于樣本積聚較多的優(yōu)化回歸面,適用于數(shù)據(jù)較為穩(wěn)定的情況,所以誤差較大.
ARIMA模型也依賴于數(shù)據(jù)穩(wěn)定性,在早高峰時間的預測值也出現(xiàn)了較大的誤差.同時2014-12-30當天晚高峰用水比前幾天有小幅上升,也對ARIMA模型預測產(chǎn)生了影響,所以ARIMA模型也不能很好地適用于具有不確定性的需水量預測.
由圖4和表2可以看出,ELMAN模型不僅精度高,而且受數(shù)據(jù)變化的干擾小,達到了較好的預測效果,但是模型訓練時間較長、容易陷入局部最優(yōu),且精度不穩(wěn)定,較難推廣至實際應用中.
由圖6和表2還可以看出,LSSVM模型除了在早高峰8:00時產(chǎn)生了誤差,絕大多數(shù)時段的預測具有較高的精度,精度穩(wěn)定.此外LSSVM模型訓練及預測速度快,具有更強的實用性.
最后,通過表2數(shù)據(jù)對比發(fā)現(xiàn),ELMAN,GRNN,LSSVM模型在加入天氣、節(jié)假日因素后,均能進一步提高預測精度.
本文通過對4種需水量預測模型(ARIMA,ELMAN,GRNN,LSSVM)的預測實例分析發(fā)現(xiàn),4種模型均能用于DMA短期需水量預測,并且結合天氣、節(jié)假日等用水量影響因素后能提高預測精度,并且基本達到了實際需水量預測的要求.對比4個需水量預測模型,LSSVM模型具有更好的預測效果和可行性.后續(xù)將根據(jù)用水量的周期性和趨勢性,結合周邊DMA用水量等因素作進一步研究,提高城市供水短期需水量預測的精度.
[1]張雅君,劉全勝.需水量預測方法的評析與擇優(yōu)[J].中國給水排水,2001,17(7):27-29.
[2]CAIADO J. Performance of combined double seasonal univariate time series models for forecasting water demand[J]. Journal of Hydrologic Engineering, 2010,15(3):215-222.
[3]呂謀,趙洪賓,李紅衛(wèi),等.時用水量預測的自適應組合動態(tài)建模方法[J].系統(tǒng)工程理論與實踐,1998,18(8):101-107.
[4]ZHOU S L, MCMAHON T A, Walton A, et al. Forecasting daily urban water demand: a case study of Melbourne[J]. Journal of Hydrology, 2000,236(3-4):153-164.
[5]呂謀,趙洪賓.城市日用水量預測的組合動態(tài)建模方法[J].給水排水,1997(11):25-27.
[6]LEE S J, WENTZ E A, GOBER P. Space-time forecasting using soft geostatistics: a case study in forecasting municipal water demand for Phoenix, Arizona[J]. Stochastic Environmental Research and Risk Assessment, 2010,24(2):283-295.
[7]張雅君,劉全勝.城市需水量灰色預測的探討[J].中國給水排水,2002,18(3):79-81.
[8]JENTGEN L, CONRAD S. Energy management strategies use short-term water consumption forecasting to minimize cost of pumping operations[J]. Journal(American Water Works Association), 2007,99(6):86-94.
[9]戢鋼,王景成,葛陽,等.城市小時級需水量的改進型引力搜索算法-最小二乘支持向量機模型預測[J].控制理論與應用,2014,31(10):1377-1382.
[10]俞亭超.城市供水系統(tǒng)優(yōu)化調(diào)度研究[D].杭州:浙江大學,2004.
[11]ARBUéS F, MARTNEZ-ESPIEIRA R. Estimation of residential water demand: a state-of-the-art review[J]. Journal of Socio-Economics, 2003,32(1):81-102.
[12]COOMES P A, KORNSTEIN B D, ROCKAWAY T D, et al. North America Residential Water Usage Trends[J]. Proceedings of the Water Environment Federation, 2010(9):6488-6500.
[13]ALVISI S, FRANCHINI M, MARINELLI A. A short-term, pattern-based model for water-demand forecasting[J]. Journal of Hydroinformatics, 2007,9(1):39-50.
[14]GATO S, JAYASURIYA N, ROBERTS P. Forecasting Residential Water Demand: Case Study[J]. Journal of Water Resources Planning & Management, 2007,133(4):309-319.
[15]GATO S, JAYASURIYA N, ROBERTS P. Temperature and rainfall thresholds for base use urban water demand modelling[J]. Journal of Hydrology, 2007,337(3):364-376.
[16]尹學康.城市需水量預測[M].北京:中國建筑工業(yè)出版社,2006:136-177.
[17]王小川.MATLAB神經(jīng)網(wǎng)絡43個案例分析[M].北京:北京航空航天大學出版社,2013:196-200.
[18]FIRAT M, YURDUSEV M A, TURAN M E. Evaluation of Artificial Neural Network Techniques for Municipal Water Consumption Modeling[J]. Water Resources Management, 2009,23(4):617-632.
[19]SUYKENS J A K, LUKAS L, VANDEWALLE J. Sparse Least Squares Support Vector Machine Classifiers[J]. Neural Processing Letters, 1999,1(3):293-300.
Comparative Research on Short Term Water Demand Prediction of Urban Water Distribution System
HE Bishi, XIONG Xiaofeng, CAI Huaqiang, HONG Jiaming
(SchoolofAutomation,HangzhouDianziUniversity,HangzhouZhejiang310018,China)
Applied four methods including the ARIMA, ELMAN, GRNN and LSSVM to predict short-term water demand for a DMA instance. Considering the impact of water demand by weather conditions, temperature and holidays and other factors, so combined these factors can improve water demand forecast accuracy. The final results show that all four methods can be used for short-term water demand prediction, and the LSSVM method, which combined with weather and holiday factors, has higher prediction accuracy.
urban water distribution; water demand; ARIMA; ELMAN; GRNN; LSSVM
10.13954/j.cnki.hdu.2017.02.011
2016-09-18
國家自然科學基金資助項目(61233004,U1509205)
何必仕(1981-),男,浙江溫州人,工程師,計算機軟件與理論.
TU991.31
A
1001-9146(2017)02-0051-06