李雨,侯磊,徐磊,白小眾,劉金海,孫欣,谷文淵
基于混合BP神經(jīng)網(wǎng)絡的原油管道電耗預測研究
李雨1,2,侯磊1,2,徐磊1,2,白小眾3,劉金海3,孫欣3,谷文淵3
(1.中國石油大學(北京)石油工程教育部重點實驗室,北京 102200; 2.國家石油天然氣管網(wǎng)集團有限公司油氣調度中心,北京 102200; 3.國家管網(wǎng)集團北方管道有限責任公司 錦州輸油氣分公司,遼寧 錦州 121000)
原油管道電耗的準確預測能夠用于控制原油管道耗能水平,充分挖掘原油管道輸送系統(tǒng)的節(jié)能潛力。實際采集到的原油管道運行數(shù)據(jù)具有波動范圍大的特點,且存在嚴重的噪聲干擾和信息冗余,對精確預測管道電耗造成不良影響。為解決上述問題,提出一種基于混合神經(jīng)網(wǎng)絡的電耗預測模型。利用自適應噪聲的完備集成經(jīng)驗模態(tài)分解,對原油管道日運行數(shù)據(jù)進行分解;利用主成分分析對分解后數(shù)據(jù)做降維處理;利用改進粒子群算法調節(jié)神經(jīng)網(wǎng)絡結構參數(shù);使用該模型預測某原油管道電耗,并與常見的幾種預測模型展開對比。結果表明,分解算法能夠提高模型預測精度;該混合神經(jīng)網(wǎng)絡模型預測精度最高,其測試集的平均絕對誤差為5.394%,較使用分解算法前降低39.200%。
原油管道; 電耗預測; 人工神經(jīng)網(wǎng)絡; 改進粒子群算法
目前預測原油管道運行電耗存在兩種方法[1?2]。一種方法是考慮輸量、壓降和環(huán)境等因素對原油管道運行電耗的影響,利用理論公式計算管道在某個具體運行工況下的運行電耗,這種方法也被稱為工藝法。該方法在計算管道運行電耗時不但需要引入大量假設,而且需要簡化求解問題,大幅降低了模型的預測精度。另一種方法是利用神經(jīng)網(wǎng)絡建立電耗預測模型以完成預測任務。該方法不引入額外假設,預測效果更好。但該方法應用于原油管道電耗預測時存在兩個問題:由于神經(jīng)網(wǎng)絡精度受參數(shù)影響很大,需要使用科學的方法調節(jié)模型參數(shù)以提高神經(jīng)網(wǎng)絡的性能;神經(jīng)網(wǎng)絡模型精度易受輸入數(shù)據(jù)質量的影響,當輸入數(shù)據(jù)噪聲較多時,神經(jīng)網(wǎng)絡不能表現(xiàn)出最好的預測性能。搜索算法能夠快速優(yōu)化神經(jīng)網(wǎng)絡模型參數(shù)[3?5],提高模型預測效果,該方法目前被廣泛應用于太陽輻射預測[6]、建筑物能耗[7]、設備故障診斷[8]和油井套管無損檢測[9]等領域,但在管道運行電耗預測領域應用很少。經(jīng)驗模態(tài)分解[10]與其改進方法[11]被廣泛用于分解數(shù)據(jù)信號以減弱噪聲影響,提高模型預測精度。自適應噪聲的完備集成經(jīng)驗模態(tài)分解[12]作為傳統(tǒng)經(jīng)驗模態(tài)分解方法的改進,減弱了白噪聲對分解結果的影響,更適合用于分離出數(shù)據(jù)信號中對預測不利的噪聲信息。本研究將自適應噪聲的完備集成經(jīng)驗模態(tài)分解、改進粒子群算法和BP神經(jīng)網(wǎng)絡結合,提出一種原油管道日電耗預測模型,并利用某原油管道3年運行數(shù)據(jù)驗證該模型的預測效果。
自適應噪聲的完備集成經(jīng)驗模態(tài)分解(CEEMDAN)是一種改進的經(jīng)驗模態(tài)分解(EMD)方法,該方法能夠更快地對信號進行分解,提取出不同時間尺度的特征信息且不產(chǎn)生重構誤差,故該方法往往能夠篩選出含噪聲較多的分量,改善預測效果。該方法利用EMD分解時間序列()獲得1(),利用式(1)對得到的c()繼續(xù)分解得到c1(),重復式(1)至殘差不能被分解[13]。
因此,時間序列()經(jīng)過CEEMDAN分解得到的各個分量可表示為:
本研究利用該方法分解運行報表中的12個輸入特征,共獲得100個新輸入特征。分解后數(shù)據(jù)既包含有效信息,也包含一定數(shù)量的噪聲和冗余信息。其中,噪聲信息會降低模型的預測精度,數(shù)據(jù)維度的增長會造成數(shù)據(jù)樣本稀疏、樣本間距離計算困難等問題,不利于BP神經(jīng)網(wǎng)絡(BPNN)的訓練,同時會增加神經(jīng)網(wǎng)絡訓練時間。因此,需要對數(shù)據(jù)做降維處理,在降低數(shù)據(jù)維度的同時剔除其中的噪聲信息。
主成分分析法(PCA)是降低數(shù)據(jù)維度的方法,利用方差的累計貢獻率衡量原始數(shù)據(jù)信息被保留的程度。方差累計貢獻率的閾值多憑借經(jīng)驗決定,保留閾值以上的數(shù)據(jù),舍棄閾值以下的數(shù)據(jù)。本研究利用主成分分析分別對運行報表中的12個輸入特征和經(jīng)CEEMDAN分解后的100個輸入特征進行降維,取方差累計貢獻率為99%時主成分分析確定的特征作為模型輸入特征。
BP神經(jīng)網(wǎng)絡能夠以任意精度逼近某一非線性函數(shù),因此被廣泛應用于建立預測模型。BP神經(jīng)網(wǎng)絡包含輸入層、隱含層和輸出層,本研究所提出的網(wǎng)絡結構如圖1所示。
圖1 單隱含層神經(jīng)網(wǎng)絡示意圖
輸入層和隱含層分別包括53和17個神經(jīng)元,激活函數(shù)為relu函數(shù),不同層的神經(jīng)元間利用權值連接,權值的數(shù)值有正有負。神經(jīng)網(wǎng)絡通過修正權值使模型平均均方誤差(MSE)達到最小。神經(jīng)網(wǎng)絡的初始權值滿足隨機分布,不同的權值初始分布使訓練后的神經(jīng)網(wǎng)絡表現(xiàn)出不同的預測結果。為減弱不同權值初始分布對神經(jīng)網(wǎng)絡預測結果的影響,需要進行重復實驗。當重復實驗次數(shù)增多而模型預測誤差均值趨于穩(wěn)定時便認為已進行了足夠次數(shù)的重復實驗。本研究將降維后數(shù)據(jù)作為BPNN輸入,將日電耗作為輸出,建立單隱含層的電耗預測模型,進行30次重復實驗并取30組模型預測誤差平均值來評價模型預測精度。
改進粒子群算法(ISPO)[13?14]通過計算粒子群中每個個體在不同位置下得到的適應度函數(shù)值來指導下一代個體的運動,最終全部粒子聚集在適應度函數(shù)值最高的位置,從而達到尋優(yōu)目的。相比傳統(tǒng)粒子群算法,改進粒子群算法對求解種群最優(yōu)位置和個體最優(yōu)位置的過程進行優(yōu)化,減少了需要調節(jié)的參數(shù)數(shù)量。改進粒子群算法利用式(3)計算種群最優(yōu)位置。
利用式(4)求解每個粒子的歷史最佳位置。
在量子空間中的粒子移動方向具有隨機性,設粒子從某點移動到它的相對位置的概率為,則有式(5):
利用蒙特卡洛模擬求得值,有~(0,1),則有式(6):
最后得到子代粒子位置:
本研究利用粒子群算法(PSO)、引力搜索算法(GSA)、遺傳算法(GA)和模擬退火算法(SA)調節(jié)BPNN的參數(shù),分別建立PSO?BPNN、GSA?BPNN、GA?BPNN、SA?BPNN預測模型,將其與IPSO?BPNN模型進行對比。粒子群算法通過更新粒子群最優(yōu)位置和個體最優(yōu)位置來指導粒子運動,并獲得全局最優(yōu)解。引力搜索算法通過計算粒子間萬有引力來指導粒子運動,并獲得全局最優(yōu)解。遺傳算法通過攜帶數(shù)據(jù)信息的染色體進行遺傳和變異來獲得全局最優(yōu)解。模擬退火算法利用粒子在降溫過程中會逐漸趨于穩(wěn)定的特點,在高溫時跳出局部最優(yōu)解,在低溫時獲得全局最優(yōu)解[15?17]。
為評價預測模型精度,選取均方根誤差(RMSE)、決定系數(shù)(2)和平均絕對百分比誤差(MAPE)3個指標評價模型精度。各誤差指標的計算公式如下:
建模步驟為:利用CEEMDAN分解原始數(shù)據(jù);利用主成分分析法分別對原始數(shù)據(jù)的12個輸入特征和CEEMDAN分解后的100個輸入特征進行降維,得到處理后數(shù)據(jù);把處理后數(shù)據(jù)作為BPNN輸入,日電耗作為輸出,建立預測模型,并設定一個BPNN的隱含層神經(jīng)元數(shù)和初始學習速率;設定模型測試集2作為適應度函數(shù);執(zhí)行IPSO算法得到BPNN的最優(yōu)隱含層神經(jīng)元數(shù)和最優(yōu)初始學習速率;得到精度最高的BPNN預測模型;利用該模型預測管道運行電耗;利用2.6節(jié)介紹的3個誤差指標評價模型精度。具體流程如圖2所示。
本研究共建立8個電耗預測模型進行對比分析。使用相同訓練數(shù)據(jù)建模,再利用IPSO等不同搜索算法調節(jié)模型結構,驗證IPSO算法搜索神經(jīng)網(wǎng)絡參數(shù)的效果優(yōu)于其他搜索算法;使用CEEMDAN分解的數(shù)據(jù)建模,再利用IPSO調節(jié)模型參數(shù),驗證CEEMDAN確實能夠提升模型預測精度。
圖2 神經(jīng)網(wǎng)絡模型的訓練流程圖
表1展示了不同數(shù)量的主成分與方差累計貢獻率的計算結果。由于特征數(shù)量多,只展示部分數(shù)據(jù)。由表1可知,未分解數(shù)據(jù)集降至9維時,方差累計貢獻率首次超過99%;CEEMDAN分解后的數(shù)據(jù)集降至52維時,方差累計貢獻率首次超過99%。因此,本研究最終將兩組數(shù)據(jù)分別降至9維和52維。
表1 主成分數(shù)量及累計貢獻率
CEEMDAN?IPSO?BPNN模型在進行不同次數(shù)的重復實驗時將測試集MAPE均值做成折線圖,結果如圖3所示。分析圖3發(fā)現(xiàn),當每組重復實驗15~30次時,MAPE穩(wěn)定在5.4%左右。因此,保守地認為30次重復實驗已足夠。
圖3 MAPE折線圖
表2展示了所有電耗預測模型的MAPE、2和RMSE。
表2 預測模型的誤差統(tǒng)計
表3 CEEMDAN?IPSO?BPNN模型參數(shù)
統(tǒng)計部分模型的預測值與測試集真實值的對比結果如圖4所示。由圖4可知,CEEMDAN?IPSO?BPNN模型的預測結果在頭部和尾部與真實數(shù)據(jù)幾乎一致,中間部分112組數(shù)據(jù)波動幅度相對較小,97%的數(shù)據(jù)處于10%誤差帶內(nèi),與真實值數(shù)據(jù)偏差很小,說明CEEMDAN?IPSO?BPNN能夠實現(xiàn)日電耗的精確預測。
圖4 真實值與預測值對比
將IPSO?BPNN與BPNN、PSO?BPNN、GSA?BPNN、GA?BPNN、SA?BPNN進行對比,不但說明搜索算法調節(jié)神經(jīng)網(wǎng)絡結構的必要性,而且說明改進粒子群算法(IPSO)能夠更好地提升模型預測精度。對比CEEMDAN?IPSO?BPNN、CEEMDAN?PSO?BPNN、IPSO?BPNN和PSO?BPNN發(fā)現(xiàn),CEEMDAN與多種搜索算法組合時均能提升模型精度,說明利用CEEMDAN分解輸入特征以提升模型精度的方法是可行的。
(1)提出了一種基于自適應噪聲的完備集成經(jīng)驗模態(tài)分解(CEEMDAN)、改進粒子群算法(IPSO)和BPNN的混合管道日電耗預測模型。該模型實現(xiàn)了對該管道日電耗的準確預測,預測精度高于其余對比模型的精度。
[1] 吳倩. 原油管道運行能耗統(tǒng)計分析與預測[D].北京:中國石油大學(北京),2012.
[2] Zeng C L,Wu C C,Zuo L L,et al.Predicting energy consumption of multiproduct pipeline using artificial neural networks[J].Energy,2014,66:791?798.
[3] 王立志,慕曉冬,劉宏嵐.采用改進粒子群優(yōu)化的SVM方法實現(xiàn)中文文本情感分類[J].計算機科學,2020,47(1):231?236.
Wang L Z,Mu X D,Liu H L.Using SVM method optimized by improved particle swarm optimization to analyze emotion of Chinese text[J].Computer Science,2020,47(1):231?236.
[4] 陶文華,袁正波.焦炭質量的DE?BP神經(jīng)網(wǎng)絡預測模型研究[J].系統(tǒng)仿真學報,2018,30(5):1650?1656.
Tao W H,Yuan Z B.Prediction model of coke quality based on DE?BP neural network[J].Journal of System Simulation,2018,30(5):1650?1656.
[5] 唐承娥.基于交變粒子群BP網(wǎng)絡的電力系統(tǒng)短期負荷預測[J].計算機科學,2017,44(11A):133?135.
Tang C E.Short?term load forecasting of power system based on alternating particle swarm BP network[J].Computer Science,2017,44(11A):133?135.
[6] Eseve A T,Zhang J,Zheng D.Short?term photovoltaic solar power forecasting using a hybrid Wavelet?PSO?SVM model based on SCADA and meteorological information[J].Renewable Energy,2018,118:357?367.
[7] Zhang F,Deb C,Lee S E,et al.Time series forecasting for building energy consumption using weighted support vector regression with differential evolution optimization technique[J].Energy and Buildings,2016,126(2):94?103.
[8] 呂楠,姚平喜.基于BP神經(jīng)網(wǎng)絡的滾動軸承故障診斷[J].煤礦機械,2020,41(8):172?173.
Lü N,Yao P X.Fault diagnosis of rolling bearing based on BP neural network[J].Coal Mine Machinery,2020,41(8):172?173.
[9] 黃軍,孟凡順,張旭,等.基于PCA的遺傳神經(jīng)網(wǎng)絡在套損預測中的應用[J].西安石油大學學報(自然科學版),2018,33(6):84?89.
Huang J,Meng F S,Zhang X,et al.Application of genetic neural network based on PCA in prediction of casing damage[J].Journal of Xi'an Shiyou University(Natural Science Edition),2018,33(6):84?89.
[10] Rabi J,Balusamy T,Jawahar R R.Analysis of vibration signal responses on pre induced tunnel defects in friction stir welding using wavelet transform and empirical mode decomposition[J].Defence Technology,2019,15(6):885?896.
[11] Wang L M,Shao Y M.Fault feature extraction of rotating machinery using a reweighted complete ensemble empirical mode decomposition with adaptive noise and demodulation analysis[J].Mechanical Systems and Signal Processing,2020,138:106545.
[12] Zhang W,Qu Z,Zhang K,et al.A combined model based on CEEMDAN and modified flower pollination algorithm for wind speed forecasting[J].Energy Conversion and Management,2017,136(1):439?451.
[13] 鄭偉博.粒子群優(yōu)化算法的改進及其應用研究[D].青島:青島大學,2016.
[14] Li J,Li Q.Medium term electricity load forecasting based on CEEMDAN?permutation entropy and ESN with leaky integrator neurons[J].Electric Machines and Control,2015,19(8):70?80.
[15] 周闖,孫鐵,張素香.AHP?模糊數(shù)學的風機機組與管網(wǎng)系統(tǒng)能耗評價[J].遼寧石油化工大學學報,2019,39(3):64?69.
Zhou C,Sun T,Zhang S X.Energy consumption evaluation method of bower unit basedon AHP?fuzzy mathematics[J].Journal of Liaoning Shihua University,2019,39(3):64?69.
[16] 侯磊,許新裕,崔金山,等.基于BP神經(jīng)網(wǎng)絡的輸油管道能耗預測方法[J].節(jié)能技術,2009,27(5):401?406.
Hou L,Xu X Y,Cui J S,et al.A prediction method of energy consumption for oil pipeline based on BP neural network[J].Energy Conservation Technology,2009,27(5):401?407.
[17] 華東陽,王壽喜,郭喬,等.基于粒子群算法的液體管道仿真模型參數(shù)校正方法[J].油氣儲運,2020,39(12):1386?1393.
Hua D R,Wang S X,Guo Q,et al.Correction method for parameters of liquid pipeline simulation model based on particle swarm optimization algorithm[J].Oil & Gas Storage and Transportation,2020,39(12):1386?1393.
Power Consumption Prediction Method for Crude Oil Pipeline Based on Hybrid BP Neural Network
Li Yu1,2, Hou Lei1,2, Xu Lei1,2, Bai Xiaozhong3, Liu Jinhai3, Sun Xin3, Gu Wenyuan3
(1.MOE Key Laboratory of Petroleum Engineering,China University of Petroleum(Beijing),Beijing 102200,China;2.Oil & Gas Control Center,National Petroleum and Natural Gas Pipeline Network Group Co. Ltd.,Beijing 102200,China;3.Jinzhou Oil and Gas Transmission Branch of National Pipe Network Group North Pipeline Co. Ltd.,Jinzhou Liaoning 121000,China)
Accurately predicting the power consumption of crude oil pipelines is conducive to controlling the energy consumption level of such pipelines and fully tapping the energy saving potential of crude oil pipeline transportation systems. Actual operation data of such pipelines have the characteristics of large fluctuation range serious noise interference, and information redundancy, which affect the accurate prediction of pipeline power consumption. To solve these problems, this paper proposes a power consumption prediction model based on a hybrid neural network. The daily operation data of crude oil pipelines are decomposed by complete ensemble empirical mode decomposition with adaptive noise. Principal component analysis is performed to reduce the dimensions of the decomposed data. The improved particle swarm optimization algorithm is applied to adjust the structural parameters of the neural network. The proposed model is applied to predict the power consumption of a crude oil pipeline and compared with some common prediction models. The results show that the decomposition algorithm can improve the prediction accuracy of the model. The hybrid neural network model has the highest prediction accuracy. The average absolute error of the test set is 5.394%, which is 39.200% lower than that before the decomposition algorithm is used.
Crude oil pipeline; Power consumption prediction; Artificial neural network; Improved particleswarm optimization algorithm
TE832
A
10.3969/j.issn.1006?396X.2022.02.011
1006?396X(2022)02?0068?06
2020?12?14
2021?03?15
國家重點研發(fā)計劃項目(2016YFC0802100)。
李雨(1996?),男,碩士研究生,從事油氣管道輸送技術方面研究;E?mail:825481000@qq.com。
侯磊(1966?),男,博士,教授,博士生導師,從事油氣儲運工程技術方面研究;E?mail:houleicup@126.com。
(編輯 王戩麗)