陳斌,方海英,周繼來,許仁杰,周鵬,楊文靜,趙維晞,潘楠
(1.紅云紅河煙草(集團(tuán))有限責(zé)任公司物流中心,云南 昆明 650202;2.昆明理工大學(xué)民航與航空學(xué)院,云南 昆明 650500)
目前,在原煙倉儲管理中,片煙已成為原煙的主要貯存形式,存儲片煙的堆垛內(nèi)部溫濕度環(huán)境直接影響其醇化效果,管理員根據(jù)溫濕度數(shù)據(jù)可對片煙儲存進(jìn)行有效管理,一旦出現(xiàn)溫度過高等問題管理員可以及時采取措施,以避免煙葉產(chǎn)生霉變等問題,減少損失。如果能有效預(yù)測出未來某短時間內(nèi)的倉儲溫度,即可極大提高片煙精準(zhǔn)監(jiān)測水平,因此對片煙堆垛內(nèi)部未來一段時間內(nèi)的溫度數(shù)據(jù)進(jìn)行預(yù)測非常有必要。
關(guān)于倉儲溫度預(yù)測的方法,主要包括機(jī)器學(xué)習(xí)以及深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)等技術(shù)。近些年來,人工神經(jīng)網(wǎng)絡(luò)取得了快速發(fā)展,包括深度神經(jīng)網(wǎng)絡(luò)(DNN)、長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)等。Shi X,等將降水臨近預(yù)報描述為一個時空序列預(yù)測問題,通過利用LSTM方法有效預(yù)測了降水臨近的數(shù)據(jù)。Gundu,等提出了一個基于LSTM的預(yù)測模型,通過對各種網(wǎng)絡(luò)模型進(jìn)行統(tǒng)計分析,得到了適合準(zhǔn)確預(yù)測太陽能和溫度的網(wǎng)絡(luò)結(jié)構(gòu)。也有不少學(xué)者將上述人工神經(jīng)網(wǎng)絡(luò)相結(jié)合,其中,倪錚,等提出了一種針對氣象數(shù)據(jù)的CNN-LSTM神經(jīng)網(wǎng)絡(luò),并利用其對雷暴的6h臨近預(yù)報進(jìn)行了實驗,取得令人滿意的預(yù)報效果。Tabrizi S E,等采用將CNN與LSTM相結(jié)合的DNN模型應(yīng)用于路面表面溫度預(yù)測,相較于其他單一的神經(jīng)網(wǎng)絡(luò)取得了較好的預(yù)測效果。此外也有學(xué)者將其他方法與神經(jīng)網(wǎng)絡(luò)相結(jié)合,其中,張亞偉,等提出了結(jié)合長短期記憶神經(jīng)網(wǎng)絡(luò)LSTM與梯度提升算法LightGBM的組合模型,該方法可以保留LSTM模型對單變量預(yù)測的周期性特點,結(jié)果表明,基于LSTMLightGBM的組合模型方法比單純使用LSTM的方法更接近原始波形,具有更低的RMSE。黃偉建,等提出一種基于混合神經(jīng)網(wǎng)絡(luò)和注意力機(jī)制的預(yù)測模型(Att-CNN-LSTM),王晨陽,等提出一種基于遺傳算法(GA)優(yōu)化的卷積長短記憶神經(jīng)網(wǎng)絡(luò)混合模型(GACNN-LSTM),通過GA優(yōu)化LSTM訓(xùn)練網(wǎng)絡(luò)的超參數(shù)權(quán)重與偏置值,經(jīng)過仿真結(jié)果表明該方法對光伏發(fā)電功率具有更好的預(yù)測性能。
基于上述分析可知,單一神經(jīng)網(wǎng)絡(luò)在預(yù)測上精度都不夠高,預(yù)測結(jié)果不夠準(zhǔn)確,應(yīng)該將多種神經(jīng)網(wǎng)絡(luò)結(jié)合在一起,用其他方法的優(yōu)勢取代其劣勢,從而達(dá)到對數(shù)據(jù)的精確預(yù)測。因此,本文首先利用自組織映射(Self-Organizing Maps,SOM)將輸入的溫度數(shù)據(jù)進(jìn)行聚類,隨后將數(shù)據(jù)集分成訓(xùn)練集和測試集,對這些數(shù)據(jù)進(jìn)行歸一化處理,以提高訓(xùn)練速度和計算精度,由于LSTM可以解決循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)中梯度消失和梯度爆炸、長期記憶能力不足的缺點,因此,本文提出了基于粒子群算法的混合長短記憶模型(PSO-SOM-LSTM),對數(shù)據(jù)進(jìn)行預(yù)處理,基于粒子群算法優(yōu)化SOM-LSTM的網(wǎng)絡(luò)權(quán)重,隨后帶入神經(jīng)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)預(yù)測,實現(xiàn)對未來倉儲堆垛內(nèi)的溫濕度進(jìn)行精準(zhǔn)預(yù)測的目的。具體步驟為:首先對數(shù)據(jù)進(jìn)行預(yù)處理,將數(shù)據(jù)歸一化再采用SOM聚類分別構(gòu)建各類數(shù)據(jù)集;其次構(gòu)建LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),輸入訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練;隨后,基于PSO算法優(yōu)化SOMLSTM的網(wǎng)絡(luò)權(quán)重,帶入神經(jīng)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)預(yù)測并與四種不同的預(yù)測方法進(jìn)行對比,證明了PSO-SOMLSTM算法的優(yōu)越性;最后通過均方根誤差(RMSE)等指標(biāo)來衡量實驗結(jié)果。
本文實驗數(shù)據(jù)由某大型卷煙生產(chǎn)企業(yè)原料倉儲科露天堆垛在2021年4月25日-5月1日一周內(nèi)的某一煙垛每間隔30min的溫度監(jiān)測數(shù)據(jù)擬合而成。傳感器的最大布設(shè)上限為80個,傳感器在室內(nèi)中的擺放信息記錄共分8段,由于篇幅問題,本文只選了第一段第一層的無線傳感器擺放示意圖,如圖1所示。
圖1 無線傳感器擺放圖(節(jié)選)
為了提高后面神經(jīng)網(wǎng)絡(luò)的訓(xùn)練速度和預(yù)測精度,將所有的溫度數(shù)據(jù)進(jìn)行歸一化處理,公式如下:
其中:X是所用數(shù)據(jù)的平均值,是所用數(shù)據(jù)的最大值,是所用數(shù)據(jù)的最小值。歸一化后的溫度數(shù)據(jù)如圖2所示。
圖2 數(shù)據(jù)歸一化
對大量數(shù)據(jù)進(jìn)行分析是一項繁重又復(fù)雜的工作,為簡化該工作并且為神經(jīng)網(wǎng)絡(luò)提供不同類別的數(shù)據(jù)集,以提高預(yù)測精度,本文采用一種無監(jiān)督學(xué)習(xí)SOM聚類方法。自組織映射神經(jīng)網(wǎng)絡(luò)(Self Organizing Maps,SOM)由芬蘭神經(jīng)網(wǎng)絡(luò)專家Kohonen教授提出,一個神經(jīng)網(wǎng)絡(luò)接受外界輸入模式時,將會分為不同的對應(yīng)區(qū)域,各區(qū)域?qū)斎肽J骄哂胁煌捻憫?yīng)特征,而且這個過程是自動完成的。SOM能把繁雜的高維數(shù)據(jù)轉(zhuǎn)換為簡潔的幾何關(guān)系,因此具有精簡數(shù)據(jù)并達(dá)到高質(zhì)量聚類分析結(jié)果的目的。
實現(xiàn)SOM聚類的步驟為;提取各條數(shù)據(jù)之間的差異性,將歸一化后的數(shù)據(jù)劃分為訓(xùn)練集和測試集,輸入SOM神經(jīng)網(wǎng)絡(luò),把相同聚類結(jié)果的數(shù)據(jù)歸為一類,為下一步的LSTM神經(jīng)網(wǎng)絡(luò)提供不同類別的數(shù)據(jù)集,以提高預(yù)測精度。
本文采用粒子群算法(PSO)優(yōu)化SOM-LSTM混合神經(jīng)網(wǎng)絡(luò)算法模型,主要過程為:首先對數(shù)據(jù)進(jìn)行預(yù)處理,將數(shù)據(jù)歸一化再采用SOM聚類分別構(gòu)建各類數(shù)據(jù)集;其次構(gòu)建LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),輸入訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練;隨后,基于PSO算法優(yōu)化SOM-LSTM的網(wǎng)絡(luò)權(quán)重,帶入神經(jīng)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)預(yù)測;最后輸入溫度訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練,對未來附近時間段內(nèi)的溫度進(jìn)行預(yù)測,通過均方根誤差(RMSE)等指標(biāo)來衡量實驗結(jié)果。
競爭學(xué)習(xí)規(guī)則的學(xué)習(xí)步驟如下:
(3)網(wǎng)絡(luò)輸出與權(quán)調(diào)整。按WTA學(xué)習(xí)法則,獲勝神經(jīng)元輸出為“1”,其余的神經(jīng)元均為0,如下:
式(5)中,為學(xué)習(xí)效率,區(qū)間為[0,1]。
(4)重新歸一化處理。權(quán)向量經(jīng)過調(diào)整后得到新的向量,與之前的并不相同,因此要對該新向量重新歸一化,直到學(xué)習(xí)率衰減到0。
LSTM算法本質(zhì)上是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種特殊模型,用來處理RNN訓(xùn)練過程中梯度消失和梯度爆炸的問題。其關(guān)鍵為細(xì)胞狀態(tài)cell。如圖3所示,LSTM擁有三個門來保護(hù)和控制細(xì)胞狀態(tài)。三個門分別為輸入門、遺忘門和輸出門。
圖3 標(biāo)準(zhǔn)LSTM細(xì)胞結(jié)構(gòu)圖
2.2.1 遺忘門。遺忘門會讀取h和x,輸出一個區(qū)間在[0,1]的數(shù)值,分配在每個細(xì)胞狀態(tài)C中。1為保留,0為舍棄。
其中,h表示上一個細(xì)胞輸出,x為當(dāng)前細(xì)胞的輸入。為一個向量,表示讓對應(yīng)信息通過的權(quán)重。
2.2.2 輸入門。LSTM中第二步是決定讓多少新的信息加入到cell狀態(tài)中來。此過程包括兩個步驟:
(1)層為“輸入門層”,決定哪些信息將要更新;
更新舊cell狀態(tài),C更新為C,新的候選值為:
2.2.3 輸出門。LSTM中的最后一步是確定輸出什么值。此值基于cell狀態(tài),也是一個過濾后的值。運行式(11)確定細(xì)胞狀態(tài)的哪個部分將會輸出。通過tanh對cell狀態(tài)進(jìn)行處理。
構(gòu)建SOM-LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),輸入溫度訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練,同時對未來附近時間段的室內(nèi)溫度進(jìn)行預(yù)測??傮w算法流程如圖4所示。
圖4 SOM-LSTM總體算法流程圖
粒子群算法是一種仿生群體智能算法,該算法將每個解都看作鳥群中的一個獨立個體——“粒子”,每個粒子都有對應(yīng)優(yōu)化目標(biāo)的適應(yīng)值,因此,該算法的評價指標(biāo)為適應(yīng)值。由于PSO算法不用設(shè)置眾多參數(shù)且簡單易實現(xiàn),因此,本文采用PSO算法優(yōu)化LSTM,PSO算法的編碼過程見表1。
表1 PSO算法偽代碼
用PSO算法優(yōu)化SOM-LSTM神經(jīng)網(wǎng)絡(luò)的具體流程如圖5所示。
圖5 粒子群算法優(yōu)化流程圖
本文采用均方誤差(MSE)、均方根誤差(RMSE)、相對誤差和判定系數(shù)()等評價指標(biāo)來衡量實驗結(jié)果,以上評價指標(biāo)為預(yù)測領(lǐng)域常用的評價指標(biāo)。
式中,y()為預(yù)測溫度,y()為真實溫度,y為真實溫度的均值。通常,值越大,值越小,則預(yù)測的結(jié)果就越準(zhǔn)確。
為了驗證PSO-SOM-LSTM方法的可行性,本文將該方法與LSTM、BP和SOM-LSTM神經(jīng)網(wǎng)絡(luò)算法預(yù)測效果進(jìn)行了比較。采用MATLAB編程環(huán)境搭建并訓(xùn)練算法模型,本次實驗選取136個真實數(shù)據(jù)為采樣點,對不同的算法進(jìn)行對比。其中,SOM-LSTM的梯度閾值設(shè)置為1,指定初始學(xué)習(xí)率0.002,在100輪訓(xùn)練后乘以因子0.2。圖6為三種不同方法的溫度預(yù)測效果。
圖6 不同算法下的溫度預(yù)測值
由圖6可以看出:BP神經(jīng)網(wǎng)絡(luò)在拐點處溫度預(yù)測誤差較大,預(yù)測結(jié)果具有不穩(wěn)定性。LSTM和SOMLSTM都具有良好的穩(wěn)定預(yù)測效果,但是預(yù)測值有偏差,相比于LSTM和SOM-LSTM,PSO-SOM-LSTM算法的預(yù)測值更貼近真實值,預(yù)測結(jié)果更為準(zhǔn)確,因此采取PSO-SOM-LSTM算法對未來一段時間內(nèi)的溫度進(jìn)行預(yù)測是最優(yōu)的。
由于采取PSO-SOM-LSTM算法對未來一段時間內(nèi)的溫度進(jìn)行預(yù)測是最優(yōu)的,為保障算法的適用性,隨機(jī)選取倉庫內(nèi)某處的傳感器,對同一個傳感器未來時間段內(nèi)的溫度數(shù)據(jù)進(jìn)行預(yù)測,選取285個數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),預(yù)測附近未來30個數(shù)據(jù)點,結(jié)果如圖7所示。其中實線為訓(xùn)練值,虛線為真實值,星號線為預(yù)測出的溫度數(shù)據(jù):
圖7 基于PSO-SOM-LSTM的預(yù)測溫度結(jié)果
通過具體的相對誤差指標(biāo)分析預(yù)測的溫度數(shù)據(jù),圖8為相對誤差折線圖,可以看出預(yù)測的相對誤差主要集中在[-0.005,0.005]區(qū)間內(nèi),誤差區(qū)間范圍較小,在0.5%以內(nèi)。
圖8 基于PSO-SOM-LSTM預(yù)測溫度的相對誤差圖
本文提出的算法與其他預(yù)測方法的預(yù)測誤差對比見表2,由表2可以看出,BP預(yù)測效果最差,誤差最大,PSO-SOM-LSTM的誤差最小,預(yù)測結(jié)果最好。在RMS指標(biāo)下,PSO-SOM-LSTM比SOM-LSTM減少了2.46%,比單一神經(jīng)網(wǎng)絡(luò)減少了8.94%,具有較優(yōu)的預(yù)測效果。
表2 不同算法的預(yù)測對比
片煙倉儲堆垛內(nèi)部溫濕度環(huán)境對片煙的醇化效果有很大的關(guān)聯(lián)性,如果能有效預(yù)測出未來某短時間內(nèi)的倉儲溫度,即可對片煙儲存進(jìn)行有效管理,能極大地提高片煙精準(zhǔn)監(jiān)測水平,如何對倉儲空間內(nèi)部的溫濕度進(jìn)行精準(zhǔn)監(jiān)控和預(yù)測,是片煙養(yǎng)護(hù)的一項重要工作。本文提出了基于粒子群算法的混合長短記憶模型(PSO-SOM-LSTM),首先對數(shù)據(jù)進(jìn)行預(yù)處理,將數(shù)據(jù)歸一化再采用SOM聚類分別構(gòu)建各類數(shù)據(jù)集;其次構(gòu)建LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),輸入訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練;隨后,基于PSO算法優(yōu)化SOM-LSTM的網(wǎng)絡(luò)權(quán)重,帶入神經(jīng)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)預(yù)測,并與四種不同的預(yù)測方法進(jìn)行對比,證明了PSO-SOM-LSTM算法的優(yōu)越性;最后通過均方根誤差(RMSE)等指標(biāo)來衡量實驗結(jié)果,計算出均方根誤差為0.043 5左右。實驗結(jié)果證明,通過PSO-SOM-LSTM模型算法優(yōu)于本文所提到的其他算法,在實際倉儲中能有效實現(xiàn)對未來某時間段內(nèi)的溫濕度進(jìn)行精準(zhǔn)預(yù)測的目的。