張丹鋒
(青海省交通建設(shè)管理有限公司, 西寧 810001)
隧道開(kāi)挖過(guò)程中可能會(huì)穿越油氣盆地、煤系地層等瓦斯聚集帶,一旦發(fā)生瓦斯泄露,極易發(fā)生窒息、爆炸等安全事故[1-2]。因此,在含煤地層中修建隧道時(shí),準(zhǔn)確預(yù)測(cè)瓦斯等有毒氣體濃度,可減少安全事故的發(fā)生、保障施工人員的生命安全[3]。
瓦斯?jié)舛鹊念A(yù)測(cè)是瓦斯防治技術(shù)中一個(gè)非常重要的組成部分,目前國(guó)內(nèi)外眾多學(xué)者對(duì)其開(kāi)展了廣泛研究,并取得了顯著成果。傳統(tǒng)的瓦斯?jié)舛阮A(yù)測(cè)主要有礦山統(tǒng)計(jì)法[4]、地質(zhì)教學(xué)模型法[5]等利用數(shù)理統(tǒng)計(jì)理論建立的模型與方法。但這些傳統(tǒng)預(yù)測(cè)構(gòu)建的模型簡(jiǎn)單,在處理非線性、非平穩(wěn)的時(shí)間序列時(shí)極易產(chǎn)生較大誤差。隨著計(jì)算機(jī)信息技術(shù)的發(fā)展,機(jī)器學(xué)習(xí)在時(shí)間序列預(yù)測(cè)領(lǐng)域受到廣泛關(guān)注。黃潤(rùn)蘭等[6]采用支持向量機(jī)SVM(Support Vector Machine)在短期風(fēng)速預(yù)測(cè)方面很實(shí)用;吳奉亮等[7]采用隨機(jī)森林RF(Random Forest)模型在煤礦瓦斯涌出量預(yù)測(cè)方面獲得了較高的預(yù)測(cè)精度。長(zhǎng)短期記憶網(wǎng)絡(luò)LSTM(Long Short-Term Memory)是一種循環(huán)神經(jīng)網(wǎng)絡(luò),通過(guò)自身結(jié)構(gòu)的特殊化設(shè)計(jì),針對(duì)時(shí)間序列模型建模能力較強(qiáng),且適合處理與時(shí)間序列高度相關(guān)的問(wèn)題[8-9]。李偉山等[10]采用LSTM模型在煤礦瓦斯預(yù)測(cè)中得到了較高的準(zhǔn)確度;Nelson等[11]指出,LSTM是一個(gè)適合時(shí)間序列的模型,同時(shí)比其他機(jī)器學(xué)習(xí)模型如隨機(jī)森林、多層感知器和偽隨機(jī)模型提供更精確的結(jié)果。
盡管使用單一預(yù)測(cè)模型有助于數(shù)據(jù)分析,但對(duì)一些不穩(wěn)定和隨機(jī)性很強(qiáng)的時(shí)間序列,其分析和預(yù)測(cè)有一定的局限性。為解決此問(wèn)題,可使用頻率分解法降低數(shù)據(jù)序列的復(fù)雜性:先將非平穩(wěn)的信號(hào)分解成若干不同頻率的單一信號(hào),后把各單一信號(hào)的預(yù)測(cè)值進(jìn)行疊加,這種混合模型的預(yù)測(cè)精度較單一模型有所提高[12]。代巍等[13]基于變分模態(tài)分解VMD(Variational Mode Decomposition)、差分進(jìn)化DE(Differential Evolution)算法和相關(guān)向量機(jī)RVM(Relevance Vector Machine)原理預(yù)測(cè)了瓦斯涌出量;撒占友等[14]基于經(jīng)驗(yàn)?zāi)B(tài)分解EMD(Empirical Mode Decomposition)和自回歸滑動(dòng)平均模型ARMA(Auto-Regressive and Moving Average)預(yù)測(cè)了瓦斯涌出量;趙振學(xué)[15]基于經(jīng)驗(yàn)?zāi)B(tài)分解技術(shù)和極限學(xué)習(xí)機(jī)ELM(Extreme Learning Machine)預(yù)測(cè)了瓦斯?jié)舛取I鲜鲅芯拷Y(jié)果表明,組合模型的誤差值低于其他模型,對(duì)瓦斯?jié)舛鹊念A(yù)測(cè)精度更高。趙會(huì)茹等[16]采用基于互補(bǔ)集合經(jīng)驗(yàn)?zāi)B(tài)分解CEEMD(Coplementary Ensemble Empirical Mode Decomposition)和長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)構(gòu)建了應(yīng)用于短期電力負(fù)荷預(yù)測(cè)的CEEMD-LSTM模型,并取得了不錯(cuò)的效果。CEEMD可解決EMD分解帶來(lái)的模態(tài)混疊[17]現(xiàn)象、EEMD分解帶來(lái)的冗余噪聲影響。
針對(duì)現(xiàn)場(chǎng)瓦斯數(shù)據(jù)具有非線性、非平穩(wěn)性、復(fù)雜性的特點(diǎn),本文提出了一種基于互補(bǔ)集成經(jīng)驗(yàn)?zāi)B(tài)分解和長(zhǎng)短期記憶網(wǎng)絡(luò)結(jié)合的預(yù)測(cè)方法,并以某穿煤隧道現(xiàn)場(chǎng)實(shí)時(shí)監(jiān)測(cè)的瓦斯?jié)舛葦?shù)據(jù)為研究對(duì)象,先運(yùn)用CEEMD將其分解為具有不同特征的子序列分量,以降低瓦斯時(shí)間序列的復(fù)雜度和非線性對(duì)預(yù)測(cè)準(zhǔn)確性的影響;后對(duì)分解后的各子序列分別建立LSTM網(wǎng)絡(luò)模型進(jìn)行單步預(yù)測(cè);再疊加各子序列預(yù)測(cè)結(jié)果,得到隧道瓦斯?jié)舛茸罱K預(yù)測(cè)值。
國(guó)道569曼德拉至大通公路小沙河(甘青界)至大通段公路是青海省重要的北部出口通道之一。祁連山2#隧道位于青海省門源縣仙米鄉(xiāng),長(zhǎng)約6 000 m,隧址區(qū)海拔高程約3 500 m,為典型的高海拔特長(zhǎng)公路隧道,是曼大公路小大段的控制性工程。祁連山2#隧道進(jìn)口端圍巖為強(qiáng)-中風(fēng)化炭質(zhì)頁(yè)巖(含煤線)與砂巖互層,巖體較破碎,泥質(zhì)結(jié)構(gòu),薄層狀構(gòu)造,主要礦物為泥質(zhì)礦物。該段圍巖節(jié)理、裂隙發(fā)育,巖體破碎,呈碎裂結(jié)構(gòu),圍巖穩(wěn)定性較差。根據(jù)瓦斯評(píng)價(jià)結(jié)果顯示:從單項(xiàng)指標(biāo)判斷,瓦斯含量較小,屬低瓦斯隧道,但煤層頂?shù)装鍑鷰r較破碎,有逸散突出危險(xiǎn),施工圖設(shè)計(jì)判定為低瓦斯區(qū)段。
2019年1月9日,在隧道左洞ZK37+845掌子面施工超前地質(zhì)鉆孔時(shí),左右側(cè)距底板2 m位置處施工的鉆孔鉆進(jìn)至2.5 m時(shí),突然出現(xiàn)水汽噴涌現(xiàn)象,左側(cè)鉆孔噴出2.5 m遠(yuǎn),右側(cè)鉆孔噴出約1 m遠(yuǎn),在噴涌水汽的鉆孔口檢測(cè)到硫化氫和瓦斯?jié)舛确謩e高達(dá)100 ppm和2.5%。經(jīng)中煤科工集團(tuán)重慶研究院有限公司鑒定:該隧道瓦斯等級(jí)鑒定結(jié)果為高瓦斯隧道。根據(jù)資料估測(cè),該隧道后續(xù)左右洞將還各有1 400多m甚至更長(zhǎng)段落高瓦斯區(qū)域,祁連山2#隧道進(jìn)口段和掌子面煤層如圖1所示。
(a) 隧道進(jìn)口
互補(bǔ)集合經(jīng)驗(yàn)?zāi)B(tài)分解是由經(jīng)驗(yàn)?zāi)B(tài)分解、集合經(jīng)驗(yàn)?zāi)B(tài)CEEMD(Complementary Ensemble Empirical Mode Decomposition)分解改進(jìn)而來(lái)的一種信號(hào)分解方法[18]。CEEMD通過(guò)在原始信號(hào)中添加一對(duì)獨(dú)立同分布但符號(hào)相反的白噪聲序列,能夠減少原始信號(hào)中殘留的輔助噪聲,同時(shí)能克服模態(tài)混疊現(xiàn)象。分解步驟如下:
1) 在原始信號(hào)中加入n組符合相反的噪聲信號(hào),表達(dá)式為:
pi+(t)=x(t)+ni+(t)
pi-(t)=x(t)+ni-(t)
(1)
2) 對(duì)合成信號(hào)進(jìn)行經(jīng)驗(yàn)?zāi)B(tài)分解,可以得到pi+(t)、pi-(t)的第k個(gè)本征模態(tài)分量為Fik與F-ik。將各模態(tài)分量與殘差分量的平均值作為分解結(jié)果,表達(dá)式為:
(2)
(3)
式中:x(t)為待分解的原始信號(hào);ni+、ni-為符號(hào)相反的白噪聲序列;Ik(t)為第k個(gè)本征模態(tài)分量;Re(t)為最終的殘差分量。
長(zhǎng)短期記憶網(wǎng)絡(luò)是一種改進(jìn)后的循環(huán)神經(jīng)網(wǎng)絡(luò)RNN(Recurrent Neural Network),克服了RNN的梯度消失或爆炸問(wèn)題,其隱含層結(jié)構(gòu)如圖2所示。
圖2 LSTM隱含層結(jié)構(gòu)
細(xì)胞狀態(tài)(cell state)是神經(jīng)網(wǎng)絡(luò)模塊的關(guān)鍵,LSTM通過(guò)3個(gè)“門”來(lái)保護(hù)和控制細(xì)胞狀態(tài)[19]。
1) 遺忘門。它決定從細(xì)胞狀態(tài)Ct-1中丟棄什么信息。ft=0表示完全舍棄,ft=1表示完全保留,表達(dá)式為:
ft=σ(Wf·[ht-1,xt]+bf)
(4)
it=σ(Wi·[ht-1,xt]+bi)
(5)
(6)
接著就是對(duì)細(xì)胞狀態(tài)進(jìn)行更新,得到一個(gè)新的細(xì)胞狀態(tài)Ct,表達(dá)式為:
(7)
3) 輸出門。確定輸出值ht:(1) 運(yùn)行一個(gè)sigmoid層來(lái)確定隱藏狀態(tài)的哪部分將輸出;(2) 細(xì)胞狀態(tài)通過(guò)tanh進(jìn)行處理(得到一個(gè)在-1到1之間的值),并將它和sigmoid門的輸出相乘,最終輸出該部分,表達(dá)式為:
ot=σ(Wo·[ht-1,xt]+bo)
(8)
ht=ot*tanh(Ct)
(9)
式中:Wf、Wi、Wo以及bf、bi、bo分別為神經(jīng)單元遺忘門、輸入門、輸出門的權(quán)重矩陣和偏置值;ft、it、ot分別為t時(shí)刻遺忘門、輸入門、輸出門的輸出向量;σ為sigmoid激活函數(shù);tanh為雙曲正切激活函數(shù)。
在上述理論基礎(chǔ)上,本文提出了基于CEEMD-LSTM組合模型對(duì)瓦斯的預(yù)測(cè)方法。該模型先對(duì)瓦斯時(shí)間序列運(yùn)用CEEMD將其分解為本征模態(tài)函數(shù)IMF(Intrinsic Mode Function)序列和殘差序列,后對(duì)分解后的各序列分別建立LSTM模型,再疊加各序列預(yù)測(cè)結(jié)果。CEEMD-LSTM模型預(yù)測(cè)流程如圖3所示。
圖3 CEEMD-LSTM組合模型預(yù)測(cè)流程
瓦斯?jié)舛葦?shù)據(jù)取自寧纏隧道同一煤層掌子面處,利用自動(dòng)監(jiān)控系統(tǒng)實(shí)時(shí)采集的風(fēng)排瓦斯?jié)舛?采樣時(shí)間為2022年4月1日至2022年4月30日,現(xiàn)場(chǎng)監(jiān)測(cè)數(shù)據(jù)間隔為1 h,共計(jì)720 h。受現(xiàn)場(chǎng)復(fù)雜作業(yè)環(huán)境影響,原始數(shù)據(jù)序列波動(dòng)性大,復(fù)雜程度高,且有異常值和缺失值。為減少數(shù)據(jù)異常對(duì)預(yù)測(cè)模型性能的影響,采用3次樣條插值法補(bǔ)充缺失值和修正異常值。一共有720個(gè)數(shù)據(jù)集,其中70%作為訓(xùn)練集用于網(wǎng)絡(luò)訓(xùn)練,剩余30%作為測(cè)試集用于樣本外預(yù)測(cè),即504個(gè)訓(xùn)練集、216個(gè)測(cè)試集,如圖4所示。
圖4 瓦斯數(shù)據(jù)樣本
由于隧道瓦斯?jié)舛鹊脑紩r(shí)間序列有很強(qiáng)的非穩(wěn)定性及非線性,序列的復(fù)雜程度較高,因此采用CEEMD方法對(duì)原始時(shí)間序列數(shù)據(jù)進(jìn)行分解,得到子序列IMF1、IMF2、IMF3以及殘差RES,分解結(jié)果如圖5所示。
圖5 瓦斯時(shí)間序列模態(tài)分解曲線
關(guān)鍵參數(shù)的選取會(huì)很大地影響LSTM模型的訓(xùn)練效果,本文所構(gòu)建的LSTM預(yù)測(cè)模型的參數(shù)主要包括:訓(xùn)練次數(shù)(epoch),批尺寸(batch size),隱含節(jié)點(diǎn)數(shù)(hidden_size),隱含層數(shù)(layer_size),隱含層神經(jīng)元個(gè)數(shù)(rnn unit),隨機(jī)失活率(dropout),輸入步長(zhǎng)(input step),輸出步長(zhǎng)(output step)。其中,為提高模型優(yōu)化效果,輸出步長(zhǎng)選1,即為單步預(yù)測(cè)[20];其余主要參數(shù)選用網(wǎng)格搜索法的方式對(duì)進(jìn)行模型訓(xùn)練,超參數(shù)選取如表1所示。
表1 超參數(shù)選擇情況
LSTM預(yù)測(cè)模型為單隱含層和Dense全連接層構(gòu)成,LSTM層后設(shè)置dropout層以防止過(guò)擬合,訓(xùn)練優(yōu)化算法采用Adam。
對(duì)于預(yù)測(cè)模型的檢驗(yàn),采用均方根誤差RMSE(Root Mean Squared Error)和平均絕對(duì)誤差MAE(Mean Absolute Error)作為評(píng)價(jià)指標(biāo)。RMSE和MAE指標(biāo)值均表示樣本的離散程度,數(shù)值越小則表明預(yù)測(cè)的效果越好。各誤差計(jì)算方法如下:
(10)
(11)
為驗(yàn)證所提的CEEMD-LSTM方法具有更好的預(yù)測(cè)性能,引入一些其他預(yù)測(cè)模型進(jìn)行對(duì)比。單一預(yù)測(cè)模型有MLP、SVR、GRU和LSTM,不同類分解方法的組合模型有EMD-MLP、EMD-SVR、EMD-GU和EMD-LSTM,同類分解方法的組合模型有CEEMD-MLP、CEEMD-SVR和CEEMD-GRU,并對(duì)結(jié)果進(jìn)行分析。
4種單一模型各自作用下的瓦斯?jié)舛阮A(yù)測(cè)結(jié)果如圖6所示。由圖6可以看出,未對(duì)原始時(shí)間序列分解前,使用單一模型對(duì)瓦斯?jié)舛冗M(jìn)行預(yù)測(cè)的曲線與實(shí)際瓦斯?jié)舛惹€具有非常相似的形狀,且在圖6(b)中對(duì)預(yù)測(cè)曲線局部放大后可以看出,預(yù)測(cè)曲線滯后于真實(shí)曲線,且當(dāng)前時(shí)刻的預(yù)測(cè)值幾乎等于上一時(shí)刻的真實(shí)值,產(chǎn)生這種現(xiàn)象可能因時(shí)間序列的非平穩(wěn)性所致。
(a) 單一模型預(yù)測(cè)曲線
4種單一模型各自作用下的瓦斯?jié)舛阮A(yù)測(cè)誤差值如表2所示。由表2可以看出,LSTM預(yù)測(cè)模型的準(zhǔn)確度高于GRU、SVR和MLP,LSTM模型的RMSE指標(biāo)相對(duì)于GRU、SVR和MLP分別降低了4.82%、5.73%和13.38%,MAE指標(biāo)分別降低了8.71%、23.72%和33.72%。
表2 單一模型預(yù)測(cè)誤差
為解決單一預(yù)測(cè)模型出現(xiàn)預(yù)測(cè)值滯后的問(wèn)題,需對(duì)時(shí)間序列進(jìn)行平穩(wěn)性處理。因此,先采用EMD、CEEMD分解算法對(duì)時(shí)間序列進(jìn)行分解,得到序列imf及殘差;后對(duì)各分量數(shù)據(jù)分別與單一模型結(jié)合預(yù)測(cè);再將各分量預(yù)測(cè)結(jié)果進(jìn)行疊加,得到最終的預(yù)測(cè)結(jié)果。
EMD、CEEMD與4種單一模型組合作用下的瓦斯?jié)舛阮A(yù)測(cè)結(jié)果如圖7、圖8所示。由圖7、圖8可以看出,EMD和CEEMD混合模型沒(méi)有出現(xiàn)單一模型預(yù)測(cè)曲線滯后的現(xiàn)象,EMD混合模型的預(yù)測(cè)效果相較單一模型有所提升,而CEEMD混合模型的預(yù)測(cè)效果相較單一模型提升的效果更加顯著。
(a) EMD與單一模型組合預(yù)測(cè)曲線
(a) CEEMD與單一模型組合預(yù)測(cè)曲線
EMD與4種單一模型組合作用下的瓦斯?jié)舛阮A(yù)測(cè)誤差值如表3所示。結(jié)合圖7和表3可以看出,EMD-LSTM模型相較EMD-GRU、EMD-SVR和EMD-MLP有更高的預(yù)測(cè)準(zhǔn)確度,其RMSE指標(biāo)分別降低了7.89%、2.12%和27.84%,MAE指標(biāo)分別降低了5.50%、24.26%和37.95%。
表3 EMD組合模型預(yù)測(cè)誤差
CEEMD與4種單一模型組合作用下的瓦斯?jié)舛阮A(yù)測(cè)誤差值如表4所示。結(jié)合圖8和表4可以看出,CEEMD-LSTM模型相較CEEMD-GRU、CEEMD-SVR和CEEMD-MLP有更高的準(zhǔn)確度,其RMSE指標(biāo)分別降低了5.65%、10.34%和24.27%,MAE指標(biāo)分別降低了5.98%、17.22%和26.29%。
表4 CEEMD組合模型預(yù)測(cè)誤差
為驗(yàn)證CEEMD-LSTM模型的準(zhǔn)確性,將其與分解前的LSTM模型與其他分解法的EMD-LSTM模型做進(jìn)一步對(duì)比。
LSTM模型與其2種組合模型作用下的瓦斯?jié)舛阮A(yù)測(cè)對(duì)比情況如圖9、表5所示。結(jié)合圖9、表5可以看出,CEEMD-LSTM相較LSTM和EMD-LSTM有更高的準(zhǔn)確度,其RMSE指標(biāo)分別降低了40.76%、12.36%,MAE指標(biāo)分別降低了38.87%、16.02%,這也反映出單一模型對(duì)多因素影響下的瓦斯?jié)舛确瞧椒€(wěn)時(shí)間序列的自適應(yīng)性較弱。采用EMD分解監(jiān)測(cè)數(shù)據(jù),可考慮不同影響條件下的瓦斯?jié)舛茸兓?guī)律,通過(guò)本征模量表達(dá)數(shù)據(jù)本質(zhì)特征,預(yù)測(cè)重構(gòu)模型精度高于單一模型;CEEMD可克服EMD模態(tài)混疊現(xiàn)象,進(jìn)一步提高對(duì)瓦斯?jié)舛鹊念A(yù)測(cè)效果。
表5 LSTM單一模型與組合模型對(duì)比誤差
(a) 分解前后預(yù)測(cè)效果對(duì)比
針對(duì)現(xiàn)場(chǎng)瓦斯數(shù)據(jù)具有非線性、非平穩(wěn)性及復(fù)雜性的特點(diǎn),本文提出了一種基于互補(bǔ)集合經(jīng)驗(yàn)?zāi)B(tài)分解(CEEMD)與長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)組合模型的隧道瓦斯?jié)舛阮A(yù)測(cè)方法,通過(guò)對(duì)瓦斯?jié)舛葦?shù)據(jù)分解后的各子序列分別進(jìn)行單步預(yù)測(cè)并疊加獲得隧道瓦斯?jié)舛茸罱K預(yù)測(cè)值,得出如下結(jié)論:
1) 對(duì)于非線性、非平穩(wěn)性的時(shí)間序列,單一模型預(yù)測(cè)曲線與真實(shí)曲線具有相似的形狀,但預(yù)測(cè)曲線會(huì)滯后于真實(shí)曲線且任一時(shí)刻的預(yù)測(cè)值幾乎等于上一時(shí)刻的真實(shí)值。
2) CEEMD和EMD可將混有高頻噪音、隨機(jī)性強(qiáng)的原始瓦斯數(shù)據(jù)分解得到若干頻率由高到低的本征模態(tài)分量和殘差,降低了原始瓦斯時(shí)間序列的非平穩(wěn)性,改善了瓦斯數(shù)據(jù)質(zhì)量,其預(yù)測(cè)重構(gòu)模型精度會(huì)高于單一模型。但EMD存在模態(tài)混疊的問(wèn)題,而CEEMD可克服這一現(xiàn)象,并能進(jìn)一步地提高對(duì)瓦斯?jié)舛鹊念A(yù)測(cè)效果。
3) 構(gòu)建CEEMD-LSTM模型的RMSE和MAE指標(biāo)分別為0.023 4和0.017 3,其誤差值低于本文所提其他預(yù)測(cè)模型,這表明CEEMD-LSTM模型可有效運(yùn)用在隧道瓦斯領(lǐng)域的時(shí)間序列分析,為隧道的安全施工提供指導(dǎo)性的作用。
4) 采用互補(bǔ)集合經(jīng)驗(yàn)?zāi)B(tài)分解法,可更加全面地挖掘出隧道瓦斯?jié)舛鹊淖兓?guī)律,實(shí)現(xiàn)瓦斯?jié)舛鹊木珳?zhǔn)預(yù)測(cè),為瓦斯隧道的安全施工提供重要理論依據(jù)。