李文乾, 吳云桓, 吳兢業(yè), 陳治懷, 謝森林, , 胡安峰,
1)中鐵十局集團(tuán)城市軌道交通集團(tuán)有限公司,廣東廣州 511402;2)浙江大學(xué)建筑工程學(xué)院,浙江杭州 310058;3)濱海和城市巖土工程研究中心,浙江杭州 310058
隨著中國城市化的快速進(jìn)行,城市地面交通越來越擁堵,為緩解該情況,城市交通建設(shè)的重點(diǎn)目前正逐步轉(zhuǎn)向地下空間[1-5].盾構(gòu)法具有對(duì)周圍環(huán)境擾動(dòng)小、施工時(shí)不影響地面交通等優(yōu)勢(shì),在地鐵建設(shè)中得到了廣泛應(yīng)用[6-8].然而,地鐵施工常面臨水文地質(zhì)條件復(fù)雜和地下管線通道密集等諸多方面的挑戰(zhàn),隧道掘進(jìn)的安全控制對(duì)盾構(gòu)機(jī)駕駛員經(jīng)驗(yàn)提出了較高要求[9-11].因此,建立有效的盾構(gòu)掘進(jìn)施工參數(shù)預(yù)測(cè)模型具有重要的應(yīng)用價(jià)值[12-13].
目前針對(duì)隧道掘進(jìn)參數(shù)的研究已有較多成果.夏毅敏等[14]采用數(shù)理統(tǒng)計(jì)的方法探究了硅質(zhì)巖地層和糜棱巖地層等不同地層條件下刀盤轉(zhuǎn)速、總推力與推進(jìn)速度的相關(guān)性,為隧道掘進(jìn)提供了合理參考.鄭剛等[15]通過盾構(gòu)機(jī)掘進(jìn)參數(shù)對(duì)地表沉降影響敏感度的分析,得出各個(gè)掘進(jìn)參數(shù)導(dǎo)致地表沉降的風(fēng)險(xiǎn)大小.張厚美[16]編制了全斷面隧道掘進(jìn)機(jī)(tunnel boring machine, TBM)掘進(jìn)性能的數(shù)值計(jì)算程序,可對(duì)刀盤扭矩和推力等參數(shù)進(jìn)行計(jì)算.邱明明等[17]借助數(shù)值仿真建立了三維盾構(gòu)施工有限差分計(jì)算模型,給出了盾構(gòu)施工引起的地層變形三維地層損失預(yù)測(cè)方法,并對(duì)盾構(gòu)施工地層豎向變形及水平變形計(jì)算結(jié)果進(jìn)行對(duì)比分析.宋洋等[18]通過開展室內(nèi)相似試驗(yàn)對(duì)現(xiàn)場盾構(gòu)下穿前的掘進(jìn)參數(shù)進(jìn)行優(yōu)化研究,發(fā)現(xiàn)掘進(jìn)參數(shù)在全斷面泥巖地層中波動(dòng)范圍較大,其中刀盤扭矩和總推力尤為明顯.袁炳祥等[19-20]結(jié)合粒子圖像測(cè)速儀(particle image velocimetry, PIV)技術(shù)開展了室內(nèi)模型試驗(yàn),研究了土層厚度及相對(duì)密實(shí)度對(duì)土-結(jié)構(gòu)復(fù)雜相互作用的影響.李超等[21]基于深圳地鐵11 號(hào)線兩個(gè)區(qū)間工程的數(shù)據(jù),構(gòu)建了可以在復(fù)合地層情況下預(yù)測(cè)掘進(jìn)參數(shù)的神經(jīng)網(wǎng)絡(luò).楊全亮[22]采用反向傳播(back propagation, BP)神經(jīng)網(wǎng)絡(luò)以及徑向基函數(shù)(radial basis function, RBF)神經(jīng)網(wǎng)絡(luò)分析掘進(jìn)參數(shù)的變化規(guī)律、搭建模型后,發(fā)現(xiàn)兩者精確度均較高,也可以互為補(bǔ)充.
上述有關(guān)隧道掘進(jìn)參數(shù)的研究大多采用數(shù)值模擬與室內(nèi)模型試驗(yàn)方法,無法真實(shí)還原地質(zhì)條件復(fù)雜的現(xiàn)場隧道掘進(jìn)條件,部分掘進(jìn)參數(shù)研究中使用的神經(jīng)網(wǎng)絡(luò)模型架構(gòu)也較為簡單,軟土條件下針對(duì)隧道掘進(jìn)參數(shù)智能預(yù)測(cè)的研究還未見報(bào)道.深度學(xué)習(xí)網(wǎng)絡(luò)具有強(qiáng)大的自適應(yīng)學(xué)習(xí)能力和非線性映射能力,能解決傳統(tǒng)機(jī)器學(xué)習(xí)或優(yōu)化算法在處理模糊、不確定信息問題中的預(yù)測(cè)效果差和迭代速度慢等弊端,因此在地下工程中得到了大量的應(yīng)用[23-24].鑒于此,本研究以杭州機(jī)場軌道快線某標(biāo)段為工程背景,利用深度學(xué)習(xí)領(lǐng)域多層感知機(jī)技術(shù)建立盾構(gòu)掘進(jìn)參數(shù)預(yù)測(cè)模型,并對(duì)超參數(shù)組合進(jìn)行優(yōu)化,在已知地層條件的情況下對(duì)盾構(gòu)施工掘進(jìn)參數(shù)進(jìn)行預(yù)測(cè),并對(duì)預(yù)測(cè)結(jié)果進(jìn)行分析驗(yàn)證.
一般來說,深度學(xué)習(xí)的訓(xùn)練需要十萬乃至百萬級(jí)別以上的數(shù)據(jù)量,數(shù)據(jù)維度也更加多元.針對(duì)有限的隧道掘進(jìn)實(shí)測(cè)數(shù)據(jù)樣本,使用特征提取能力強(qiáng)大的深層神經(jīng)網(wǎng)絡(luò)會(huì)出現(xiàn)過擬合的現(xiàn)象. 因此,本研究選用如圖1所示的多層感知機(jī)網(wǎng)絡(luò)建立盾構(gòu)施工掘進(jìn)參數(shù)預(yù)測(cè)模型.其中,x1、x2、x3和x4均為輸入多層感知機(jī)的原始數(shù)據(jù).
圖1 多層感知機(jī)結(jié)構(gòu)示意圖Fig.1 Schematic diagram of multi-layer perceptron structure.
BP算法是適用于多層感知機(jī)的一種學(xué)習(xí)算法.圖2 為反向傳播算法示意圖.其中,第1 層是輸入層,含有2 個(gè)神經(jīng)元i1、i2和偏置b1;第2 層是隱藏層,含有2個(gè)神經(jīng)元h1、h2和偏置b2;第3層是輸出層,含2 個(gè)神經(jīng)元y1和y2,wi(i= 1, 2, …, 8)是層與層之間的權(quán)重,以修正線性單元 (rectified linear unit, ReLu) 為激活函數(shù).
圖2 反向傳播算法示意圖Fig.2 Schematic diagram of back propagation.
1)數(shù)據(jù)流的正向傳播. 神經(jīng)元h1的輸入加權(quán)和sh1為
神經(jīng)元h1的輸出為
隱藏層其他神經(jīng)元及輸出層神經(jīng)元計(jì)算同理.
2)誤差信息的反向傳播. 輸出總誤差為
其中,Ei為第i個(gè)輸出單元的預(yù)測(cè)誤差;為第i個(gè)輸出單元的預(yù)測(cè)值;yi為第i個(gè)輸出單元;n為輸出層神經(jīng)元數(shù)量.
以w5為例,對(duì)隱藏層至輸出層的權(quán)值進(jìn)行更新.w5對(duì)整體誤差的影響為
其中,sy1為yi的輸入加權(quán)和.對(duì)w5的權(quán)值進(jìn)行更新為
其中,η是學(xué)習(xí)速率.
以w1為例,對(duì)輸入層至隱藏層之間的權(quán)值進(jìn)行更新.
以上是反向傳播算法的計(jì)算思路.權(quán)重經(jīng)過更新后以新的權(quán)重計(jì)算,不斷迭代,直至誤差下降至允許范圍.
杭州機(jī)場軌道快線某標(biāo)段為單圓盾構(gòu)區(qū)間,區(qū)間起止為K26+811.147~K29+649.311,區(qū)間總長為2 838.184 m,設(shè)置3.985 m的短鏈,隧道間距為11.0~17.2 m,埋深為13.87~32.83 m,建立4 座聯(lián)絡(luò)通道.該施工段土層環(huán)境復(fù)雜,各土層主要土質(zhì)為:① 灰黃色和褐黃色黏土;② 灰黃色和褐黃色粉質(zhì)黏土夾粉土;③ 灰色淤泥質(zhì)粉質(zhì)黏土;④褐黃色粉質(zhì)黏土;⑤ 褐黃色粉質(zhì)黏土夾粉土.隧道直徑范圍內(nèi)土層的物理力學(xué)參數(shù)見表1,隧道與土層的位置關(guān)系可掃描論文末頁右下角二維碼,查看補(bǔ)充材料圖S1.
表1 土層的物理力學(xué)參數(shù)Table 1 Physical and mechanical parameters of soil layer
項(xiàng)目盾構(gòu)掘進(jìn)參數(shù)的原始臺(tái)賬共1 361 個(gè)數(shù)據(jù)樣本,其中包含有14 個(gè)特征.從參數(shù)重要性程度及提高模型性能的角度出發(fā),篩選其中相關(guān)程度較高的7 個(gè)特征(刀盤轉(zhuǎn)速、推進(jìn)速度、注漿量、注漿壓力、出土量、總推力和刀盤扭矩).結(jié)合土層占比和地基土物理力學(xué)性質(zhì),插值得到區(qū)間隧道直徑范圍內(nèi)土層的摩擦角、黏聚力、壓縮模量和重度4個(gè)特征.模型輸入?yún)?shù)為頂部埋深、摩擦角、黏聚力、壓縮模量、重度、刀盤轉(zhuǎn)速和推進(jìn)速度等7個(gè)特征.其中,隧道頂部埋深、摩擦角、黏聚力、壓縮模量、重度反映地層和隧道幾何特征等外部因素隨地質(zhì)條件與隧道選線方案的不同而變化.需特別指出的是,由于在全長范圍內(nèi)均不改變,隧道幾何特征中的隧道直徑和厚度未作為本模型的輸入?yún)?shù).刀盤轉(zhuǎn)速和推進(jìn)速度為反映了人為操作的外部因素,主要由盾構(gòu)司機(jī)根據(jù)施工計(jì)劃及進(jìn)度確定.模型輸出參數(shù)為注漿量、注漿壓力、出土量、總推力和刀盤扭矩等.訓(xùn)練集輸出參數(shù)的頻率分布如圖3.由圖3 可見,除出土量外,數(shù)據(jù)集樣本變化范圍均較大,且數(shù)據(jù)集中程度較為明顯,這主要是因?yàn)橛绊懚軜?gòu)機(jī)實(shí)際施工參數(shù)的因素較多,而盾構(gòu)機(jī)司機(jī)偏向于使用經(jīng)驗(yàn)判斷操作參數(shù),因而各項(xiàng)施工參數(shù)均表現(xiàn)出了一定的集中性.本研究所選用的數(shù)據(jù)集分布特征符合真實(shí)情況.
圖3 訓(xùn)練集輸出參數(shù)頻率分布直方圖 (a)注漿量; (b)注漿壓力; (c)出土量; (d)總推力; (e)刀盤扭矩Fig.3 Histogram of frequency distribution of training set output parameters. (a) Slurry volume, (b) slurry pressure, (c) soil discharge volume, (d) total thrust force, and (e) blade torque.
由于上述12個(gè)特征的數(shù)據(jù)取值范圍差異較大,直接在原始數(shù)據(jù)上訓(xùn)練模型一般會(huì)使得模型效果不佳,因此在數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò)之前需要進(jìn)行預(yù)處理,以滿足網(wǎng)絡(luò)對(duì)于取值范圍的要求,提高模型性能.本研究中不同地區(qū)土層性質(zhì)有較大的差別,樣本數(shù)據(jù)也會(huì)有較大變化,為保證數(shù)據(jù)集的分布特征,采用標(biāo)準(zhǔn)化的方法進(jìn)行特征縮放,即
其中,X為原始參數(shù);μ和σ分別為X的樣本均值與方差;X*為縮放后的各特征數(shù)值.
為避免信息泄露而造成不真實(shí)的預(yù)測(cè)效果,需要在一些數(shù)據(jù)被用于訓(xùn)練模型的同時(shí),留出一定比例的數(shù)據(jù)作為測(cè)試集用于最后模型的評(píng)估,還需要保留驗(yàn)證集對(duì)初步訓(xùn)練進(jìn)行驗(yàn)證.此外,在可用數(shù)據(jù)較少的情況下,模型的驗(yàn)證分?jǐn)?shù)將會(huì)隨著數(shù)據(jù)集劃分比例而有較大波動(dòng),無法對(duì)模型進(jìn)行可靠的評(píng)估.為此,本研究采取K折驗(yàn)證的方法對(duì)數(shù)據(jù)進(jìn)行充分利用.該方法的原理是實(shí)例化K個(gè)相同模型,將每個(gè)模型在K -1 個(gè)訓(xùn)練集分區(qū)上訓(xùn)練,并在剩余的1個(gè)驗(yàn)證集數(shù)據(jù)上進(jìn)行評(píng)估,模型的驗(yàn)證分?jǐn)?shù)等于K個(gè)驗(yàn)證分?jǐn)?shù)的平均值[25].圖4是本研究模型的訓(xùn)練、驗(yàn)證與測(cè)試過程的示意,K取為10.
圖4 留出法與K折交叉驗(yàn)證示意圖 (K = 10)Fig.4 Schematic diagram of cross validation between reserve method and K-fold (K = 10).
在建立多層感知機(jī)神經(jīng)網(wǎng)絡(luò)時(shí),為了防止過擬合現(xiàn)象的發(fā)生,需要留出一定比例的數(shù)據(jù)集作為測(cè)試集來評(píng)估訓(xùn)練模型的泛化效果,剩下的數(shù)據(jù)集分成訓(xùn)練集與驗(yàn)證集,在訓(xùn)練集上訓(xùn)練確定模型的權(quán)重與偏置參數(shù),用驗(yàn)證集來評(píng)估在訓(xùn)練集上初步得到的模型性能.本研究用于模型訓(xùn)練的樣本量為1 300,測(cè)試集數(shù)據(jù)樣本量為61,訓(xùn)練集與驗(yàn)證集的數(shù)量比為9∶1,訓(xùn)練集、驗(yàn)證集和測(cè)試集的數(shù)量比為1 170∶130∶61.需指出的是,測(cè)試集樣本對(duì)應(yīng)的襯砌環(huán)與訓(xùn)練模型使用的樣本襯砌環(huán)在縱向上不連續(xù),以確保模型在測(cè)試集上的預(yù)測(cè)效果真實(shí)反映網(wǎng)絡(luò)的泛化能力.
為增加數(shù)據(jù)的多樣性,減小數(shù)據(jù)集數(shù)據(jù)過少造成評(píng)價(jià)指標(biāo)波動(dòng)的影響,模型訓(xùn)練時(shí)采用K折交叉驗(yàn)證.將原始訓(xùn)練數(shù)據(jù)平均分成K份,每次取其中1份作為驗(yàn)證集,剩余的K -1份作為訓(xùn)練集,K次訓(xùn)練的平均誤差作為某超參數(shù)組合條件下的模型泛化誤差.
2.4.1 網(wǎng)絡(luò)結(jié)構(gòu)
為得到最佳性能表現(xiàn)的多層感知機(jī)預(yù)測(cè)模型,考慮如表2所示的超參數(shù)變化范圍并采用完全組合的方式進(jìn)行對(duì)比,共81 種情況.為減小梯度消失及加快網(wǎng)絡(luò)訓(xùn)練速度,激活函數(shù)選取ReLu,權(quán)重及偏置初始化分別采用默認(rèn)“random_uniform”和“zeros”方式.為保證獲得潛在的最佳模型起始權(quán)重參數(shù),不特別指定權(quán)重初始化隨機(jī)種子.
表2 多層感知機(jī)超參數(shù)選擇Table 2 Hyper-parameter selection of multi-layer perception machine
2.4.2 最佳超參數(shù)組合選取
最佳模型超參數(shù)定義為在驗(yàn)證集上誤差最小的一組模型超參數(shù),該誤差以平均絕對(duì)誤差(mean absolute error, MAE)表示,計(jì)算式為
圖5為不同隱藏層層數(shù)和學(xué)習(xí)率的模型在驗(yàn)證集數(shù)據(jù)上的表現(xiàn).其中,橫坐標(biāo)4組數(shù)字的含義為超參數(shù)組合,依次為隱藏層層數(shù)、訓(xùn)練輪次、批次和學(xué)習(xí)率;數(shù)據(jù)點(diǎn)表示在該組隱藏層層數(shù)和學(xué)習(xí)率條件下,具有最佳驗(yàn)證集預(yù)測(cè)表現(xiàn)的模型EMA值,該誤差為5 個(gè)輸出參數(shù)誤差的平均值.從圖5 可以看出,各模型最小預(yù)測(cè)誤差并不一致,隨隱藏層層數(shù)和學(xué)習(xí)率的變化而變化,具有最小驗(yàn)證集誤差的超參數(shù)組合為:隱藏層層數(shù)為3 層,訓(xùn)練輪數(shù)為200 輪,批次大小為64,學(xué)習(xí)率為0.001,記為3-200-64-0.001.
圖5 選擇最佳超參數(shù)組合Fig.5 Selection of the optimal hyper-parameter combination.
2.4.3 模型訓(xùn)練過程誤差
圖6為最佳超參數(shù)組合下多層感知機(jī)模型在訓(xùn)練過程中的平均絕對(duì)誤差,該誤差為K折交叉驗(yàn)證下的平均驗(yàn)證集誤差.從圖6可見,隨著訓(xùn)練輪次的增加,模型的預(yù)測(cè)值與真實(shí)值之間的誤差迅速減小并逐漸收斂至0.7左右,且訓(xùn)練過程中未出現(xiàn)過擬合現(xiàn)象,確保了模型的泛化能力.此外,由表2可知,最大訓(xùn)練輪次可達(dá)600,而最佳模型僅需200 次訓(xùn)練即獲得了最小的誤差,說明訓(xùn)練輪次并非越多越好,最佳的訓(xùn)練輪次應(yīng)通過分析數(shù)據(jù)量、訓(xùn)練時(shí)長和擬合情況初步確定,并通過驗(yàn)證集誤差最終確定.
圖6 最佳模型在訓(xùn)練過程中的平均絕對(duì)誤差Fig.6 Average absolute error of the best model in the training process.
使用前文多層感知機(jī)模型對(duì)盾構(gòu)隧道線路1 300~1 362環(huán)的掘進(jìn)數(shù)據(jù)進(jìn)行預(yù)測(cè),預(yù)測(cè)表現(xiàn)可掃描論文末頁右下角二維碼,查看補(bǔ)充材料圖S2.由圖S2 可見,本研究建立的多層感知機(jī)模型對(duì)注漿量、注漿壓力、出土量、總推力和刀盤扭矩的預(yù)測(cè)效果較好,預(yù)測(cè)值與真實(shí)值之間的相對(duì)誤差分別為1.85%、19.61%、0.77%、10.09%和13.03%,誤差均在20%以內(nèi).表3 為隨機(jī)取出的測(cè)試集中5環(huán)管片盾構(gòu)掘進(jìn)參數(shù)預(yù)測(cè)值與真實(shí)值之間的對(duì)比.由表3 可見,模型對(duì)各施工參數(shù)的預(yù)測(cè)效果較好.本研究模型具有較高的預(yù)測(cè)精度,可用于復(fù)合地層條件下同類型盾構(gòu)掘進(jìn)參數(shù)的預(yù)測(cè).
表3 盾構(gòu)掘進(jìn)參數(shù)預(yù)測(cè)值與真實(shí)值對(duì)比Table 3 Comparison between predicted and true values of shield tunneling parameters
依托杭州機(jī)場軌道快線某標(biāo)段的盾構(gòu)施工項(xiàng)目,構(gòu)建了基于深度學(xué)習(xí)領(lǐng)域多層感知機(jī)技術(shù)的盾構(gòu)掘進(jìn)參數(shù)預(yù)測(cè)模型,可知:
1)選用隧道頂部埋深、摩擦角、黏聚力、壓縮模量、重度、刀盤轉(zhuǎn)速和推進(jìn)速度等7個(gè)特征作為模型輸入?yún)?shù),不斷調(diào)整模型超參數(shù)可以實(shí)現(xiàn)注漿量、注漿壓力、出土量、總推力和刀盤扭矩等5個(gè)盾構(gòu)掘進(jìn)參數(shù)的準(zhǔn)確預(yù)測(cè).在7 項(xiàng)輸入?yún)?shù)中,隧道頂部埋深、摩擦角、黏聚力、壓縮模量、重度代表地層和隧道幾何特征等外部因素,刀盤轉(zhuǎn)速和推進(jìn)速度代表人為操作的外部因素.
2)超參數(shù)不同,多層感知機(jī)模型的預(yù)測(cè)性能也不同.為得到具有最佳預(yù)測(cè)表現(xiàn)的模型,需要不斷改變超參數(shù)組合并訓(xùn)練模型.同時(shí),為獲得潛在的最佳模型起始權(quán)重參數(shù),不應(yīng)指定權(quán)重初始化隨機(jī)種子.
3)使用本研究模型對(duì)注漿量、注漿壓力、出土量、總推力和刀盤扭矩進(jìn)行預(yù)測(cè),得到結(jié)果的平均誤差分別為1.85%、19.61%、0.77%、10.09%和13.03%,總體上具有較高的精度,可用于復(fù)合地層條件下類似工程盾構(gòu)掘進(jìn)參數(shù)的預(yù)測(cè).