劉明陽(yáng),余宏淦,陶建峰,覃程錦,高浩寒,劉成良
(上海交通大學(xué)機(jī)械與動(dòng)力工程學(xué)院,上海,200240)
作為一種隧道掘進(jìn)工程機(jī)械,土壓平衡盾構(gòu)機(jī)被廣泛應(yīng)用于鐵路、地鐵、公路等隧道工程中[1-2]。相比于鉆爆法、人工開(kāi)挖等方法,盾構(gòu)法受地層地質(zhì)影響較大。當(dāng)盾構(gòu)機(jī)運(yùn)行參數(shù)不能適應(yīng)當(dāng)前掘進(jìn)地層時(shí),可能出現(xiàn)盾構(gòu)機(jī)刀盤(pán)堵塞、盾體卡死和隧道塌陷等施工事故。實(shí)時(shí)準(zhǔn)確感知地質(zhì)類(lèi)型是選取合理的掘進(jìn)參數(shù)、保障施工安全的重要前提條件[3]。采用鉆孔測(cè)井法進(jìn)行傳統(tǒng)的地質(zhì)勘測(cè)。由于鉆孔深度有限,難以對(duì)深度較大的隧道進(jìn)行地質(zhì)測(cè)量。同時(shí),有限個(gè)數(shù)的鉆孔難以反映隧道所在地層地質(zhì)類(lèi)型的全貌。隨著地質(zhì)勘測(cè)技術(shù)的發(fā)展,出現(xiàn)了地震波勘測(cè)法、探地雷達(dá)法和聲波探測(cè)法等新方法[4]。這些方法存在成本較高、測(cè)量速度慢、受施工空間限制等問(wèn)題,在盾構(gòu)法中的應(yīng)用受到了限制。
盾構(gòu)機(jī)運(yùn)行參數(shù)與地質(zhì)之間具有密切的聯(lián)系,國(guó)內(nèi)外學(xué)者提出了使用盾構(gòu)機(jī)運(yùn)行參數(shù)識(shí)別掘進(jìn)地層土類(lèi)型的方法。HASSANPOUR 等[5-6]定義了基于掘進(jìn)機(jī)運(yùn)行參數(shù)的場(chǎng)切深指數(shù),用于表示圍巖等級(jí);WANG等[7]采用盾構(gòu)機(jī)運(yùn)行參數(shù)建立了地質(zhì)特征綜合指標(biāo)計(jì)算模型,使用地質(zhì)特征模型區(qū)分多個(gè)地質(zhì)特征組;SHATERPOUR 等[8]使用統(tǒng)計(jì)分析方法,研究了砂巖、石灰石和玄武巖3種巖石對(duì)盾構(gòu)機(jī)運(yùn)行時(shí)的總推力和刀盤(pán)轉(zhuǎn)矩的影響;邢彤等[9]采用場(chǎng)切深指數(shù)和扭矩切深指數(shù)建立了表示掘進(jìn)土層狀況的特征空間,實(shí)現(xiàn)了土層類(lèi)型判別;楊果林等[10]統(tǒng)計(jì)分析了主要施工參數(shù)在礫巖、砂卵石和泥巖3類(lèi)巖石中的分布及變化特征,研究了不同巖石中貫入度、場(chǎng)切入指數(shù)和掘進(jìn)比能三者間的變化關(guān)系,并預(yù)測(cè)了地層可掘性;宋克志等[11]將盾構(gòu)掘進(jìn)比推力和比扭矩作為表征圍巖狀況的指標(biāo),采用模糊識(shí)別規(guī)則識(shí)別圍巖類(lèi)型;張娜等[12]采用分步回歸和聚類(lèi)分析的方法建立了巖機(jī)關(guān)系模型,利用掘進(jìn)機(jī)運(yùn)行參數(shù)實(shí)時(shí)感知巖石強(qiáng)度、體積節(jié)理數(shù)和圍巖等級(jí)等參數(shù)。
近年來(lái),機(jī)器學(xué)習(xí)算法發(fā)展迅速。相比于傳統(tǒng)的分類(lèi)回歸算法,機(jī)器學(xué)習(xí)算法具有表達(dá)能力強(qiáng)、準(zhǔn)確率高等優(yōu)點(diǎn),很多學(xué)者將機(jī)器學(xué)習(xí)算法應(yīng)用于掘進(jìn)機(jī)掌子面地質(zhì)類(lèi)型預(yù)測(cè)中。ZHAO等[13]建立了ANN 算法模型,使用盾構(gòu)機(jī)運(yùn)行參數(shù)的一階、二階差分增強(qiáng)特征作為輸入,預(yù)測(cè)掘進(jìn)地層的地質(zhì)類(lèi)型。
ZHOU 等[14]采用復(fù)雜拓?fù)渚W(wǎng)絡(luò)方法,選取了136維盾構(gòu)機(jī)運(yùn)行參數(shù)作為網(wǎng)絡(luò)輸入,實(shí)現(xiàn)了掘進(jìn)地質(zhì)條件識(shí)別。ZHANG等[15]使用刀盤(pán)速度、刀盤(pán)扭矩、推力和前進(jìn)速度4個(gè)通道數(shù)據(jù)作為輸入,提出基于K-MEANS聚類(lèi)與支持向量分類(lèi)器的地質(zhì)條件預(yù)測(cè)模型;ZHANG等[16]通過(guò)獨(dú)立性檢驗(yàn)篩選得到的7 個(gè)與地質(zhì)類(lèi)型關(guān)系密切的盾構(gòu)機(jī)運(yùn)行參數(shù),并將其作為輸入,采用ANN,SVM和KNN這3種算法分別對(duì)地質(zhì)類(lèi)型進(jìn)行識(shí)別;劉建東等[17]建立神經(jīng)網(wǎng)絡(luò)模型,使用基于盾構(gòu)掘進(jìn)參數(shù)的修正掘進(jìn)比能作為輸入,識(shí)別盾構(gòu)掘進(jìn)過(guò)程中的孤石地層;朱北斗等[18]選取盾構(gòu)推進(jìn)力、推進(jìn)速度、刀盤(pán)扭矩和刀盤(pán)轉(zhuǎn)速共4 個(gè)掘進(jìn)參數(shù),使用BP 神經(jīng)網(wǎng)絡(luò)對(duì)3種典型地質(zhì)類(lèi)型進(jìn)行識(shí)別;宮思藝等[19]使用盾構(gòu)機(jī)總推力、刀盤(pán)扭矩、刀盤(pán)轉(zhuǎn)速、推進(jìn)速度和螺旋機(jī)轉(zhuǎn)速作為輸入,使用Xgboost算法識(shí)別軟土地層、軟硬交互地層和孤石地層;朱夢(mèng)琦等[20]利用總推進(jìn)力、刀盤(pán)功率、刀盤(pán)扭矩和推進(jìn)速度4個(gè)盾構(gòu)機(jī)運(yùn)行參數(shù)作為輸入,使用隨機(jī)森林和AdaCost算法,實(shí)現(xiàn)對(duì)圍巖等級(jí)的預(yù)測(cè);段志偉等[21]對(duì)不同圍巖下區(qū)分度較好的掘進(jìn)參數(shù)進(jìn)行PCA主成分分析,獲得表征圍巖可掘性等級(jí)的2個(gè)主成分指標(biāo),并構(gòu)建BP神經(jīng)網(wǎng)絡(luò),對(duì)圍巖可掘性等級(jí)進(jìn)行識(shí)別。
現(xiàn)有研究主要選擇總推力、刀盤(pán)轉(zhuǎn)矩等較少的運(yùn)行參數(shù)表征當(dāng)前掘進(jìn)地層的地質(zhì)特征。實(shí)際上,大量盾構(gòu)機(jī)運(yùn)行參數(shù)中蘊(yùn)含的地質(zhì)特征沒(méi)有被挖掘,容易造成信息損失,影響了模型識(shí)別的精度。當(dāng)選擇運(yùn)行參數(shù)輸入數(shù)量變多時(shí),又會(huì)造成模型訓(xùn)練速度慢、泛化能力差等問(wèn)題。為解決以上問(wèn)題,首先,分析眾多盾構(gòu)機(jī)運(yùn)行參數(shù)與地質(zhì)類(lèi)型的關(guān)系,篩選了與地質(zhì)相關(guān)的盾構(gòu)機(jī)運(yùn)行參數(shù);然后,采用LTSA算法對(duì)篩選的盾構(gòu)機(jī)運(yùn)行參數(shù)進(jìn)行數(shù)據(jù)降維,提取其中的稀疏低維特征;第三,將低維特征輸入Xgboost分類(lèi)模型中,實(shí)現(xiàn)掌子面地質(zhì)類(lèi)型識(shí)別;最后,利用新加坡某地鐵工程數(shù)據(jù)構(gòu)造了模型的訓(xùn)練集和測(cè)試集,證明所提方法的有效性。
本文中使用的盾構(gòu)機(jī)運(yùn)行數(shù)據(jù)來(lái)自新加坡大眾捷運(yùn)系統(tǒng)湯姆遜線地鐵麥?zhǔn)客尽侯D道站段隧道工程,隧道全程為710 m,共掘進(jìn)502 環(huán)。施工區(qū)間如圖1所示。隧道施工區(qū)域中存在海洋黏土、河床黏土、福康寧卵石地層、句容地層共4種地質(zhì)層,其中句容地層主要為高度風(fēng)化的IV 型和完全風(fēng)化的V 型。采用鉆孔測(cè)井法測(cè)量隧道施工區(qū)間的部分環(huán)所在地層的地質(zhì)類(lèi)型,測(cè)量結(jié)果如表1所示。
圖1 新加坡盾構(gòu)隧道工程施工區(qū)間Fig.1 Construction section of Singapore shield tunnel project
表1 地質(zhì)類(lèi)型與掘進(jìn)環(huán)號(hào)對(duì)應(yīng)Table 1 Correspondence between geological type and tunnel number
海洋黏土通常為非常軟的黏土,偶爾有貝殼碎片。河床黏土通常為堅(jiān)硬的砂質(zhì)粉砂或黏土。V類(lèi)型的句容地層為完全風(fēng)化的紫色、棕色、灰色的粉質(zhì)砂,IV 類(lèi)型為弱至中等強(qiáng)度、細(xì)至中粒度的高裂隙泥巖、粉砂巖或砂巖。經(jīng)過(guò)對(duì)鉆探土層樣本分析,得到各種地質(zhì)類(lèi)型的具體性質(zhì)如表2所示。
表2 典型地質(zhì)類(lèi)型性質(zhì)Table 2 Typical geotechnical type properties
該隧道工程采用6 700 mm 直徑的土壓平衡盾構(gòu)機(jī)挖掘,盾構(gòu)機(jī)主要設(shè)備參數(shù)如表3所示。盾構(gòu)機(jī)上安裝有數(shù)據(jù)采集系統(tǒng),每隔5 s采集1 465個(gè)傳感器參數(shù)和機(jī)器運(yùn)行參數(shù)。0~502環(huán)部分掘進(jìn)數(shù)據(jù)如表4所示。
表3 盾構(gòu)機(jī)設(shè)備參數(shù)Table 3 Shield machine equipment parameters
表4 0~502環(huán)部分盾構(gòu)機(jī)掘進(jìn)數(shù)據(jù)Table 4 Part of tunneling data of the shield machine in 0-502 ring
2.1.1 提取平穩(wěn)段運(yùn)行數(shù)據(jù)
盾構(gòu)機(jī)數(shù)據(jù)采集系統(tǒng)記錄盾構(gòu)機(jī)的運(yùn)行狀態(tài),取值有0(關(guān)機(jī)狀態(tài))、1(待機(jī)狀態(tài))、2(運(yùn)行狀態(tài))。以第192環(huán)掘進(jìn)數(shù)據(jù)為例,該環(huán)的盾構(gòu)機(jī)狀態(tài)和總推力如圖2所示。在掘進(jìn)1環(huán)的過(guò)程中,盾構(gòu)機(jī)在中途會(huì)出現(xiàn)多次待機(jī)或停止?fàn)顟B(tài)。在盾構(gòu)機(jī)處于待機(jī)或停機(jī)狀態(tài)時(shí),盾構(gòu)機(jī)不進(jìn)行掘進(jìn),總推力為0 MN。在預(yù)處理盾構(gòu)機(jī)運(yùn)行參數(shù)時(shí),需要將盾構(gòu)機(jī)運(yùn)行狀態(tài)為0或1的樣本點(diǎn)去掉。
圖2 第192環(huán)盾構(gòu)機(jī)狀態(tài)與總推力Fig.2 No.192 ring shield machine state and total thrust
將盾構(gòu)機(jī)從啟動(dòng)運(yùn)行到進(jìn)入待機(jī)狀態(tài)為止的時(shí)間區(qū)間定義為1個(gè)掘進(jìn)區(qū)間。圖3所示為盾構(gòu)機(jī)在192環(huán)掘進(jìn)環(huán)中的第1個(gè)掘進(jìn)區(qū)間內(nèi)的總推力和刀盤(pán)轉(zhuǎn)矩與時(shí)間的關(guān)系。分析多個(gè)掘進(jìn)區(qū)間,發(fā)現(xiàn)在盾構(gòu)機(jī)開(kāi)始掘進(jìn)的最開(kāi)始的100 s 內(nèi),盾構(gòu)機(jī)運(yùn)行處于非平穩(wěn)階段,盾構(gòu)機(jī)推力、扭矩逐漸上升至穩(wěn)定值,變化幅度很大。在進(jìn)行地層識(shí)別時(shí),采用盾構(gòu)機(jī)平穩(wěn)掘進(jìn)段的數(shù)據(jù)進(jìn)行預(yù)測(cè),在數(shù)據(jù)預(yù)處理時(shí),將每次啟動(dòng)時(shí)前100 s的樣本點(diǎn)去掉。
圖3 第192環(huán)1個(gè)掘進(jìn)區(qū)間內(nèi)盾構(gòu)機(jī)總推力與刀盤(pán)轉(zhuǎn)矩Fig.3 Total thrust and cutter head torque of shield machine in a tunneling section of No.192 ring
2.1.2 提取平穩(wěn)段運(yùn)行數(shù)據(jù)
在實(shí)際盾構(gòu)掘進(jìn)過(guò)程中,盾構(gòu)機(jī)運(yùn)行參數(shù)由數(shù)據(jù)采集系統(tǒng)不斷采集獲得,運(yùn)行參數(shù)數(shù)據(jù)為流數(shù)據(jù),難以獲得全部樣本點(diǎn)的參數(shù)最大值和最小值,因此,無(wú)法使用傳統(tǒng)的MinMax歸一化方法處理盾構(gòu)傳感數(shù)據(jù)。為了避免不同類(lèi)型的盾構(gòu)掘進(jìn)參數(shù)的變化范圍差異對(duì)數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)模型造成影響,采用下式對(duì)盾構(gòu)機(jī)運(yùn)行參數(shù)進(jìn)行歸一化:
式中:P0為運(yùn)行參數(shù)原始值;Ps為運(yùn)行參數(shù)額定值;P為歸一化的運(yùn)行參數(shù)。部分盾構(gòu)機(jī)運(yùn)行參數(shù)額定值如表5所示。
表5 部分盾構(gòu)機(jī)運(yùn)行參數(shù)額定值Table 5 Rated value of shield machine operating parameters
現(xiàn)廣泛采用盾構(gòu)機(jī)總推力、掘進(jìn)速度、刀盤(pán)轉(zhuǎn)速和刀盤(pán)轉(zhuǎn)矩這4個(gè)掘進(jìn)參數(shù)作為地層識(shí)別模型的輸入?yún)?shù)。在地層中的地質(zhì)類(lèi)型較少、不同地質(zhì)類(lèi)型的地質(zhì)參數(shù)差異較大的隧道工程中,可以達(dá)到較高的地層識(shí)別精度。在新加坡隧道實(shí)例中,盾構(gòu)機(jī)在不同類(lèi)型的地層掘進(jìn)時(shí),部分盾構(gòu)機(jī)運(yùn)行參數(shù)的均值如表6所示。
由表6可見(jiàn):盾構(gòu)機(jī)在較軟類(lèi)型和較硬地層的刀盤(pán)轉(zhuǎn)矩、刀盤(pán)轉(zhuǎn)速以及土艙壓力等參數(shù)有明顯差異,可以采用少量盾構(gòu)機(jī)運(yùn)行參數(shù)對(duì)地質(zhì)類(lèi)型進(jìn)行粗略劃分。但對(duì)性質(zhì)相似的地層尤其是句容地層IV 型和V 型這2 種地層,刀盤(pán)轉(zhuǎn)矩、刀盤(pán)轉(zhuǎn)速、推進(jìn)速度和總推力相似。此時(shí),通過(guò)少量掘進(jìn)參數(shù)表征地層特征,能夠反映的地層地質(zhì)特征較少,難以準(zhǔn)確識(shí)別5種地質(zhì)類(lèi)型。土壓平衡盾構(gòu)機(jī)的掘進(jìn)過(guò)程是復(fù)雜的巖機(jī)交互過(guò)程,盾構(gòu)機(jī)數(shù)據(jù)采集系統(tǒng)采集得到的大量運(yùn)行數(shù)據(jù)中都蘊(yùn)含了掘進(jìn)地層地質(zhì)信息,為了從盾構(gòu)機(jī)運(yùn)行參數(shù)中充分挖掘地質(zhì)表征特征,需要合理選擇盾構(gòu)機(jī)運(yùn)行參數(shù)。
表6 不同地層中盾構(gòu)機(jī)運(yùn)行參數(shù)均值Table 6 Mean values of shield machine operating parameters in typical formations
盾構(gòu)千斤頂?shù)耐屏κ峭七M(jìn)過(guò)程中盾構(gòu)遇到的全部阻力之和,主要包括開(kāi)挖面正面土體對(duì)刀盤(pán)的阻力F1及盾構(gòu)四周外表面與土體之間的摩擦阻力F2。刀盤(pán)轉(zhuǎn)矩主要包括刀盤(pán)與土體之間的摩擦阻力轉(zhuǎn)矩T1及刀盤(pán)切削土體需要克服的地層抗力轉(zhuǎn)矩T2。根據(jù)文獻(xiàn)[18,22],F(xiàn)1,F(xiàn)2,T1和T2可表示為:
式中:D為盾構(gòu)機(jī)直徑;L為盾體長(zhǎng)度;G為盾構(gòu)機(jī)重力;γ為開(kāi)挖地層土體的容重;K為靜止土壓力系數(shù);Kα為主動(dòng)土壓力系數(shù);H為隧道深度;μ為盾體與周?chē)馏w之間的動(dòng)摩擦因數(shù);ξ為刀盤(pán)開(kāi)口率;qu為土體的單軸抗壓強(qiáng)度;v為盾構(gòu)機(jī)掘進(jìn)速度;n為刀盤(pán)轉(zhuǎn)速。刀盤(pán)轉(zhuǎn)速、轉(zhuǎn)矩、盾構(gòu)機(jī)推進(jìn)力、推進(jìn)速度與土體容重、土壓力系數(shù)關(guān)系密切,這些盾構(gòu)機(jī)運(yùn)行參數(shù)受到地層地質(zhì)性質(zhì)的影響。
土壓平衡盾構(gòu)機(jī)掘進(jìn)時(shí),盾構(gòu)機(jī)土艙壓力設(shè)定值與掌子面土壓力接近,可表示為[23]
式中:σx為土艙壓力;K為掌子面土層的靜止側(cè)壓力系數(shù);c為土體黏聚力;φ為土體內(nèi)摩擦角;h為隧道埋深;R為隧道半徑;b為自然拱的半跨度。由此可見(jiàn),土艙壓力與地質(zhì)條件關(guān)系密切。
在掘進(jìn)過(guò)程中需要控制螺旋機(jī)轉(zhuǎn)速和推進(jìn)速度來(lái)保持土艙壓力的穩(wěn)定。土艙壓力與螺旋機(jī)運(yùn)行參數(shù)之間的關(guān)系可表示為[24]
式中:ΔP為土艙壓力變化量;A為盾構(gòu)機(jī)橫截面積;η為螺旋機(jī)排土效率;hs為螺旋機(jī)螺距;As為螺旋機(jī)有效排土面積;Vc為螺旋機(jī)土艙體積;Et為渣土等效變形模量;ω為螺旋機(jī)轉(zhuǎn)速。掘進(jìn)地層性質(zhì)對(duì)盾構(gòu)機(jī)排土效率有顯著影響[25],導(dǎo)致不同地層中土艙壓力、螺旋機(jī)轉(zhuǎn)速和推進(jìn)速度等運(yùn)行參數(shù)存在差異。上述運(yùn)行參數(shù)之間的關(guān)系能夠綜合反映當(dāng)前掘進(jìn)地質(zhì)特征。
在土壓平衡盾構(gòu)中,為了改良掌子面切削土體和渣土的性質(zhì),會(huì)在刀盤(pán)前方、土艙和螺旋機(jī)中注入膨潤(rùn)土、氣泡劑和高分子聚合物等添加劑[26-27]。注入添加劑可以改善土體的塑性流動(dòng)性,降低刀盤(pán)和螺旋機(jī)轉(zhuǎn)矩,提高螺旋機(jī)排土效率和掘進(jìn)速度[28]?,F(xiàn)有理論知識(shí)難以定量分析各種添加劑對(duì)盾構(gòu)機(jī)在不同地質(zhì)類(lèi)型的地層中運(yùn)行參數(shù)的影響,將泡沫、膨潤(rùn)土和高分子聚合物添加劑注入流量作為機(jī)器學(xué)習(xí)模型輸入?yún)?shù),借助模型的抽象特征學(xué)習(xí)能力,表征添加劑對(duì)盾構(gòu)機(jī)運(yùn)行參數(shù)的影響。
基于上述分析,選擇推進(jìn)系統(tǒng)、刀盤(pán)系統(tǒng)、排土系統(tǒng)、添加劑注入系統(tǒng)的177個(gè)傳感器監(jiān)測(cè)參數(shù)和盾構(gòu)機(jī)機(jī)器參數(shù)作為預(yù)測(cè)模型的輸入。盾構(gòu)機(jī)運(yùn)行參數(shù)選擇如表7所示。
表7 盾構(gòu)機(jī)運(yùn)行參數(shù)選擇Table 7 Shield machine operating parameter selection
3.1.1 LTSA算法原理
LTSA 算法[29]又稱(chēng)局部切空間排列算法,是一種無(wú)監(jiān)督的流形學(xué)習(xí)算法,通過(guò)尋找高維觀測(cè)數(shù)據(jù)的低維流形結(jié)構(gòu),達(dá)到對(duì)高維非線性數(shù)據(jù)的維數(shù)約簡(jiǎn),常用于數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)等任務(wù)。LTSA通過(guò)樣本點(diǎn)在局部切空間中的坐標(biāo)特征,求解高維樣本點(diǎn)在低維流形中的坐標(biāo),達(dá)到數(shù)據(jù)降維和特征提取的目的。
對(duì)于一組樣本點(diǎn)x1,x2,…,xn(xi∈Rm),要求解其在d維非線性流形中的映射坐標(biāo)T=[τ1,τ2,…,τn,τi∈Rd,其中d<m。對(duì)于樣本點(diǎn)xi,選取其k個(gè)臨近點(diǎn){xi1,xi2,…,xik}。令通過(guò)求解
得到xi1,xi2,…,xik的d維最佳仿射子空間Qi。k個(gè)鄰域點(diǎn)的局部特征坐標(biāo)為Qi的最優(yōu)解為矩陣的d個(gè)最大的奇異值對(duì)應(yīng)的左奇異向量。
定義樣本點(diǎn)全局坐標(biāo)與局部坐標(biāo)的映射關(guān)系為
3.1.2 盾構(gòu)運(yùn)行數(shù)據(jù)特征提取
對(duì)盾構(gòu)機(jī)掘進(jìn)參數(shù)進(jìn)行篩選和預(yù)處理之后,得到177 維輸入特征向量。求解運(yùn)行參數(shù)之間的spearman 相關(guān)性系數(shù)矩陣,如圖4所示。由圖4可見(jiàn):部分盾構(gòu)機(jī)運(yùn)行參數(shù)之間具有很強(qiáng)的相關(guān)性,說(shuō)明輸入?yún)?shù)中包含重復(fù)冗余信息。若直接將高維盾構(gòu)機(jī)運(yùn)行參數(shù)傳入分類(lèi)模型中,則分類(lèi)器難以從運(yùn)行參數(shù)中提取出準(zhǔn)確的地質(zhì)信息,影響了地層識(shí)別的準(zhǔn)確率。
圖4 177個(gè)參數(shù)間spearman相關(guān)系數(shù)圖Fig.4 Spearman correlation coefficient among 177 parameters
使用LSTA流形學(xué)習(xí)算法挖掘內(nèi)蘊(yùn)于高維向量中的低維特征,消除傳感參數(shù)中的冗余信息,得到稀疏化的輸入特征,有助于提升分類(lèi)算法對(duì)特征的學(xué)習(xí)。圖5所示為使用LSTA 算法從177 維盾構(gòu)運(yùn)行參數(shù)中提取的50 維特征的spearman 相關(guān)系數(shù)矩陣。參數(shù)之間的相關(guān)性顯著降低,達(dá)到了消除特征冗余信息的目的。
圖5 50個(gè)低維特征間spearman相關(guān)系數(shù)圖Fig.5 Spearman coefficient matrix between 50 lowdimensional features
Xgboost 算法又稱(chēng)為極限梯度提升算法[30],是boosting 算法的一種。Xgboost 算法通過(guò)集成多個(gè)基本分類(lèi)器,形成強(qiáng)學(xué)習(xí)器。相比于深度學(xué)習(xí)算法更適合于處理圖像、語(yǔ)音等高維抽象數(shù)據(jù),基于樹(shù)模型的Xgboost算法更適合于處理低維表格數(shù)據(jù),例如傳感器監(jiān)測(cè)數(shù)據(jù)。Xgboost算法能夠有效地防止過(guò)擬合,訓(xùn)練結(jié)果穩(wěn)定。因此,本文采用Xgboost算法作為地層識(shí)別分類(lèi)算法。
設(shè)最大迭代次數(shù)為K,Xgboost 強(qiáng)學(xué)習(xí)器可表示為
其中,gi(x)為每輪迭代時(shí)產(chǎn)生的基本分類(lèi)器模型。選擇CART 樹(shù)作為基本分類(lèi)器。訓(xùn)練集樣本為I={(xi,yi)}(|I|=n,xi∈Rl,y∈R)。在每次迭代中,為訓(xùn)練基本分類(lèi)器,定義優(yōu)化目標(biāo)L(t)為
式中:t為當(dāng)前迭代次數(shù);為t-1 輪迭代時(shí)強(qiáng)分類(lèi)器的預(yù)測(cè)結(jié)果;Ω(ft)為正則化項(xiàng)。對(duì)于具有T個(gè)樹(shù)葉節(jié)點(diǎn)的決策樹(shù)q(x),設(shè)每個(gè)樹(shù)葉節(jié)點(diǎn)的權(quán)重為wj(j=1,2,…,T),則正則化項(xiàng)可表示為
使用二階展開(kāi)方法快速求解權(quán)重最優(yōu)解w*j和損失函數(shù)最優(yōu)值L(t)*為
每個(gè)節(jié)點(diǎn)生成左右子樹(shù)時(shí),需要選擇使Lsplit最大的特征和特征值分裂子樹(shù)。當(dāng)所有Lsplit≤0時(shí),停止生成子樹(shù),本輪訓(xùn)練結(jié)束。重復(fù)上述步驟,直到達(dá)到最大迭代次數(shù)K,即可訓(xùn)練得到Xgboost 強(qiáng)分類(lèi)器。
盾構(gòu)機(jī)數(shù)據(jù)采集系統(tǒng)實(shí)時(shí)采集1 465個(gè)通道的盾構(gòu)機(jī)運(yùn)行參數(shù)作為模型輸入。對(duì)數(shù)據(jù)集進(jìn)行預(yù)處理,去掉盾構(gòu)機(jī)處于待機(jī)與停機(jī)狀態(tài)的樣本點(diǎn),去掉盾構(gòu)機(jī)運(yùn)行前100 s 的非平穩(wěn)樣本點(diǎn),采用參數(shù)額定值對(duì)數(shù)據(jù)進(jìn)行歸一化。從全部運(yùn)行參數(shù)中選取指定的177個(gè)運(yùn)行參數(shù)組成地質(zhì)類(lèi)型識(shí)別高維特征向量。采用LTSA流形學(xué)習(xí)算法對(duì)高維特征向量進(jìn)行降維,提取低維特征。將低維特征輸入Xgboost分類(lèi)模型,模型輸出盾構(gòu)機(jī)掌子面地質(zhì)類(lèi)型。LTSA-Xgboost 地質(zhì)類(lèi)型識(shí)別流程如圖6所示。
圖6 LTSA-Xgboost地質(zhì)類(lèi)型識(shí)別流程Fig.6 LTSA-Xgboost geological type identification process
選擇15個(gè)經(jīng)過(guò)鉆探點(diǎn)的掘進(jìn)環(huán)作為輸入樣本,掘進(jìn)環(huán)的長(zhǎng)度為1.4 m左右。由于在短距離內(nèi)地質(zhì)類(lèi)型具有連續(xù)性,可將這些環(huán)的地質(zhì)類(lèi)型標(biāo)注為鉆探點(diǎn)測(cè)得的地質(zhì)類(lèi)型。為檢驗(yàn)?zāi)P偷姆夯阅懿⒎乐共煌刭|(zhì)類(lèi)型的訓(xùn)練樣本數(shù)量差異影響模型識(shí)別準(zhǔn)確率,對(duì)每種地質(zhì)類(lèi)型分別選取單獨(dú)1環(huán)中的500個(gè)樣本點(diǎn)作為測(cè)試集,其他環(huán)中隨機(jī)選取1 600 個(gè)樣本點(diǎn)作為訓(xùn)練集。具體劃分結(jié)果如表8所示。
表8 訓(xùn)練集和測(cè)試集劃分Table 8 Training set and test set division
為了檢驗(yàn)?zāi)P偷姆诸?lèi)效果,采用準(zhǔn)確率A、精確度和F指數(shù)3 個(gè)指標(biāo)對(duì)模型進(jìn)行評(píng)價(jià)。準(zhǔn)確率、精確度和F指數(shù)的計(jì)算公式為:
式中:n為樣本總數(shù);m為樣本類(lèi)別數(shù);ypiredict為模型預(yù)測(cè)的樣本點(diǎn)地質(zhì)類(lèi)型類(lèi)別;yaictual為樣本點(diǎn)對(duì)應(yīng)的真實(shí)地質(zhì)類(lèi)型類(lèi)別;TiP為預(yù)測(cè)正確的i類(lèi)地層樣本數(shù)量;FiN為預(yù)測(cè)為其他類(lèi)型的i類(lèi)地層樣本的數(shù)量;FiP為預(yù)測(cè)為i類(lèi)地層的其他類(lèi)型地層樣本的數(shù)量;Pi為模型對(duì)第i類(lèi)樣本的識(shí)別精確度。
從177個(gè)盾構(gòu)機(jī)運(yùn)行參數(shù)中提取最佳的低維特征集,需要尋找LTSA算法中的低維流形映射坐標(biāo)最佳維度數(shù)和進(jìn)行降維計(jì)算時(shí)選取的最佳臨近點(diǎn)個(gè)數(shù)。采用不同的低維流形維度數(shù)和臨近點(diǎn)個(gè)數(shù),使用Xgboost算法作為分類(lèi)器,可以得到分類(lèi)器使用LTSA降維特征對(duì)掌子面地質(zhì)類(lèi)型識(shí)別的準(zhǔn)確率如圖7所示。當(dāng)?shù)途S流形維度數(shù)為40,臨近點(diǎn)個(gè)數(shù)為100 時(shí),Xgboost 的算法準(zhǔn)確率達(dá)到最高,說(shuō)明此時(shí)的低維流形特征與掌子面地質(zhì)類(lèi)型之間的映射關(guān)系最佳。為證明LTSA 算法的優(yōu)越性,對(duì)比LTSA,LLE,PCA 和ISOMAP 這4 種降維算法,將4 種算法提取的低維特征作為Xgboost 分類(lèi)模型的輸入?yún)?shù),Xgboost 模型的識(shí)別準(zhǔn)確率分別為98.32%,76.83%和70.43%和55.34%。Xgboost 分類(lèi)模型以LTSA算法提取得到的低維特征作為輸入?yún)?shù)時(shí)準(zhǔn)確率最高,說(shuō)明了LTSA算法的優(yōu)越性。
圖7 使用LTSA降維特征的Xgboost地質(zhì)類(lèi)型識(shí)別準(zhǔn)確率Fig.7 Accuracy of Xgboost geotechnical recognition using LTSA dimensionality reduction feature
為評(píng)價(jià)LTSA+Xgboost 掌子面地質(zhì)類(lèi)型識(shí)別模型對(duì)復(fù)雜地質(zhì)類(lèi)型的識(shí)別效果,對(duì)比了極限梯度提升樹(shù)(Xgboost)、深度神經(jīng)網(wǎng)絡(luò)(DNN)、支持向量機(jī)(SVM)、LTSA+Xgboost、LTSA+DNN、LTSA+SVM 這6 種識(shí)別算法在新加坡地鐵數(shù)據(jù)集上對(duì)掌子面地質(zhì)類(lèi)型的識(shí)別效果。其中,LTSA模型的降維維度數(shù)設(shè)置為40,臨近點(diǎn)個(gè)數(shù)設(shè)置為100,Xgboost 模型的基本分類(lèi)器個(gè)數(shù)設(shè)置為800,分類(lèi)器最大深度設(shè)置為4,學(xué)習(xí)率設(shè)置為0.15。
表9所示為6種算法在本數(shù)據(jù)集上的識(shí)別準(zhǔn)確率、精確度和F指數(shù)。由表9可見(jiàn):采用降維后的低維特征作為輸入,Xgboost,DNN 和SVM 識(shí)別算法的地質(zhì)類(lèi)型識(shí)別準(zhǔn)確率相比于將運(yùn)行參數(shù)直接輸入分別提升20.96%,15.28%和41.00%,說(shuō)明LTSA降維有效解決了模型輸入?yún)?shù)過(guò)多時(shí)由于特征冗余產(chǎn)生的模型精度下降的問(wèn)題。
表9 不同算法的識(shí)別結(jié)果Table 9 Recognition results of different methods
比較上述6 種算法可知,LTSA-Xgboost 算法的識(shí)別準(zhǔn)確率、精確度和F指數(shù)均為最高,識(shí)別準(zhǔn)確率達(dá)到98.48%,證明本算法對(duì)于掌子面地質(zhì)類(lèi)型識(shí)別具有有效性。LTSA+Xgboost 算法對(duì)5 種地質(zhì)類(lèi)型識(shí)別的混淆矩陣圖如圖8所示。
圖8 LTSA-Xgboost算法識(shí)別結(jié)果混淆矩陣圖Fig.8 LTSA-Xgboost recognition result confusion matrix
為驗(yàn)證本文提出的盾構(gòu)機(jī)運(yùn)行參數(shù)篩選與特征提取方法的有效性,對(duì)比采用不同特征輸入時(shí),各種算法在地質(zhì)類(lèi)型識(shí)別上的差異。采用LTSA算法從本文選取的177 個(gè)盾構(gòu)機(jī)運(yùn)行參數(shù)中提取40維特征作為模型輸入,使用Xgboost,DNN 和SVM 這3 種分類(lèi)算法模型對(duì)5 種地質(zhì)類(lèi)型進(jìn)行識(shí)別,結(jié)果如表9所示。采用盾構(gòu)總推進(jìn)力、推進(jìn)速度、刀盤(pán)總扭矩和刀盤(pán)轉(zhuǎn)速這4個(gè)特征參數(shù)作為模型輸入,Xgboost,DNN和SVM這3種分類(lèi)算法模型的識(shí)別結(jié)果如表10所示。
表10 使用不同輸入?yún)?shù)的Xgboost、DNN和SVM算法識(shí)別結(jié)果Table 10 Recognition results using Xgboost,DNN and SVM algorithms with different input parameters
從圖10可見(jiàn):本文的特征篩選和特征提取方法能夠得到更為全面準(zhǔn)確地掌子面地質(zhì)信息特征,有助于提升地質(zhì)類(lèi)型識(shí)別算法的性能。
1)提出了一種面向掌子面地質(zhì)類(lèi)型識(shí)別的盾構(gòu)機(jī)運(yùn)行參數(shù)篩選方法,選取與推進(jìn)系統(tǒng)、刀盤(pán)系統(tǒng)、土艙、螺旋機(jī)和添加劑注入系統(tǒng)相關(guān)的177個(gè)盾構(gòu)機(jī)運(yùn)行參數(shù),相比于常用的盾構(gòu)機(jī)總推力、掘進(jìn)速度、刀盤(pán)轉(zhuǎn)速和刀盤(pán)轉(zhuǎn)矩這4 個(gè)掘進(jìn)參數(shù),包含更豐富的地質(zhì)信息。
2)利用LTSA流形學(xué)習(xí)算法從高維盾構(gòu)機(jī)運(yùn)行參數(shù)中提取內(nèi)蘊(yùn)稀疏化特征,有效降低了輸入特征之間的相關(guān)性,消除特征中的冗余信息;建立了基于Xgboost的地質(zhì)類(lèi)型識(shí)別模型,使用低維特征輸入準(zhǔn)確識(shí)別了盾構(gòu)機(jī)掌子面地質(zhì)類(lèi)型。
3)采用本文提出的參數(shù)篩選規(guī)則與LTSAXgboost識(shí)別模型,識(shí)別準(zhǔn)確率達(dá)到98.48%,相比于DNN、SVM 和Xgboost 算法,識(shí)別準(zhǔn)確率分別提升了22.40%,44.28%和20.96%。
4)識(shí)別混合地層是目前隧道掌子面地質(zhì)類(lèi)型識(shí)別的一個(gè)研究熱點(diǎn)。在未來(lái)的研究中,將對(duì)混合地層進(jìn)行分類(lèi),按照各種地質(zhì)類(lèi)型的地層所占比例及分布特點(diǎn)建立新的分類(lèi)標(biāo)簽,然后利用本文所提方法建立盾構(gòu)運(yùn)行參數(shù)與新的地質(zhì)標(biāo)簽之間的映射模型,實(shí)現(xiàn)對(duì)混合地層的識(shí)別。