卓維松,闕云,王榮,黃瑞
(1.福建船政交通職業(yè)學(xué)院 土木工程學(xué)院,福建 福州 350007;2.福州大學(xué) 土木工程學(xué)院,福建 福州 350116;3.武夷學(xué)院 土木工程與建筑學(xué)院,福建 武夷山 354300)
土釘軸力是土釘抗拔和抗拉極限狀態(tài)設(shè)計(jì)的關(guān)鍵參數(shù)之一,對(duì)土釘軸力精確預(yù)測(cè)不僅關(guān)系到工程造價(jià),并且與基坑支護(hù)工程的安全問(wèn)題息息相關(guān)。目前,世界各國(guó)都有相應(yīng)的土釘軸力計(jì)算模型,如美國(guó)的FHWA 法[1],日本規(guī)程用的經(jīng)驗(yàn)土壓力[2],中國(guó)的《建筑基坑支護(hù)技術(shù)規(guī)程》(JGJ 120-2012)、《基坑土釘支護(hù)技術(shù)規(guī)程》(CECS 96:97),簡(jiǎn)化增量法[3]和極限上限分析法[4]等。
目前已有學(xué)者對(duì)現(xiàn)有的土釘預(yù)測(cè)模型進(jìn)行評(píng)估。例如,Yuan 等[5-6]對(duì)FHWA、《建筑基坑支護(hù)技術(shù)規(guī)程》和《基坑土釘支護(hù)技術(shù)規(guī)程》所提出的土釘軸力模型分別進(jìn)行了模型不確定性分析,研究表明其模型因子的平均值和變異系數(shù)分別為0.95 和0.382、0.62 和0.62 及0.974 和0.730。由此可見,現(xiàn)有土釘軸力計(jì)算模型精確度仍有待提高。
神經(jīng)網(wǎng)絡(luò)方法由于具有高度的非線性映射能力,事先不需要假設(shè)輸出變量與輸入變量之間的關(guān)系,而是通過(guò)對(duì)大量數(shù)據(jù)組成的樣本本身進(jìn)行深入學(xué)習(xí)驗(yàn)證,就能找到輸入數(shù)據(jù)和輸出數(shù)據(jù)之間的某種線性或者非線性關(guān)系。楊小輝[7]基于Elman 神經(jīng)網(wǎng)絡(luò)構(gòu)建復(fù)合土釘墻安全預(yù)測(cè)模型,并用實(shí)測(cè)數(shù)據(jù)進(jìn)行對(duì)比,證明Elman 神經(jīng)網(wǎng)絡(luò)用于復(fù)合土釘墻的安全預(yù)測(cè)方面具有較好可行性。曹正[8]提出一種基于BP 神經(jīng)網(wǎng)絡(luò)的基坑土釘支護(hù)結(jié)構(gòu)優(yōu)化設(shè)計(jì)方法,用于選擇工程量最小的土釘支護(hù)方案。Hao 等[9]用監(jiān)測(cè)數(shù)據(jù)建立土釘墻位移神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,并用正交試驗(yàn)分析,找出影響邊坡位移影最大的敏感性因素。王兆鑫[10]采用BP算法與遺傳算法相結(jié)合的方法應(yīng)用于土釘墻土釘支護(hù)的變形預(yù)測(cè),經(jīng)過(guò)預(yù)測(cè)模型與實(shí)測(cè)位移數(shù)據(jù)對(duì)比,發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)值與實(shí)測(cè)變形值最大誤差為8.82%,能滿足工程問(wèn)題的實(shí)際需求。Maedehl 等[11]利用多層神經(jīng)網(wǎng)絡(luò)對(duì)考慮土釘抗拔力、覆土荷載和灌漿壓力影響的土釘墻中土釘結(jié)合體系的最大位移進(jìn)行了評(píng)估。
由此可見,神經(jīng)網(wǎng)絡(luò)已被廣泛地應(yīng)用于土釘墻相關(guān)參數(shù)的預(yù)測(cè)中,且具有較高的模型預(yù)測(cè)精度。然而,以上研究多適用于單一土體或者單一土釘墻神經(jīng)網(wǎng)絡(luò)模型,因其數(shù)據(jù)有限導(dǎo)致模型適用性有限,并且其所建立模型所采用的數(shù)據(jù)量偏少,遠(yuǎn)不足以支撐一個(gè)具有實(shí)用價(jià)值的神經(jīng)網(wǎng)絡(luò)模型。
基于此開展文獻(xiàn)調(diào)研,收集大量工作狀態(tài)下土釘軸力最大值的實(shí)測(cè)數(shù)據(jù),建立一個(gè)考慮土釘墻參數(shù)(坑壁傾角、后傾角)、土釘參數(shù)(間距、直徑、長(zhǎng)度和角度)、土參數(shù)(黏聚力、摩擦角和重度)和超載情況等因素的土釘軸力神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,然后對(duì)該模型的預(yù)測(cè)結(jié)果進(jìn)行評(píng)估,以期提高土釘軸力的預(yù)測(cè)精度,為其理論計(jì)算和工程實(shí)踐提供支持。
BP 神經(jīng)網(wǎng)絡(luò)(back-propagation neural networks)及反向傳播神經(jīng)網(wǎng)絡(luò),是采用誤差逆?zhèn)鞑ニ惴ㄟM(jìn)行誤差校正的多層前饋網(wǎng)絡(luò)。BP 神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過(guò)程是正向傳播過(guò)程和反向傳播階段,正向傳播過(guò)程是基本信息輸入輸入層,然后由隱藏層加權(quán)處理就會(huì)得到輸出值。反向傳播階段就是當(dāng)輸出值與樣本值存在差異時(shí),這是BP 神經(jīng)網(wǎng)絡(luò)就會(huì)通過(guò)逐層修改權(quán)值和閾值,逐步減小輸出值與樣本值的誤差,直至得到滿足特定要求的結(jié)果為止。
BP 神經(jīng)網(wǎng)絡(luò)對(duì)于處理工程中各種非線性的映射能力非常出眾,使其使用面很廣,其具有非常強(qiáng)大的自學(xué)習(xí)和自組織能力,神經(jīng)網(wǎng)絡(luò)對(duì)建模的目標(biāo)的經(jīng)驗(yàn)知識(shí)不需要太高的要求。在實(shí)際應(yīng)用中較為方便,將影響土釘軸力多因素?cái)?shù)據(jù)作為輸入,實(shí)際監(jiān)測(cè)土釘軸力值作為輸出,神經(jīng)網(wǎng)絡(luò)便會(huì)將輸入數(shù)據(jù)和輸出數(shù)據(jù)分成三類分別用于訓(xùn)練網(wǎng)絡(luò)、驗(yàn)證網(wǎng)絡(luò)、測(cè)試網(wǎng)絡(luò),是最終生成的神經(jīng)網(wǎng)絡(luò)模型滿足精度要求,可以應(yīng)用于土釘軸力預(yù)測(cè)的實(shí)際工程,其應(yīng)用范圍涉及非常廣。
圖1 為BP 神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),左邊為輸入層x,右邊為輸出層y,中間部分為隱藏層,隱藏層層數(shù)不唯一,隱藏層里面包括神經(jīng)元,神經(jīng)元數(shù)也不唯一。
圖1 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Neural network structure
圖2 為神經(jīng)網(wǎng)絡(luò)使用的基本流程。通過(guò)編寫Matlab 神經(jīng)網(wǎng)絡(luò)語(yǔ)言,使用結(jié)果回調(diào)用相應(yīng)的工具箱,便于更加直觀理解所訓(xùn)練驗(yàn)證測(cè)試神經(jīng)網(wǎng)絡(luò)模型的性能,圖3 為Matlab 實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)的流程。
圖2 算法流程圖Fig.2 Algorithm flow chart
圖3 神經(jīng)網(wǎng)絡(luò)訓(xùn)練及仿真流程圖Fig.3 Neural network training and simulation flow chart
基坑土釘墻土釘軸力是多種因素共同作用的結(jié)果,收集大量工作狀態(tài)下土釘軸力最大值的實(shí)測(cè)數(shù)據(jù),建立詳細(xì)土釘軸力數(shù)據(jù)庫(kù)??紤]土釘墻參數(shù)(坑壁傾角、后傾角)、土釘參數(shù)(間距、直徑、長(zhǎng)度和角度)、土參數(shù)(黏聚力、摩擦角和重度)和超載情況等因素,該神經(jīng)網(wǎng)絡(luò)將這些因素作為輸入層,用來(lái)進(jìn)行數(shù)據(jù)分析,輸出層是監(jiān)測(cè)的土釘實(shí)測(cè)數(shù)據(jù)值。
2.2.1 層數(shù)和節(jié)點(diǎn)數(shù)
隱藏層的層數(shù)通常不唯一,計(jì)算方式也不固定,通常與設(shè)計(jì)人員的經(jīng)驗(yàn)和習(xí)慣確定,設(shè)計(jì)隱藏層數(shù)目太少,學(xué)習(xí)能力下降,會(huì)導(dǎo)致計(jì)算不充分,精度較差,容錯(cuò)率變低。設(shè)計(jì)隱藏層數(shù)據(jù)太多,會(huì)導(dǎo)致計(jì)算過(guò)程過(guò)于漫長(zhǎng),學(xué)習(xí)時(shí)間太長(zhǎng),精度也不一定很高。經(jīng)多次測(cè)算,本模型設(shè)置1 個(gè)隱藏層,一共2 層激活層,其中第一層有21 個(gè)神經(jīng)元,第二層10 個(gè)神經(jīng)元。輸入節(jié)點(diǎn)是14 個(gè),輸出節(jié)點(diǎn)是1 個(gè),輸入層和輸出層不設(shè)置激活函數(shù),輸入層、輸出層都呈現(xiàn)線性映射。
2.2.2 初始值范圍的選定
采用土釘墻土釘軸力最大值作為訓(xùn)練樣本,網(wǎng)絡(luò)初始權(quán)值是隨機(jī)生成,一般將初始值得范圍選定在(-1,1),這樣激活函數(shù)處于對(duì)最大變化率時(shí)調(diào)節(jié)各個(gè)神經(jīng)元的權(quán)值。
2.2.3 網(wǎng)絡(luò)的輸入
如果輸入層輸入變量的數(shù)量級(jí)過(guò)于龐大也將不利于權(quán)值的調(diào)整,利用歸一化處理可以避免數(shù)值問(wèn)題帶來(lái)的計(jì)算麻煩,歸一化后的數(shù)據(jù)將使網(wǎng)絡(luò)快速收斂。多因素影響的模型,神經(jīng)網(wǎng)絡(luò)對(duì)樣本數(shù)據(jù)的評(píng)價(jià)標(biāo)準(zhǔn)不一樣,這時(shí)需要對(duì)其量綱化,做統(tǒng)一評(píng)價(jià)標(biāo)準(zhǔn)。數(shù)據(jù)不做歸一化,在計(jì)算過(guò)程中,凈輸入絕對(duì)值可能會(huì)過(guò)大,導(dǎo)致神經(jīng)元輸出呈現(xiàn)飽和,較小的值將會(huì)被忽略,最終影響模型的預(yù)測(cè)精度,所以現(xiàn)在做神經(jīng)網(wǎng)絡(luò)時(shí),都不可避免的將數(shù)據(jù)進(jìn)行歸一化處理。
2.2.4 學(xué)習(xí)速率
學(xué)習(xí)速率通常需要經(jīng)過(guò)多次測(cè)算去選定為定值。在神經(jīng)網(wǎng)絡(luò)的使用中,一開始是比較難選到最合適的學(xué)習(xí)速率,通常會(huì)導(dǎo)致學(xué)習(xí)速率過(guò)大或者過(guò)小。如果設(shè)置的學(xué)習(xí)速率太大,神經(jīng)網(wǎng)絡(luò)在計(jì)算過(guò)程中可能會(huì)出現(xiàn)權(quán)值修正過(guò)頭的現(xiàn)象,導(dǎo)致模型的預(yù)測(cè)進(jìn)度較差。如果設(shè)置的學(xué)習(xí)速率太小,神經(jīng)網(wǎng)絡(luò)計(jì)算過(guò)程會(huì)很慢,耗費(fèi)大量時(shí)間。神經(jīng)網(wǎng)絡(luò)循環(huán)訓(xùn)練產(chǎn)生權(quán)值變化量的大小是由學(xué)習(xí)速率決定,通過(guò)大量調(diào)節(jié)測(cè)算,認(rèn)為選取學(xué)習(xí)速率為0.01 較為合適。
2.2.5 終止訓(xùn)練設(shè)定
訓(xùn)練目標(biāo)均方差低于0.001。終止設(shè)定中設(shè)置如果訓(xùn)練效果不佳,連續(xù)十步變差,就會(huì)訓(xùn)練將會(huì)自動(dòng)停止。
BP 神經(jīng)網(wǎng)絡(luò)里面一般有newff()、train()、sim()3 個(gè)函數(shù),可分別用于創(chuàng)建、訓(xùn)練和預(yù)測(cè)。本文用newff()函數(shù),該隱藏層設(shè)置2 個(gè)激活層,第一個(gè)激活層設(shè)置21 個(gè)節(jié)點(diǎn),第二個(gè)激活層設(shè)置10 個(gè)節(jié)點(diǎn),這個(gè)兩個(gè)激活層的激活函數(shù)都使用正切S 型函數(shù)tansig。因?yàn)镾 型函數(shù)tansig 性能好,比較穩(wěn)定,不容易梯度消失,計(jì)算性能好,對(duì)于輸入值要求相對(duì)寬容。
設(shè)置優(yōu)化方法選擇trainlm 函數(shù),因?yàn)閯?dòng)量反轉(zhuǎn)和動(dòng)態(tài)自適應(yīng)學(xué)習(xí)率的梯度下降BP 算法訓(xùn)練函數(shù)traingdx、levenberg_Marquardt 的BP 算法訓(xùn)練函數(shù)trainlm,這用優(yōu)化函數(shù)是系統(tǒng)默認(rèn)的最優(yōu)于處理中等規(guī)模的神經(jīng)網(wǎng)絡(luò)的算法。訓(xùn)練樣本都有很大的計(jì)算量,trainlm 能將這部分的計(jì)算量減少,避免復(fù)雜的矩陣運(yùn)算,提高訓(xùn)練樣本的計(jì)算速率。
用于生成神經(jīng)網(wǎng)絡(luò)的土釘墻土釘軸力最大值數(shù)據(jù)樣本容量來(lái)源于闕云等[12]在簡(jiǎn)化增量法計(jì)算土釘軸力模型準(zhǔn)確性分析中的土釘軸力數(shù)據(jù)庫(kù)。其收集了國(guó)內(nèi)現(xiàn)有的178 根土釘軸力數(shù)據(jù),提出異常和最后一根土釘?shù)妮S力實(shí)測(cè)數(shù)據(jù)后土釘為143 根。
經(jīng)過(guò)多次訓(xùn)練和篩選,找到比較合適的神經(jīng)網(wǎng)絡(luò)模型,每次生成的模型都不一樣,多次篩選必不可免。這神經(jīng)網(wǎng)絡(luò)本身調(diào)節(jié)值得隨機(jī)生成有關(guān)。通過(guò)Matlab編寫神經(jīng)網(wǎng)絡(luò)代碼,建立用于預(yù)測(cè)土釘軸力的神經(jīng)網(wǎng)絡(luò)模型,最終的得到神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)值與實(shí)測(cè)值如下圖4 所示。由圖4 可知,該神經(jīng)網(wǎng)絡(luò)模型土釘軸力最大預(yù)測(cè)值與最大實(shí)測(cè)值吻合程度很高,離群點(diǎn)較少。
圖4 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)值與實(shí)測(cè)值Fig.4 Neural network predicted value and measured value
通過(guò)Performance 得到其迭代次數(shù)與均方誤差的關(guān)系,如圖5 所示。由圖可知,訓(xùn)練、驗(yàn)證和測(cè)試的MSE 隨著迭代次數(shù)的增加而減小,且MSE 值較小,驗(yàn)證和測(cè)試的MSE 值差不多。驗(yàn)證的MSE 最小值發(fā)生在第5 次迭代,而且在此之前沒(méi)有過(guò)擬合現(xiàn)象,即沒(méi)有訓(xùn)練MSE 值遞減但驗(yàn)證MSE 值遞增的現(xiàn)象出現(xiàn)。
圖5 迭代次數(shù)與均方誤差的關(guān)系Fig.5 The relation between epochs and mean square error
通過(guò)Training state 得到其驗(yàn)證數(shù)據(jù)的梯度、Mu、驗(yàn)證檢查與迭代次數(shù)的關(guān)系如圖6 所示。由圖可知,梯度隨著迭代次數(shù)的增加而減小,Mu 是LM 算法里面的一個(gè)參數(shù),基本上隨著迭代次數(shù)是穩(wěn)定變化的,最大值也未超過(guò)0.001。驗(yàn)證檢查就是找到一個(gè)時(shí)點(diǎn),而它之后6 個(gè)時(shí)點(diǎn)對(duì)應(yīng)的MSE 都沒(méi)有減小。在時(shí)點(diǎn)5~15 上,驗(yàn)證的MSE 單調(diào)增大,因此算法停止,最小的驗(yàn)證MSE 發(fā)生在5 次迭代上。
圖6 驗(yàn)證數(shù)據(jù)的梯度、Mu、驗(yàn)證檢查與迭代次數(shù)的關(guān)系Fig.6 The relationship between gradient,Mu,validation check of validation data and epochs
通過(guò)Regression 得到其擬合回歸圖,如圖7 所示。由圖可知,訓(xùn)練R 值為0.981,驗(yàn)證R 值為0.73,測(cè)試R 值為0.82,整體R 值為0.92。經(jīng)過(guò)多次嘗試,結(jié)果還是比較理想的,但是這樣的結(jié)果并不完美,如果想要得到更好的擬合結(jié)果可以做如下嘗試:多次切換影響結(jié)果的初始值;改變神經(jīng)元數(shù)量繼續(xù)嘗試來(lái)獲取更好的結(jié)果;通過(guò)增加數(shù)據(jù)來(lái)進(jìn)一步來(lái)完善該神經(jīng)網(wǎng)絡(luò)模型;通過(guò)應(yīng)用不同的函數(shù)來(lái)訓(xùn)練數(shù)據(jù)建模。
圖7 擬合回歸圖Fig.7 Fit regression graph
神經(jīng)網(wǎng)絡(luò)模型建成后,神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)土釘軸力最大值提取出來(lái)和土釘軸力實(shí)測(cè)值進(jìn)行分析對(duì)比。圖8為神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)土釘軸力最大值與土釘軸力實(shí)際監(jiān)測(cè)值關(guān)系圖。由圖可知,預(yù)測(cè)最大釘軸力最大值均小于100 kN,實(shí)測(cè)土釘軸力最大值和預(yù)測(cè)土釘軸力最大值與1∶1 對(duì)應(yīng)線的偏差,圖形不完全吻合,造成不吻合的原因可能有以下四個(gè)方面:可能與土壤類型、地形、環(huán)境;試驗(yàn)儀器本身的誤差;人為造成的誤差;模型本身的誤差。
圖8 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)土釘軸力最大值與土釘軸力實(shí)際監(jiān)測(cè)值Fig.8 Neural network predicts the maximum value of soil nail axial force and the actual monitoring value of soil nail axial force
圖9 為土釘軸力最大值神經(jīng)網(wǎng)絡(luò)模型的模型因子λB與預(yù)測(cè)土釘軸力最大值關(guān)系圖。由圖可知,土釘軸力的μλ 和COVλ分別1 和0.37。表明預(yù)測(cè)土釘軸力最大值的平均值比實(shí)測(cè)土釘軸力最大值的平均值一樣。圖中λ 大于2 的數(shù)據(jù)點(diǎn)有2 個(gè),但未發(fā)現(xiàn)將這些土釘軸力最大值識(shí)別為異常值的原因,剔除問(wèn)題數(shù)據(jù)后土釘軸力最大值數(shù)據(jù)(n=143)的斯皮爾曼秩相關(guān)系數(shù)為ρ=0.88(大于零)P 值<0.05。表明拒絕了λ 和預(yù)測(cè)土釘軸力最大值相互獨(dú)立的零假設(shè)。由于該方法的準(zhǔn)確性取決于土釘軸力最大值的大小,即使從數(shù)據(jù)集中省略2 個(gè)最高數(shù)據(jù)點(diǎn),偏差依賴性的定量指標(biāo)顯示仍然相關(guān)。
圖9 神經(jīng)網(wǎng)絡(luò)模型的模型因子與λB 預(yù)測(cè)土釘軸力最大值關(guān)系Fig.9 The relationship between the model factor of the neural network model and λB to predict the maximum axial force of soil nail
表1 為不同土釘軸力模型相關(guān)參數(shù)對(duì)比表,由表可知,對(duì)比國(guó)內(nèi)現(xiàn)有常應(yīng)用于實(shí)際工程的土釘軸力模型,可知該神經(jīng)網(wǎng)絡(luò)土釘軸力預(yù)測(cè)模型中的土釘軸力平均值更加精確,模型因子的變異性更小。且該神經(jīng)網(wǎng)絡(luò)土釘軸力預(yù)測(cè)模型的預(yù)測(cè)精度和預(yù)測(cè)土釘軸力最大值之間不存在相關(guān)性,因而適用性更廣泛。
表1 不同土釘軸力模型相關(guān)參數(shù)對(duì)比Tab.1 Comparison of parameters of different soil nailing axial force models
收集大量工作狀態(tài)下土釘軸力最大值的實(shí)測(cè)數(shù)據(jù),建立一個(gè)考慮土釘墻參數(shù)、土釘參數(shù)、土參數(shù)和超載情況等因素的土釘軸力預(yù)測(cè)模型,然后通過(guò)Matlab神經(jīng)網(wǎng)絡(luò)代碼和神經(jīng)網(wǎng)絡(luò)工具箱進(jìn)行土釘軸力最大模擬。得出的主要結(jié)論如下:
(1)該神經(jīng)網(wǎng)絡(luò)模型土釘軸力最大值預(yù)測(cè)的預(yù)測(cè)值與土釘軸最大值實(shí)測(cè)值吻合程度很高,離群點(diǎn)較少。
(2)該神經(jīng)網(wǎng)絡(luò)梯度穩(wěn)步降低,其中LM 算法里面的參數(shù)Mu 基本上隨著迭代次數(shù)穩(wěn)定變化,最大值也未超過(guò)0.001,訓(xùn)練R 值為0.981,驗(yàn)證R 值為0.73,測(cè)試R 值為0.82,整體R 值為0.92。
(3)對(duì)比規(guī)范現(xiàn)有土釘軸力模型,該神經(jīng)網(wǎng)絡(luò)土釘軸力預(yù)測(cè)模型的土釘軸力平均值更精確,模型因子變異性更小,且預(yù)測(cè)精度和土釘軸力最大值之間不存在相關(guān)性,因此適用性更廣泛。