王雪明,劉陜南,肖曉春,包蓁
(1 上海工程技術(shù)大學(xué) 城市軌道交通學(xué)院,上海 201620;2 上海隧道工程有限公司,上海 200032)
在傳統(tǒng)城市隧道施工引起地面變形的預(yù)測方法中,有Peck 公式法、有限單元法等[1]。與此不同,神經(jīng)網(wǎng)絡(luò)方法因其強(qiáng)大的數(shù)據(jù)計算處理能力逐漸得到應(yīng)用。本文依托北橫通道新建工程,工程利用一臺直徑為15.56m 的泥水氣壓平衡盾構(gòu)機(jī)下穿城市密集建筑區(qū)掘進(jìn)隧道。對于盾構(gòu)推進(jìn)引起的地面變形,通過神經(jīng)網(wǎng)絡(luò)的方法進(jìn)行預(yù)測研究。
孫鈞等通過整理實測資料并對土體擾動機(jī)理進(jìn)行分析,說明根據(jù)監(jiān)測資料并利用神經(jīng)網(wǎng)絡(luò)可以對盾構(gòu)隧道施工過程中的地層移動進(jìn)行有效的動態(tài)實時預(yù)測[1];李紅霞等利用遺傳算法優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)的初始權(quán)重,建立模型對地下水位影響強(qiáng)度進(jìn)行分析,說明地面沉降與地下水位存在一致響應(yīng)趨勢[2];王志亮等將雜交法與改進(jìn)BP 法、多元回歸法對比,預(yù)測粉噴樁的抗壓強(qiáng)度,即先用遺傳算法對全局進(jìn)行訓(xùn)練,再用BP 網(wǎng)絡(luò)進(jìn)行精度訓(xùn)練,加快了網(wǎng)絡(luò)的收斂,避免了局部極小問題的出現(xiàn),達(dá)到了要求的預(yù)測精度[3];王睿等結(jié)合實際工程,通過將傳統(tǒng)的BP 神經(jīng)網(wǎng)絡(luò)與遺傳算法相結(jié)合的方法,實現(xiàn)針對實際隧道工程施工參數(shù)與隧道變形值之間的正反演分析,達(dá)到了高效且相對準(zhǔn)確的沉降預(yù)測及支護(hù)參數(shù)的最優(yōu)尋找[4]。
綜合以往研究分析發(fā)現(xiàn),神經(jīng)網(wǎng)絡(luò)方法及其一系列優(yōu)化方法在預(yù)測盾構(gòu)推進(jìn)施工引起地面變形中的應(yīng)用成果斐然,但在面對具體工程數(shù)據(jù)時神經(jīng)網(wǎng)絡(luò)凸顯的自身缺陷問題還有待研究。
本文擬采用軟件編程數(shù)據(jù)處理的方法,以BP神經(jīng)網(wǎng)絡(luò)為研究點,利用遺傳算法優(yōu)化模型訓(xùn)練所需的初始權(quán)重,并基于實測數(shù)據(jù)的特點,改進(jìn)遺傳算法的種群遺傳規(guī)則,探究BP 神經(jīng)網(wǎng)絡(luò)局部最優(yōu)問題。
BP 神經(jīng)網(wǎng)絡(luò),即Back-propagation Neural Network,采用權(quán)值閾值正向傳播計算,反向修正的方法對數(shù)據(jù)進(jìn)行訓(xùn)練擬合[5],即構(gòu)建的網(wǎng)絡(luò)模型隨機(jī)初始化給出各層的連接權(quán)值和閾值,對網(wǎng)絡(luò)輸入層每組數(shù)據(jù)各個維度上的數(shù)值進(jìn)行連接權(quán)、閾值的計算,傳播到隱含層并通過該層神經(jīng)元上的傳遞函數(shù)計算各單元的輸出,再對此輸出進(jìn)行連接權(quán)、閾值的計算,傳播到輸出層,通過該層神經(jīng)元上的傳遞函數(shù)計算網(wǎng)絡(luò)的最終輸出值,將網(wǎng)絡(luò)實際輸出與目標(biāo)輸出進(jìn)行誤差計算,當(dāng)誤差值不滿足預(yù)設(shè)條件時,反向修正各層連接權(quán)值、閾值,往復(fù)迭代直到滿足網(wǎng)絡(luò)預(yù)設(shè)條件之一,完成網(wǎng)絡(luò)訓(xùn)練。其中,隱含層傳遞函數(shù)一般為S 型函數(shù),輸出層一般為purelin函數(shù),即線性函數(shù)[6]。計算原理如圖1 所示。
圖1 BP 神經(jīng)網(wǎng)絡(luò)算法數(shù)據(jù)訓(xùn)練原理Fig.1 The principle of BP neural network algorithm data training
傳統(tǒng)BP 神經(jīng)網(wǎng)絡(luò)有一些難以克服的局限性,如局部最優(yōu)問題、初始權(quán)重敏感性、網(wǎng)絡(luò)不可重現(xiàn)性等等[5,7]。很多學(xué)者因此引入遺傳算法,用以克服BP 的缺陷。
遺傳算法,即Genetic Algorithm,是一種學(xué)習(xí)生物界自然選擇和自然遺傳機(jī)制構(gòu)建的隨機(jī)優(yōu)化搜索算法[4,8]。算法在目標(biāo)函數(shù)的基礎(chǔ)上計算適應(yīng)度值,依據(jù)適應(yīng)度值進(jìn)行遺傳操作,尋優(yōu)規(guī)則由概率決定,更容易將較優(yōu)個體遺傳至下一代,其與BP 神經(jīng)網(wǎng)絡(luò)的結(jié)合是優(yōu)化的重點,也是編寫程序的前提。
一方面,遺傳算法中要針對優(yōu)化對象定義個體適應(yīng)度值?;谶z傳算法的原理,先將訓(xùn)練均方誤差值FY 作為目標(biāo)函數(shù),即擬合值與真實值之差的平方和的平均值,公式(1)表示:
再對其計算適應(yīng)度值,以此衡量個體對于種群的適應(yīng)程度,用公式(2)表示:
當(dāng)目標(biāo)函數(shù)FY越小,適應(yīng)度值FF越大,表明此時的個體更適應(yīng)會被遺傳到下一代。
另一方面,為了結(jié)合遺傳算法,先對BP 循環(huán)訓(xùn)練n次,并將這n次隨機(jī)生成的初始權(quán)值閾值通過矩陣轉(zhuǎn)換后,再利用實數(shù)編碼,可以形成初始種群,初始種群即包含n組遺傳個體[9-10]。
結(jié)合以上兩方面,在個體適應(yīng)度的基礎(chǔ)上計算個體概率和累計概率,分別如公式(3)、(4)所示:
適應(yīng)度值越高的父本個體,越容易被選中,即按照選擇概率隨機(jī)數(shù)執(zhí)行選擇操作,之后再進(jìn)行交叉操作、變異操作。這樣得到新的n組個體,即構(gòu)成第二代種群,再對其進(jìn)行實數(shù)解碼,轉(zhuǎn)換為權(quán)值閾值矩陣回賦網(wǎng)絡(luò)訓(xùn)練,計算新個體的均方誤差、適應(yīng)度值。
由此,可將遺傳算法基本步驟描述如下[4]:
(1)確定編解碼方案,生成初代種群;
(2)根據(jù)目標(biāo)函數(shù)計算個體適應(yīng)度;
(3)選擇操作;
(4)交叉操作;
(5)變異操作;
(6)新一代種群,及其適應(yīng)度值計算;
(7)返回(3),直至達(dá)到預(yù)設(shè)遺傳代數(shù)或滿足誤差要求。
經(jīng)過遺傳算法的優(yōu)化操作后,網(wǎng)絡(luò)再訓(xùn)練所需的初始權(quán)重不再是隨機(jī)給出,而是建立在遺傳操作上的收斂優(yōu)化,從而得到較穩(wěn)定的訓(xùn)練結(jié)果。
傳統(tǒng)遺傳算法由于隨機(jī)數(shù)的依賴性,在個體的選擇操作上存在很多可能性,即并不一定是最優(yōu)個體被選中或多次選中。
為了能達(dá)到更優(yōu)化的訓(xùn)練效果以及提高訓(xùn)練的時效性,應(yīng)該對算法中的種群遺傳規(guī)則進(jìn)行改進(jìn),即從各代種群中人為保留較優(yōu)的個體。為了使保留的優(yōu)化個體構(gòu)成的新初代種群與最初種群規(guī)模一致,在程序的編寫上應(yīng)該針對初始種群包含的全部個體數(shù)先期進(jìn)行成倍的遺傳代數(shù)操作。
如以10 組個體生成初始種群,先對初始種群進(jìn)行10n代數(shù)的遺傳操作,產(chǎn)生全部的10n組、每組10 個數(shù)量的均方誤差數(shù)據(jù)集,可對應(yīng)從中摘取匹配初始種群個數(shù)數(shù)量的最優(yōu)個體,于是摘取的優(yōu)化個體構(gòu)成新的初代種群,再以新初代種群進(jìn)行10n代數(shù)的遺傳操作。以此往復(fù),定義這樣的優(yōu)化方法的每次循環(huán)操作為“優(yōu)化次數(shù)”,整合程序完成訓(xùn)練,直到優(yōu)化次數(shù)滿足預(yù)設(shè)數(shù)量或誤差值滿足條件,優(yōu)化完成。具體流程如圖2 所示。
圖2 改進(jìn)的遺傳算法計算原理思路Fig.2 The principle of improved genetic algorithm
本文背景工程為上海北橫通道新建工程Ⅱ標(biāo),項目主要施工內(nèi)容為主線盾構(gòu)隧道段,所用泥水氣壓平衡盾構(gòu)機(jī)直徑達(dá)到15.56 m,即定義為超大直徑泥水盾構(gòu)隧道,沿線地質(zhì)復(fù)雜,隧道穿越土層以粉質(zhì)黏土為主,隧道下方已進(jìn)入砂性土地層,總體地層分布為典型的黏土、砂土復(fù)合斷面,如圖3 所示,土層物理力學(xué)性能見表1。在盾構(gòu)區(qū)段覆土上方地面存在較多如住宅樓,商場等建構(gòu)筑物,若盾構(gòu)施工參數(shù)控制不當(dāng),極易造成盾構(gòu)失穩(wěn),引發(fā)地面變形,影響地面以上建構(gòu)筑物的使用。
圖3 北橫隧道部分區(qū)段地層分布示意圖Fig.3 Distribution of strata in some sections of North Cross Tunnel
表1 土層物理力學(xué)性能參數(shù)表Tab.1 Table of physical and mechanical properties parameters of soil layer
盾構(gòu)推進(jìn)引起的地面變形是一個復(fù)雜的非線性問題,在盾構(gòu)推進(jìn)過程中不斷發(fā)展變化,其中切口面上方地面變形和注漿引起的地面變形尤為突出。本文聚焦于神經(jīng)網(wǎng)絡(luò)方法研究,主要針對盾構(gòu)切口面上方地面變形進(jìn)行分析,也即將盾構(gòu)切口面上方地面變形作為BP 神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)擬合及預(yù)測對象,參考相關(guān)研究成果,對采集的盾構(gòu)段原始數(shù)據(jù)經(jīng)過整理篩選后,選定6 個參數(shù)作為BP 神經(jīng)網(wǎng)絡(luò)輸入端的處理對象,具體為隧道開挖面上方覆土厚度、盾構(gòu)開挖推進(jìn)速度、盾構(gòu)總推力;盾構(gòu)開挖截面土體壓縮模量、內(nèi)摩擦角、粘聚力見表2。
表2 神經(jīng)網(wǎng)絡(luò)模型輸入輸出數(shù)據(jù)Tab.2 Input and output data of neural network model
本文通過MATLAB 軟件構(gòu)建網(wǎng)絡(luò)實操程序算法。按照原理流程,前一部分模型的建立包括:
(1)原始數(shù)據(jù)歸一化、數(shù)據(jù)劃分。即對整理的40 組現(xiàn)場實測數(shù)據(jù)依據(jù)數(shù)據(jù)歸一化原理變換成[-1,1]之間的數(shù)值[10],再將1~30 組劃分為訓(xùn)練樣本,31~40 組為預(yù)測樣本;
(2)BP 網(wǎng)絡(luò)參數(shù)預(yù)設(shè)和模型的建立。基于表2的工程實測數(shù)據(jù)可知,輸入端變量維數(shù)為6,輸出端維數(shù)為1,根據(jù)隱含層節(jié)點數(shù)計算經(jīng)驗公式(5)[5]:
其中,n和m分別為輸入、輸出層的神經(jīng)元個數(shù),依據(jù)上文分別為6 和1,a是[0,10]之間的常數(shù),且為了避免隱含層節(jié)點數(shù)設(shè)置較多時會導(dǎo)致訓(xùn)練時間過長或過擬合的缺陷,取隱含層神經(jīng)元數(shù)為M=4,即構(gòu)成6-4-1 的BP神經(jīng)網(wǎng)絡(luò)模型。
模型建立完成后,利用MATLAB 繼續(xù)編寫代碼實現(xiàn)各方法的具體實操,即:
(1)構(gòu)建循環(huán)節(jié)形成BP 方法。在循環(huán)節(jié)中隨機(jī)生成網(wǎng)絡(luò)訓(xùn)練所需的權(quán)值閾值,并將其作為網(wǎng)絡(luò)訓(xùn)練的初始權(quán)重回賦給已建立的網(wǎng)絡(luò)模型,隨即進(jìn)行網(wǎng)絡(luò)的訓(xùn)練、預(yù)測及相關(guān)數(shù)據(jù)的輸出。
(2)融合遺傳算法構(gòu)成GA-BP 方法。先將BP訓(xùn)練10 次中隨機(jī)給出的網(wǎng)絡(luò)初始權(quán)重作為遺傳算法的初始化種群,再將經(jīng)選擇、交叉、變異后的種群回賦給網(wǎng)絡(luò)計算適應(yīng)度值,以此構(gòu)建循環(huán)節(jié)往復(fù)進(jìn)行1 000代的遺傳操作,直至遺傳代數(shù)達(dá)到預(yù)設(shè)值為止。
(3)對遺傳算法的種群遺傳機(jī)制進(jìn)行改進(jìn),形成改進(jìn)的GA-BP 方法。先將BP 訓(xùn)練10 次中隨機(jī)給出的網(wǎng)絡(luò)初始權(quán)重作為遺傳算法的初始化種群,再利用遺傳算法進(jìn)行10 代的遺傳操作,并人為從10 代遺傳操作中選出每代最優(yōu)個體作為下次10 代遺傳操作的新初始種群,將最優(yōu)個體的不斷選擇定義為“優(yōu)化次數(shù)”,循環(huán)直至達(dá)到預(yù)設(shè)值1 000為止。
對于BP 方法,為了避免局部最優(yōu),采用多次隨機(jī)訓(xùn)練的方式,尋找最優(yōu)結(jié)果,故設(shè)置循環(huán)次數(shù)為1 000,依據(jù)構(gòu)建的循環(huán)節(jié),網(wǎng)絡(luò)每次隨機(jī)給出[-1,1]之間不同的初始權(quán)重,執(zhí)行程序完成訓(xùn)練操作,在這1 000次訓(xùn)練中找到相對較優(yōu)結(jié)果。
對于GA-BP 方法和改進(jìn)的GA-BP 方法,分別完成1 000代遺傳操作和1 000次優(yōu)化操作,保留各方法實操結(jié)果,整理網(wǎng)絡(luò)計算數(shù)據(jù),繪制訓(xùn)練樣本均方誤差變化曲線和各方法最優(yōu)網(wǎng)絡(luò)輸出擬合曲線,如圖4~5 所示。
圖4 三方法訓(xùn)練均方誤差變化曲線Fig.4 Three-method training mean square error variation curve
由圖4 可以看出,BP 方法整體訓(xùn)練均方誤差值較大且出現(xiàn)個別幾次誤差值異常大的情況;而相比之下GA-BP 方法均方誤差值有了很大幅度的降低,不再有異常大誤差值的出現(xiàn),均方誤差整體保持在一個較小的范圍內(nèi);相比前兩項操作,改進(jìn)的GA-BP 方法均方誤差值表現(xiàn)出更好的降低趨勢。
重復(fù)對3 個方法的實操發(fā)現(xiàn),由于BP 方法每次給出的初始權(quán)重不同,故訓(xùn)練結(jié)果依然表現(xiàn)出離散性大的缺陷;而利用遺傳算法對BP 網(wǎng)絡(luò)訓(xùn)練的初始權(quán)重進(jìn)行優(yōu)化后的GA-BP 方法,訓(xùn)練結(jié)果顯示均方誤差均可以保持在一個較小的區(qū)間范圍;再到改進(jìn)的GA-BP 方法,均方誤差降低趨勢的出現(xiàn)也不是偶然的,任意給出一組初始權(quán)重,經(jīng)過網(wǎng)絡(luò)實操后均可得到如圖4(c)所示的誤差降低曲線,訓(xùn)練結(jié)果不再依賴網(wǎng)絡(luò)限定的最初權(quán)重,這對最優(yōu)訓(xùn)練效果的尋找具有積極意義。
結(jié)合圖5 的網(wǎng)絡(luò)輸出擬合曲線可見,BP 方法最優(yōu)的一次訓(xùn)練結(jié)果擬合表現(xiàn)良好,即可以說明BP方法實現(xiàn)的大量隨機(jī)訓(xùn)練避免了一次訓(xùn)練可能會出現(xiàn)的局部最優(yōu)現(xiàn)象,從而得到較好的擬合效果;3 種方法擬合曲線對比,不難看出,改進(jìn)的GA-BP 方法擬合效果較前兩個方法整體更接近實測值。
圖5 3 種方法訓(xùn)練擬合曲線Fig.5 Three-method training fitting curve
為了探究各方法網(wǎng)絡(luò)訓(xùn)練后的預(yù)測能力,在網(wǎng)絡(luò)訓(xùn)練完成后也進(jìn)行了預(yù)測實操,并繪制預(yù)測樣本的網(wǎng)絡(luò)輸出擬合曲線,如圖6 所示,可見3 種方法最優(yōu)訓(xùn)練輸出對應(yīng)的預(yù)測效果也是較滿意的,改進(jìn)的GA-BP 方法較前兩種方法預(yù)測值整體更貼近實際地表變形值。
圖6 3 種方法預(yù)測擬合曲線Fig.6 Three-method predicting fitting curves
不妨從定量化的角度,對比3 種方法的訓(xùn)練和預(yù)測精度,見表3。對比BP 方法,遺傳算法優(yōu)化的BP 神經(jīng)網(wǎng)絡(luò)提高了訓(xùn)練穩(wěn)定性;再將改進(jìn)的GABP 方法和前兩種方法對比,可見其誤差值得到有效的降低,如改進(jìn)的GA-BP 方法較前兩種方法訓(xùn)練誤差降低了50%以上,預(yù)測誤差降低了25%以上,各項誤差最小、預(yù)測精度達(dá)到最高。
表3 3 種方法定量分析Tab.3 Quantitative analysis of three methods
為了進(jìn)一步測試改進(jìn)的GA-BP 方法對盾構(gòu)推進(jìn)引起地面變形的預(yù)測能力,整理出100 組實測數(shù)據(jù),將前90 組作為訓(xùn)練樣本,后10 組作為預(yù)測樣本,執(zhí)行程序,經(jīng)過1 000次優(yōu)化操作后,繪制出預(yù)測均方誤差變化曲線如圖7 所示,可見在優(yōu)化次數(shù)為0~100的區(qū)間內(nèi),誤差迅速下降,從而保證預(yù)測擬合結(jié)果快速的穩(wěn)定在一個可以接受的精確度,提高了預(yù)測工作效率,并且隨著優(yōu)化次數(shù)的繼續(xù)增加,誤差可以繼續(xù)下降收斂至更低值,但下降的速度有所減緩。
圖7 改進(jìn)的GA-BP 方法預(yù)測均方誤差變化曲線Fig.7 Improved GA-BP method predicting mean square error variation curve
對比優(yōu)化次數(shù)為100、300、1 000時的預(yù)測擬合曲線,如圖8 所示,可見網(wǎng)絡(luò)經(jīng)過100 次的優(yōu)化操作時,該方法的預(yù)測值趨勢與實測值總體吻合,當(dāng)優(yōu)化次數(shù)達(dá)到1 000時,預(yù)測值最接近實測值,預(yù)測達(dá)到了更高的精度。
如圖8 所示,對比100、300、1 000 次的預(yù)測誤差值,整理輸出數(shù)據(jù)見表4,可見:
圖8 改進(jìn)的GA-BP 方法預(yù)測擬合曲線Fig.8 Improved GA-BP method predicting fitting curve
表4 預(yù)測精確度計算分析Tab.4 Analysis of predictive accuracy
(1)一般情況下,采用改進(jìn)的GA-BP 方法預(yù)測盾構(gòu)推進(jìn)引起的地面變形時,網(wǎng)絡(luò)經(jīng)過100~300 次優(yōu)化操作后,即可將大部分樣本誤差控制在10%~25%之間;
(2)若想繼續(xù)提高預(yù)測精度,可根據(jù)實際需求繼續(xù)增大優(yōu)化次數(shù),從而得到更理想的預(yù)測效果,使得預(yù)測值更接近實測值;
(3)對于部分樣本組誤差較大的情況,考慮到算法、輸入變量等還有值得改進(jìn)的地方,這將在后續(xù)的研究中繼續(xù)深入,進(jìn)一步提高預(yù)測精度。
(1)BP 神經(jīng)網(wǎng)絡(luò)在數(shù)據(jù)預(yù)測上具有較好且較便捷、省時的研究價值。但傳統(tǒng)BP 存在訓(xùn)練誤差離散性大的缺陷,即初始權(quán)重敏感性大導(dǎo)致網(wǎng)絡(luò)訓(xùn)練不穩(wěn)定;
(2)利用遺傳算法對BP 神經(jīng)網(wǎng)絡(luò)的初始權(quán)函數(shù)進(jìn)行優(yōu)化后,大大減小了傳統(tǒng)BP 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練隨機(jī)性和離散性,避免了極大誤差值即極差訓(xùn)練結(jié)果的出現(xiàn),說明優(yōu)化初始權(quán)函數(shù)對提高BP 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練穩(wěn)定性和擬合精度有較好作用;
(3)對GA-BP 中的種群遺傳規(guī)則進(jìn)行改進(jìn)后形成的改進(jìn)GA-BP 方法很好的完成了網(wǎng)絡(luò)訓(xùn)練的優(yōu)化,訓(xùn)練和預(yù)測結(jié)果都達(dá)到了更高的精度,通過新數(shù)據(jù)的預(yù)測也進(jìn)一步驗證了此方法在盾構(gòu)隧道引起地面沉降預(yù)測中應(yīng)用的可推廣價值;
(4)本文著重進(jìn)行了神經(jīng)網(wǎng)絡(luò)方法的比較與優(yōu)化研究,因此以地面沉降作為輸出,參考了類似研究成果選取了影響盾構(gòu)上方地面沉降的6 個參數(shù)作為輸入端變量,經(jīng)過實測數(shù)據(jù)分析能對地表沉降進(jìn)行有效預(yù)測。后續(xù)還可以進(jìn)一步深入研究,譬如加入注漿參數(shù)用以研究注漿和盾尾脫出后的地表沉降預(yù)測問題。