張博航,薛新華
(四川大學(xué)水利水電學(xué)院,四川 成都 610065)
樁基是一種適用范圍廣同時(shí)承載能力較高的基礎(chǔ)。伴隨著城市化進(jìn)程的快速發(fā)展,建筑物對(duì)樁基豎向承載能力提出了更高的要求。成樁方法不斷發(fā)展的同時(shí)樁身材料與樁身形狀也在不斷豐富以適應(yīng)不同的工程需要。在地下水位較高與上部水平荷載較大的情況下,建筑物基礎(chǔ)需要具備一定的抗浮能力。為提高樁基礎(chǔ)抗拔承載能力,工程建設(shè)領(lǐng)域開始廣泛運(yùn)用異截面樁。擴(kuò)底灌注樁是一種樁體質(zhì)量可靠的異形截面樁,擁有較好的抗拔承載能力[1]。傳統(tǒng)方法測(cè)試樁的抗拔承載能力存在一些不足(例如耗時(shí)很長(zhǎng)且價(jià)格昂貴),在某些特殊情況下很難大規(guī)模開展靜荷載測(cè)試。因此,提出一種基于少量靜荷載測(cè)試準(zhǔn)確獲取特定地區(qū)樁體極限抗拔承載力的方法是很有必要的。
伴隨著計(jì)算機(jī)技術(shù)與大數(shù)據(jù)處理技術(shù)的快速發(fā)展,機(jī)器學(xué)習(xí)作為擁有高泛化能力的數(shù)據(jù)處理方法應(yīng)運(yùn)而生。機(jī)器學(xué)習(xí)方法精度較高且計(jì)算速度快捷,近年來在工程建設(shè)領(lǐng)域取得了豐富的研究成果。例如,人工神經(jīng)網(wǎng)絡(luò)(ANN)、支持向量機(jī)(SVM)、遺傳算法(GA)等方法被廣泛運(yùn)用于預(yù)測(cè)樁基豎向極限承載能力與不同類型土壤中的樁體沉降。劉順[2]利用優(yōu)化BP神經(jīng)網(wǎng)絡(luò)建立了單樁豎向極限承載力的預(yù)測(cè)模型;李平[3]將神經(jīng)網(wǎng)絡(luò)運(yùn)用于高層建筑樁基承載力預(yù)測(cè)中,并建立了預(yù)測(cè)超長(zhǎng)樁豎向極限承載能力的預(yù)測(cè)模型。但機(jī)器學(xué)習(xí)方法依然存在不足,如預(yù)測(cè)模型內(nèi)部計(jì)算超參數(shù)難以選取、計(jì)算模型陷入局部極值、計(jì)算速度較慢以及出現(xiàn)過擬合問題等。為解決機(jī)器學(xué)習(xí)方法的不足,常用群體智能算法對(duì)計(jì)算模型進(jìn)行優(yōu)化,利用自適應(yīng)變異與均衡慣性權(quán)重方法進(jìn)行參數(shù)尋優(yōu)[4]。目前針對(duì)擴(kuò)底灌注樁極限抗拔承載能力的研究較少,同時(shí)尚未有準(zhǔn)確計(jì)算樁體極限抗拔承載力的方法。本文利用PSO算法對(duì)RF算法進(jìn)行參數(shù)優(yōu)化(即PSO-RF算法),建立了多因素影響下擴(kuò)底灌注樁極限抗拔承載能力的預(yù)測(cè)模型。預(yù)測(cè)結(jié)果與實(shí)際測(cè)量結(jié)果相比,數(shù)據(jù)之間的吻合度很高,模型的決定系數(shù)R2為0.974且100%的數(shù)據(jù)點(diǎn)誤差在20%以內(nèi)。通過PSO-RF方法建立的預(yù)測(cè)模型對(duì)快速確定擴(kuò)底灌注樁極限抗拔承載力以及提高工作效率有重要意義。
PSO算法[5]其思路是初始化一群隨機(jī)粒子,然后通過反復(fù)迭代計(jì)算找到全局最優(yōu)解。算法主要步驟如下:
1)粒子群初始化。采用混沌映射方法確定d維空間上粒子群初始化后的速度區(qū)間及搜索空間、確定隨機(jī)粒子最初的速度與位置,均勻分布粒子種群初始位置。
2)確定粒子個(gè)體極值。計(jì)算每一個(gè)粒子的適應(yīng)值fi,然后同個(gè)體極值Pi進(jìn)行比較,若fi≥Pi,則用fi代替Pi。
3)確定粒子群全局極值。比較全局極值G與適應(yīng)值fi,若fi≥G,則用fi代替G。
4)更新粒子的位置與速度。隨機(jī)粒子的速度和位置更新公式如式(1),式(2)所示。
(1)
(2)
為了避免粒子群在有限迭代次數(shù)下出現(xiàn)早熟收斂情況,本文采用動(dòng)態(tài)自適應(yīng)慣性權(quán)重平衡算法的全局搜索能力與局部搜索能力,從而找到全局最優(yōu)解。動(dòng)態(tài)自適應(yīng)慣性權(quán)重的計(jì)算方法如式(3)所示:
(3)
其中,f為粒子當(dāng)前的適應(yīng)度值;w為慣性權(quán)重。
5)判斷PSO算法是否終結(jié)。若滿足條件則結(jié)束算法并輸出結(jié)果,否則返回步驟2)。
RF算法屬于機(jī)器學(xué)習(xí)中的集成學(xué)習(xí)方法,本質(zhì)上是一種包含若干決策樹的強(qiáng)學(xué)習(xí)模型,主要運(yùn)用于解決分類與回歸問題。該算法將隨機(jī)形成的決策樹組合形成一個(gè)分類預(yù)測(cè)能力更加高效的強(qiáng)分類器,根據(jù)少數(shù)服從多數(shù)的原則,結(jié)合所有決策樹的預(yù)測(cè)結(jié)果確定最終的預(yù)測(cè)結(jié)果。算法有效解決了決策樹決策流程單一的問題,并且不同決策樹訓(xùn)練過程能夠高度并行,增強(qiáng)了模型的泛化能力與計(jì)算速度。算法具體步驟如下[6]:
1)從數(shù)據(jù)總集中采用隨機(jī)重復(fù)抽樣的方式抽取m個(gè)數(shù)據(jù)組成訓(xùn)練集,剩余的數(shù)據(jù)為模型測(cè)試集。2)訓(xùn)練集利用分類回歸算法訓(xùn)練為若干并行的決策樹。3)重復(fù)步驟1)和2)直到?jīng)Q策樹數(shù)量T滿足算法要求。4)取決策樹預(yù)測(cè)值的平均值作為回歸問題最終的預(yù)測(cè)結(jié)果。算法具體流程如圖1所示。
研究表明,決策樹數(shù)量n、決策樹最大深度p對(duì)RF模型預(yù)測(cè)精度與計(jì)算速度的影響很大。參數(shù)合理取值可縮短模型計(jì)算時(shí)間、提高預(yù)測(cè)精度。傳統(tǒng)RF算法需要對(duì)超參數(shù)進(jìn)行大量試錯(cuò)計(jì)算,計(jì)算效率較低且容易出現(xiàn)過擬合情況,模型可靠性有待優(yōu)化。而利用群體局部信息和全局信息進(jìn)行指導(dǎo)搜索的PSO算法具備較優(yōu)秀的參數(shù)選擇能力?;诖?本文提出了將PSO與RF混合的預(yù)測(cè)模型。PSO-RF算法建立預(yù)測(cè)模型主要包括三個(gè)階段,即數(shù)據(jù)預(yù)處理、超參數(shù)迭代優(yōu)化、預(yù)測(cè)模型訓(xùn)練及測(cè)試。首先算法會(huì)將原始數(shù)據(jù)進(jìn)行歸一化處理以提高模型的精度與計(jì)算效率。隨機(jī)選取80%的數(shù)據(jù)用于模型訓(xùn)練,剩余數(shù)據(jù)對(duì)模型進(jìn)行測(cè)試。利用粒子群優(yōu)化算法對(duì)超參數(shù)(決策樹個(gè)數(shù)n和決策樹最大深度p)進(jìn)行優(yōu)化調(diào)整。算法指定初始參數(shù)后進(jìn)行迭代計(jì)算,確定每輪迭代后粒子的局部最優(yōu)與全局最優(yōu)值。當(dāng)?shù)螖?shù)最大且粒子適應(yīng)度值不變時(shí),得到最優(yōu)的超參數(shù)。模型運(yùn)算流程如圖2所示。
本文收集了已發(fā)表文獻(xiàn)中40組上海地區(qū)建筑工程項(xiàng)目的擴(kuò)底灌注抗拔樁現(xiàn)場(chǎng)試驗(yàn)數(shù)據(jù)作為建立PSO-RF預(yù)測(cè)模型的數(shù)據(jù)基礎(chǔ)[7]。為建立一個(gè)穩(wěn)健的預(yù)測(cè)模型,輸入?yún)?shù)的選擇至關(guān)重要。本節(jié)利用統(tǒng)計(jì)分析軟件(Statistical Product and Service Solutions, SPSS)對(duì)數(shù)據(jù)庫中6個(gè)參數(shù)與樁體極限抗拔承載力之間的相關(guān)性進(jìn)行了分析,結(jié)果如表1所示。表1中,V1—V7分別表示樁體擴(kuò)大段上部土層的抗拔阻力、樁側(cè)土體摩阻力加權(quán)平均值、抗拔樁直桿段的長(zhǎng)徑比、擴(kuò)底部分直徑與直桿段直徑之比、擴(kuò)底段樁身直徑、擴(kuò)底段樁長(zhǎng)和擴(kuò)底抗拔樁極限抗拔強(qiáng)度,#表示兩參數(shù)間的相關(guān)性在0.01級(jí)別上顯著(單尾)。根據(jù)肯德爾相關(guān)性分析結(jié)果,樁體擴(kuò)大段上部土層的抗拔阻力、擴(kuò)底部分直徑與直桿段直徑之比和擴(kuò)底段樁長(zhǎng)等參數(shù)之間的相關(guān)性較高,分別為0.325,0.278和0.277。將相關(guān)程度不同的變量代入計(jì)算模型能夠提高模型的準(zhǔn)確度。根據(jù)肯德爾相關(guān)性分析結(jié)果(見表1),本文將樁體擴(kuò)大段上部土層的抗拔阻力(kPa)、樁側(cè)土體摩阻力加權(quán)平均值(kPa)、抗拔樁直桿段的長(zhǎng)徑比、擴(kuò)底部分直徑與直桿段直徑之比、擴(kuò)底段樁身直徑(m)、擴(kuò)底段樁長(zhǎng)(m)6個(gè)參數(shù)作為模型的輸入變量,將擴(kuò)底抗拔樁極限抗拔承載力(kN)作為輸出變量。
表1 肯德爾相關(guān)性分析結(jié)果
為了檢驗(yàn)所提模型的準(zhǔn)確性,決定系數(shù)(Coefficient of Determination,R2)、變異系數(shù)(Coefficient of Variation, COV)、平均絕對(duì)誤差(Mean Absolute Error, MAE)、均方根誤差(Root Mean Square Error, RMSE)、平均百分比誤差(Mean Absolute Percentage Error, MAPE)等統(tǒng)計(jì)指標(biāo)來評(píng)價(jià)實(shí)測(cè)值和預(yù)測(cè)值之間的誤差。其中,標(biāo)準(zhǔn)差與平均值的比值稱為變異系數(shù),均方根誤差是預(yù)測(cè)值和實(shí)際值的差值,平均絕對(duì)誤差是預(yù)測(cè)值和實(shí)際值之間的平均誤差,平均百分比誤差是評(píng)價(jià)模型優(yōu)化程度的指標(biāo),以上四個(gè)評(píng)價(jià)指標(biāo)數(shù)值越小,則說明模型的性能越好。決定系數(shù)表示模型試驗(yàn)值與預(yù)測(cè)值的擬合情況,其數(shù)值越接近于1,則說明擬合情況越好,預(yù)測(cè)值越接近實(shí)際值。以上指標(biāo)公式表達(dá)如式(4)—式(8):
(4)
(5)
(6)
(7)
(8)
為避免數(shù)據(jù)庫中數(shù)據(jù)的量綱不同對(duì)模型結(jié)果造成影響,本文在Matlab平臺(tái)中采用Mapminmax函數(shù)將數(shù)據(jù)歸一化處理至[0,1]。歸一化原理如式(9)所示。
(9)
其中,X為數(shù)據(jù)庫原始數(shù)據(jù);Y為歸一化后結(jié)果。
本文提出了PSO-RF混合預(yù)測(cè)模型。首先利用RF算法提出了一種擴(kuò)底灌注樁極限抗拔承載力預(yù)測(cè)模型,在構(gòu)建決策樹時(shí)不進(jìn)行裁剪,避免抑制決策樹生長(zhǎng)。然后采用粒子群優(yōu)化算法對(duì)模型進(jìn)行優(yōu)化,結(jié)合粒子群優(yōu)化算法通用性強(qiáng)且易于實(shí)現(xiàn)的特點(diǎn)快速確定RF模型合適的超參數(shù)取值。
采用PSO算法確定RF模型的最優(yōu)超參數(shù)。通過計(jì)算所得到的最優(yōu)的決策樹個(gè)數(shù)n和決策樹最大深度p分別為196和5,在此基礎(chǔ)上建立的擴(kuò)底灌注樁極限抗拔承載力預(yù)測(cè)模型的結(jié)果及其誤差統(tǒng)計(jì)情況如圖3所示。由圖3(a)可知,PSO-RF模型的R2,COV,MAPE,RMSE和MAE值分別為0.976,0.091,0.072,159.48和125.17。通過對(duì)比訓(xùn)練集與測(cè)試集的統(tǒng)計(jì)指標(biāo),發(fā)現(xiàn)測(cè)試集的各項(xiàng)統(tǒng)計(jì)指標(biāo)與訓(xùn)練集的差異很小,說明模型并未出現(xiàn)欠擬合或者過擬合現(xiàn)象。從圖3(b)中可以看出,70.9%的數(shù)據(jù)點(diǎn)誤差在5%以內(nèi),80%的數(shù)據(jù)點(diǎn)誤差在10%以內(nèi),100%的數(shù)據(jù)點(diǎn)誤差在20%以內(nèi),這表明PSO-RF模型的預(yù)測(cè)性能較好。
為了驗(yàn)證本文所提模型相較于其他預(yù)測(cè)模型的優(yōu)越性,同時(shí)驗(yàn)證PSO算法對(duì)RF算法的優(yōu)化情況。本文將PSO-RF模型與基于RF和GMDH建立的模型進(jìn)行對(duì)比,如圖4,表2所示。從圖4(b)和表2中可以看出,RF模型的預(yù)測(cè)結(jié)果與測(cè)量結(jié)果比較接近,決定系數(shù)為0.955,51%的數(shù)據(jù)點(diǎn)誤差在5%以內(nèi),72%的數(shù)據(jù)點(diǎn)誤差在10%以內(nèi),95%的數(shù)據(jù)點(diǎn)誤差在20%以內(nèi)。而GMDH模型預(yù)測(cè)精度較差,決定系數(shù)僅為0.88,50%的數(shù)據(jù)點(diǎn)誤差在10%以內(nèi),80%的數(shù)據(jù)點(diǎn)誤差在20%以內(nèi)。通過試錯(cuò)法確定超參數(shù)取值的RF和GMDH模型均出現(xiàn)了程度不一的過擬合現(xiàn)象,即模型在訓(xùn)練集上的預(yù)測(cè)精度高于測(cè)試集。過擬合現(xiàn)象導(dǎo)致模型精度與泛用性較差。綜合來看,RF模型優(yōu)于GMDH模型,其R2,COV,MAPE,RMSE和MAE值分別提升了8.3%,40.2%,39.9%,50.5%和45.6%。將PSO-RF模型與RF模型進(jìn)行對(duì)比,發(fā)現(xiàn)PSO-RF模型的R2,COV,MAPE,RMSE和MAE值相較于RF模型分別提升了2.3%,7.1%,13.2%,3.0%和4.5%,且PSO的參數(shù)尋優(yōu)有效解決了RF算法中通過試錯(cuò)法確定最優(yōu)超參數(shù)準(zhǔn)確度較低的問題,有效提高了模型的計(jì)算效率與準(zhǔn)確性。計(jì)算結(jié)果表明PSO-RF混合模型有最優(yōu)的預(yù)測(cè)精度與泛用性,同時(shí)證明了PSO-RF混合算法超參數(shù)迭代尋優(yōu)的可行性。
表2 與其他模型的對(duì)比分析
為驗(yàn)證本文所提方法在實(shí)際工程中的適用性,選取虹橋商務(wù)區(qū)核心區(qū)一期3號(hào)地塊南塊新建項(xiàng)目的擴(kuò)底灌注樁抗拔靜荷載試驗(yàn)進(jìn)行分析比對(duì),PSO-RF模型的預(yù)測(cè)結(jié)果與實(shí)際測(cè)試結(jié)果的誤差在5%以內(nèi),證明了該方法的工程適用性。具體結(jié)果如表3所示。
表3 虹橋商務(wù)區(qū)核心區(qū)一期3號(hào)地塊南塊擴(kuò)底灌注樁抗拔靜荷載試驗(yàn)與模型預(yù)測(cè)值比較
1)本文利用PSO優(yōu)化RF算法,以40組擴(kuò)底灌注樁極限抗拔承載力試驗(yàn)數(shù)據(jù)作為模型訓(xùn)練和測(cè)試的基礎(chǔ),將樁體擴(kuò)大段上部土層的抗拔阻力、樁側(cè)土體摩阻力加權(quán)平均值、抗拔樁直桿段的長(zhǎng)徑比、擴(kuò)底部分直徑與直桿段直徑之比、擴(kuò)底段樁身直徑、擴(kuò)底段樁長(zhǎng)6個(gè)參數(shù)作為輸入變量,擴(kuò)底灌注樁極限抗拔承載能力作為輸出變量,成功建立了擴(kuò)底灌注樁極限抗拔承載力的預(yù)測(cè)模型。PSO-RF模型的R2,COV,MAPE,RMSE和MAE值分別為0.976,0.091,0.072,159.48和125.17。該模型能夠根據(jù)樁體幾何參數(shù)和工程現(xiàn)場(chǎng)土體性質(zhì)準(zhǔn)確預(yù)測(cè)出擴(kuò)底灌注樁極限抗拔承載力,減少工作量的同時(shí)降低成本,為地下建筑工程的抗浮設(shè)計(jì)提供參考。
2)將PSO-RF混合模型與RF模型、GMDH模型進(jìn)行對(duì)比,發(fā)現(xiàn)PSO-RF混合模型略優(yōu)于RF模型且二者遠(yuǎn)優(yōu)于GMDH模型。PSO-RF模型的R2,COV,MAPE,RMSE和MAE值相較于RF模型分別提升了2.3%,7.1%,13.2%,3.0%和4.5%,表明PSO-RF混合算法有效優(yōu)化了傳統(tǒng)RF算法的超參數(shù)選取過程,提高了預(yù)測(cè)模型的計(jì)算效率與精度。