蘇聞浩
(1.蘇州科技大學(xué),江蘇 蘇州 215009;2.江蘇省結(jié)構(gòu)工程重點(diǎn)實驗室,江蘇 蘇州 215009)
地震動引發(fā)的地表峰值加速度(PGA)是建筑結(jié)構(gòu)抗震、結(jié)構(gòu)設(shè)計環(huán)節(jié)中的重要參數(shù)。一般來說,峰值加速度的預(yù)測模型分為參數(shù)模型和非參數(shù)模型兩種,參數(shù)模型一般有固定的函數(shù)表達(dá)式,其主要局限性在于需要預(yù)先定義一個表達(dá)式,并且隨著研究的不斷深入,表達(dá)式往往會引入更多的變量和系數(shù),進(jìn)而導(dǎo)致該函數(shù)表達(dá)式越發(fā)復(fù)雜。而非參數(shù)模型則是由大量數(shù)據(jù)驅(qū)動的沒有固定函數(shù)表達(dá)式的模型,這種類型的模型主要缺點(diǎn)在于其沒有固定的函數(shù)表達(dá)式形式,較難對其進(jìn)行物理上的理解和分析。
現(xiàn)階段,人工神經(jīng)網(wǎng)絡(luò)作為機(jī)器學(xué)習(xí)的一個重要分支,其在預(yù)測和分類問題上都取得了較大的應(yīng)用進(jìn)展和研究成果。在工程領(lǐng)域有結(jié)構(gòu)位移響應(yīng)、建筑模式分類等各式各樣的應(yīng)用場景[1],在地震動峰值預(yù)測領(lǐng)域,已有不少研究人員使用人工神經(jīng)網(wǎng)絡(luò)技術(shù)創(chuàng)建預(yù)測模型。Kerh 等[2]使用震級、震源深度和震中距的人工神經(jīng)網(wǎng)絡(luò)來對臺灣的高雄捷運(yùn)系統(tǒng)中兩個主干線上的PGA 進(jìn)行估算,將預(yù)測結(jié)果與回歸分析結(jié)果作比較,結(jié)果表明,神經(jīng)網(wǎng)絡(luò)的預(yù)測值更加接近實際地震記錄。Thomas 等[3]提出了自適應(yīng)神經(jīng)網(wǎng)絡(luò)預(yù)測系統(tǒng),利用NGAwest 數(shù)據(jù)庫中的2815 條數(shù)據(jù)記錄對PGA 進(jìn)行預(yù)測。在之后的研究中,Dhanay等[4]在之前的神經(jīng)網(wǎng)絡(luò)上又綜合考慮了場地因素以及破裂機(jī)制,使用震級、震中距、破裂機(jī)制和場地Vs30預(yù)測PGA并同時驗證了模型性能。
在前期的研究中,研究人員主要考慮了地震的震級、震源深度等參數(shù),隨后部分研究人員添加了場地地表下30m內(nèi)的等效剪切波速(Vs30)來表征場地信息以增加模型精度。本文在這些研究的基礎(chǔ)上,添加了發(fā)生地震時地底的峰值加速參數(shù),對地表峰值加速度進(jìn)行更加精確的預(yù)測。同時還探究了不同軟硬場地情況下該模型的預(yù)測性能差異,為人工神經(jīng)網(wǎng)絡(luò)技術(shù)在抗震設(shè)計等工程應(yīng)用領(lǐng)域提供了一些參考。
人工神經(jīng)網(wǎng)絡(luò)是對人腦的抽象、簡化和模擬,其中神經(jīng)元又稱感知機(jī),是神經(jīng)網(wǎng)絡(luò)的最基本組成單位(如圖1 所示),每一個神經(jīng)元都由一個線性層和一個激活函數(shù)組成。神經(jīng)元輸出公式為:
圖1 單個神經(jīng)元結(jié)構(gòu)示意圖(圖片來源:作者自繪)
式中,wij指神經(jīng)網(wǎng)絡(luò)中第i 層與i-1層神經(jīng)元之間的權(quán)重;bj指神經(jīng)網(wǎng)絡(luò)中第i 層第j 個神經(jīng)元線性層的偏置;φ指激活函數(shù)。
神經(jīng)網(wǎng)絡(luò)內(nèi)部按照不同結(jié)構(gòu)位置的劃分,包括輸入層、隱藏層、輸出層三個部分。其中,輸入層每個神經(jīng)元對應(yīng)一個變量特征,隱藏層為使用多個神經(jīng)元進(jìn)行的多層組合,針對回歸問題的輸出層有一個神經(jīng)元。每一層的神經(jīng)元通過前一層的加權(quán)運(yùn)算和激活運(yùn)算傳遞數(shù)值,并通過反向傳播算法實現(xiàn)各個權(quán)值參數(shù)的更新。若該網(wǎng)絡(luò)的第i 層與i-1層的所有神經(jīng)元全連接,則該神經(jīng)網(wǎng)絡(luò)被稱為全連接人工神經(jīng)網(wǎng)絡(luò)(DNN)。
日本KiK-net(Kiban Kyoshin network)是全世界范圍內(nèi)應(yīng)用范圍最廣的豎向臺網(wǎng),其每個臺站都有地表、井下三分量高靈敏度加速度傳感器,同時公開了各個臺站場地的精確土層信息,是研究場地效應(yīng)的優(yōu)質(zhì)數(shù)據(jù)來源[5]。參照董凱月[6]的數(shù)據(jù)處理與研究方法,筆者基于日本KiK-net 臺網(wǎng)提供的共計39200條地震數(shù)據(jù)記錄,通過基線校正和0.1~35Hz 濾波頻段處理,對數(shù)據(jù)進(jìn)行整理,最終得到了本文的數(shù)據(jù)庫。數(shù)據(jù)庫中PGA 分布在1~2430cm/s2之間,PGA 分布最多的區(qū)間為30~80cm/s2,占據(jù)了數(shù)據(jù)庫總量的29.7%,10~30cm/s2之間的數(shù)據(jù)占據(jù)了29%,大于80cm/s2的數(shù)據(jù)占據(jù)了整體數(shù)據(jù)集的13%。
這些數(shù)據(jù)分布在497 個不同的地區(qū),根據(jù)美國地震減災(zāi)計劃中的分類標(biāo)準(zhǔn)(如表1 所示),通過Vs30進(jìn)行場地類別劃分。最終統(tǒng)計得出本數(shù)據(jù)庫B 類場地共占比9%,C 類場地最多,達(dá)到了數(shù)據(jù)集的51.9%,D 類場地數(shù)據(jù)為37%,剩余數(shù)據(jù)為E 類場地數(shù)據(jù),無A 類場地數(shù)據(jù)。
表1 地震減災(zāi)計劃規(guī)范分類
筆者選用人工神經(jīng)網(wǎng)絡(luò)作為基本框架,選用震級、震中距、震源深度、地底峰值加速度和場地Vs30作為基本輸入變量,輸出變量為地震動引發(fā)的PGA。最終構(gòu)建了一個5輸入、20個隱藏神經(jīng)元、1 個輸出的全連接人工神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)模型如圖2所示。
圖2 神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)(圖片來源:作者自繪)
在進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練時,將輸出PGA 取自然對數(shù)處理,這樣可以將目標(biāo)值的分布范圍減小,加速神經(jīng)網(wǎng)絡(luò)梯度的更新,有效提高神經(jīng)網(wǎng)絡(luò)的收斂速度。同時筆者采用Adam(Adaptive Moment Estimation)優(yōu)化器[7],該優(yōu)化器使得超參數(shù)具有很好的解釋性,僅需微調(diào),通過其可以自動調(diào)整學(xué)習(xí)率的特性達(dá)到快速收斂的目的。
在網(wǎng)絡(luò)優(yōu)化過程中,通過分批次進(jìn)行數(shù)據(jù)的輸入和訓(xùn)練,可以有效加快學(xué)習(xí)效率。batch-size 為每個批次送入網(wǎng)絡(luò)模型的樣本量,輸入過小的batchsize 會導(dǎo)致每次網(wǎng)絡(luò)的訓(xùn)練樣本數(shù)據(jù)過少,樣本不具有代表性,容易出現(xiàn)過擬合;過大的batch-size 則會使得神經(jīng)網(wǎng)絡(luò)對樣本數(shù)據(jù)的改變不敏感,很有可能陷入局部最優(yōu)解,使訓(xùn)練效果變差。經(jīng)過多次嘗試,本文最終確定的batchsize 大小為256。本文同時將數(shù)據(jù)集的80%作為訓(xùn)練集,剩余的20%作為測試集,測試集的數(shù)據(jù)不參與訓(xùn)練,僅在訓(xùn)練完成后計算其各項評價指標(biāo)以驗證模型的可靠性。
本文神經(jīng)網(wǎng)絡(luò)模型代碼的實現(xiàn)基于Python3.9 環(huán)境和Pytorch 深度學(xué)習(xí)框架。
在經(jīng)歷了1500 次訓(xùn)練迭代后,模型各方面性能趨于穩(wěn)定,最終得到了訓(xùn)練完成后的神經(jīng)網(wǎng)絡(luò)模型。圖3 為該訓(xùn)練完成的神經(jīng)網(wǎng)絡(luò)模型測試集上目標(biāo)值與預(yù)測值散點(diǎn)分布圖,圖中橫坐標(biāo)表示PGA 取自然對數(shù)后的實測目標(biāo)值,縱坐標(biāo)表示網(wǎng)絡(luò)模型預(yù)測值,圖中實線表示預(yù)測值與實測值相等,為最佳訓(xùn)練效果。對測試集數(shù)據(jù)進(jìn)行線性回歸,回歸直線圖中以虛線表示。
圖3 神經(jīng)網(wǎng)絡(luò)目標(biāo)值與預(yù)測值關(guān)系圖(圖片來源:作者自繪)
圖3 中可見,該網(wǎng)絡(luò)模型預(yù)測值與目標(biāo)值整體分布在最佳擬合曲線周圍,有較好的預(yù)測性能,在測試集上線性回歸得到的斜率為0.82,相較于最佳訓(xùn)練效果,本模型在PGA 目標(biāo)值較大時會產(chǎn)生相對低估的趨勢??赡苁怯捎跀?shù)據(jù)庫中PGA 在較高部分?jǐn)?shù)據(jù)相對較少,模型的學(xué)習(xí)效果相對不充分。
為了定量地分析該模型的預(yù)測性能,將該神經(jīng)網(wǎng)絡(luò)模型的目標(biāo)值與預(yù)測值之差定義為該模型的誤差。在全數(shù)據(jù)集上計算其誤差,得到的誤差分布如圖4所示。
圖4 神經(jīng)網(wǎng)絡(luò)模型誤差分布(圖片來源:作者自繪)
通過計算得出,該模型誤差的均值、方差和標(biāo)準(zhǔn)差為-0.022、0.237 和0.486。圖4 中可見,該神經(jīng)網(wǎng)絡(luò)模型誤差呈正態(tài)分布,均值誤差接近于0,標(biāo)準(zhǔn)差較小,網(wǎng)絡(luò)模型的誤差整體呈現(xiàn)出無偏的特性,統(tǒng)計得到誤差分布在-0.5~0.5之間的比例占總數(shù)目的72%,展現(xiàn)出了良好的預(yù)測性能。
為了分析各個場地在該網(wǎng)絡(luò)模型中的性能表現(xiàn),圖5 繪制了B、C、D、E 這四類場地上各自的誤差分布。由于場地類型較多,因此圖中僅給出了各誤差分布的包絡(luò)曲線。其中B 類場地為堅硬場地,E類場地為松軟場地。
圖5 神經(jīng)網(wǎng)絡(luò)模型各場地預(yù)測誤差分布(圖片來源:作者自繪)
如圖5所示,各個場地的誤差均在0附近呈現(xiàn)出正態(tài)分布。通過統(tǒng)計可得,B、C、D、E 這四類場地誤差分布在-0.5~0.5 之間的比例分別為73.8%、67.7%、74.6%和83.0%。各場地的預(yù)測性能相對一致,其中E 類場地的預(yù)測性能相較于其余場地整體更好。
本文使用機(jī)器學(xué)習(xí)任務(wù)中常用的均方誤差函數(shù)(MSE)(式2)和平均絕對誤差(MAE)(式3)作為損失函數(shù)及評價指標(biāo)[8],同時計算了機(jī)器學(xué)習(xí)任務(wù)中最多使用的決定系數(shù)(R2)(式4)作為評價模型整體性能好壞的指標(biāo)。通常,若R2的值越接近1,則說明預(yù)測模型對實測值的擬合程度越好,當(dāng)R2>0.8 時,預(yù)估值和實測目標(biāo)值之間就有很強(qiáng)的相關(guān)性。測試集的R2同時也可以表明模型在預(yù)測時的泛化性能是否優(yōu)秀,一般認(rèn)為當(dāng)測試集的R2達(dá)到0.8 時,該網(wǎng)絡(luò)模型具有比較不錯的模型性能。
筆者在上述神經(jīng)網(wǎng)絡(luò)模型的基礎(chǔ)上,將輸入變量調(diào)整為以往研究人員經(jīng)常使用的震級、震中距、震源深度和場地Vs30這四個輸入?yún)?shù),額外構(gòu)建了一個用于對比網(wǎng)絡(luò)性能的神經(jīng)網(wǎng)絡(luò)模型,將該模型作為對比模型。使用相同的數(shù)據(jù)和訓(xùn)練方法對該模型進(jìn)行訓(xùn)練,并通過上文中的式(2)、式(3)和式(4)計算本文人工神經(jīng)網(wǎng)絡(luò)和該對比模型在測試集上的各項評價參數(shù),如表2所示。
表2 網(wǎng)絡(luò)模型各評價參數(shù)及決定系數(shù)
通過表2 可見,本文的人工神經(jīng)網(wǎng)絡(luò)模型相較于對比模型,各項評價指標(biāo)均有明顯提升,均方誤差和平均絕對誤差有一定的下降,決定系數(shù)R2由0.782提升到了0.812,提升幅度約為4%。同時,該人工神經(jīng)網(wǎng)絡(luò)模型在測試集上的決定系數(shù)高于0.8,展現(xiàn)出優(yōu)秀的模型性能。
當(dāng)前對于地表峰值加速度的各類預(yù)測模型均有一定的缺陷,由于引起地表峰值加速度變化的原因較多,傳統(tǒng)模型需要在考慮輸入?yún)?shù)的前提下加上衰減、阻尼和不確定性等各種影響系數(shù),模型較為復(fù)雜且很難較為完整地考慮各個因素對其產(chǎn)生的影響程度,僅能給出諸如震級等參數(shù)與PGA 的正反比關(guān)系和一個相對籠統(tǒng)的范圍預(yù)測。
使用人工神經(jīng)網(wǎng)絡(luò),可以在不確定具體函數(shù)式關(guān)系的情況下,直接建立一個端到端的預(yù)測模型,該模型僅需考慮影響PGA 的關(guān)鍵因素,如地震信息和場地信息。網(wǎng)絡(luò)模型可以自動訓(xùn)練并且收斂,無需人為地去確定各項系數(shù)。本文的神經(jīng)網(wǎng)絡(luò)模型預(yù)測值與實測值整體較為接近,在神經(jīng)網(wǎng)絡(luò)模型的誤差表現(xiàn)上,該神經(jīng)網(wǎng)絡(luò)模型的誤差整體呈現(xiàn)出正態(tài)分布的特性,同時其均值誤差接近于0,在不同軟硬類場地上,該神經(jīng)網(wǎng)絡(luò)模型也展現(xiàn)出了大致相同的預(yù)測性能,在各類場地中均可以較好地進(jìn)行PGA 的預(yù)測。同時,還與以往研究中的網(wǎng)絡(luò)模型進(jìn)行了對比,發(fā)現(xiàn)本文改進(jìn)的模型在預(yù)測性能上具有一定程度的提升,為后續(xù)的神經(jīng)網(wǎng)絡(luò)模型研究提供一定的參考。
本文同樣存在一定的不足和有待改進(jìn)的地方。首先,基于數(shù)據(jù)來進(jìn)行訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型其可靠程度主要取決于數(shù)據(jù)量的大小,本文中各類場地數(shù)據(jù)分布相對不夠均勻,較為松軟的E 類場地數(shù)據(jù)偏少,存在一定的訓(xùn)練風(fēng)險。其次,對于輸入?yún)?shù)的選取,本文借鑒了以往研究中普遍使用的參數(shù),對于是否仍有其它重要參數(shù)會對PGA 產(chǎn)生明顯的影響,仍然是后續(xù)研究中需要討論的一個關(guān)鍵問題。