王大任,任葉飛,張雨婷,冀 昆,王宏偉,溫瑞智
(1.中國地震局工程力學(xué)研究所, 哈爾濱 150080;2.中國地震局地震工程與工程振動重點(diǎn)實驗室(中國地震局工程力學(xué)研究所),哈爾濱 150080)
基巖上覆土層對地震動的放大已被廣泛認(rèn)知,一些場地指標(biāo)(例如,場地類別、一定深度內(nèi)的平均剪切波速、卓越周期等)被用于量化、表征場地放大程度。其中,地表以下介質(zhì)30 m內(nèi)的平均剪切波速(VS30)因其概念清晰、計算簡便并且與周期依賴的場地放大幅值相關(guān)性較強(qiáng),是應(yīng)用較多的一個指標(biāo)參數(shù)。各國規(guī)范,例如美國的IBC和NEHRP、歐洲的Eurocode、智利的DS61等,都將其作為定義場地類別的核心參數(shù)之一。目前常用的地震動預(yù)測模型(例如,NGA項目開發(fā)的多個模型[1-3],國內(nèi)地震動衰減關(guān)系[4])大都采用VS30作為場地項的參數(shù)之一,用以反映場地的線性和非線性效應(yīng)。通常情況下,VS30最為合理的獲取方式是通過真實的鉆孔剖面數(shù)據(jù)計算獲得。然而,由于受經(jīng)濟(jì)性、勘測環(huán)境、規(guī)范要求等因素影響,鉆孔深度往往達(dá)不到30 m。例如,日本K-NET的強(qiáng)震動臺站僅對鉆孔20 m深度以內(nèi)的場地條件進(jìn)行了波速測試。
中國的抗震設(shè)計規(guī)范采用覆蓋層厚度和等效剪切波速(計算深度取覆蓋層厚度與20 m兩者較小值)“雙指標(biāo)”進(jìn)行場地分類。依據(jù)規(guī)范要求,實際操作中許多工程場地的鉆探深度不到30 m就已達(dá)基巖層(規(guī)范定義剪切波速達(dá)到500 m/s),無需再往下鉆進(jìn)。這種情況下,無法通過實際鉆孔剖面資料直接計算出真實VS30值,通??衫媒?jīng)驗外推模型對VS30值進(jìn)行估算。常速度外推模型(BCV,也稱作“底部常速度模型”)將鉆孔最底層的波速直接按常數(shù)外推至30 m處,因其操作方便而應(yīng)用廣泛[5-7]。已有研究表明,土層剪切波速與埋深大致總體上呈正相關(guān)的趨勢[8],這也符合淺層土層沉積年代較近,剪切波速較小,深層土層或基巖沉積年代久遠(yuǎn),剪切波速較大的規(guī)律。因此,BCV模型理論上會低估VS30值。另一種經(jīng)驗外推模型是速度梯度外推模型,認(rèn)為VSz(Zm以內(nèi)的平均剪切波速,Z<30 m)和VS30之間存在一定的對數(shù)線性關(guān)系[9]或者二次多項式關(guān)系[10]。隨著距地表深度的不斷增大,地下介質(zhì)通常由剪切波速較小的土壤層和剪切波速較大的基巖層組成,對數(shù)線性和二次多項式模型都要求場地的波速梯度變化不大,若30 m深度內(nèi)存在堅硬的巖石層則會引起較大的估計誤差。文獻(xiàn)[11-12]提出了依據(jù)兩個不同深度的平均剪切波速(VSz1和VSz2)估算VS30的方法,稱為雙深度外推法,其優(yōu)點(diǎn)是不需要事先針對大量鉆孔數(shù)據(jù)建立回歸模型,并且不存在區(qū)域依賴性。但缺點(diǎn)是結(jié)果受選取的雙深度z1和z2影響較大,同一場地可產(chǎn)生多個外推值,偶然誤差較大。
因此,針對中國廣泛存在的鉆孔深度低于30 m且存在基巖層的工程場地,目前并不存在適合的VS30經(jīng)驗估計模型,利用日本KiK-net臺站鉆孔數(shù)據(jù),在BCV模型基礎(chǔ)上,試圖基于最優(yōu)子集方法提出一種修正方法,建立修正函數(shù),并通過預(yù)測VS30值與實測值的殘差分布驗證函數(shù)的修正效果。最終利用新疆地區(qū)的鉆孔數(shù)據(jù),驗證修正函數(shù)在該地區(qū)的適用性,以期望得到該地區(qū)合理的VS30值估計。
鑒于鉆孔深度低于30 m且已至基巖層的工程場地,速度梯度外推模型并不適用。盡管BCV模型會低估預(yù)測結(jié)果,但BCV模型較為實用,無需事先對模型參數(shù)進(jìn)行回歸。因此,設(shè)想針對BCV模型的預(yù)測結(jié)果進(jìn)行修正,使其盡可能的接近真實的VS30值。方法基本思路:
1)采用BCV模型對鉆孔VS30進(jìn)行估計
(1)
式中:VS30-BCV表示估計值;df表示需要外推鉆孔的終孔深度;hi和VSi分別為第i層的厚度和剪切波速;n為土層層數(shù);VS(Z=dS)為覆蓋土層下臥基巖面的剪切波速,也就是基巖層的剪切波速,Z表示深度,假設(shè)dS至30 m內(nèi)的剪切波速值都等于此。
2)國內(nèi)建筑工程場地上的工程鉆孔的普遍如下特點(diǎn):勘測工程鉆孔的主要目的是判斷所在場地條件的場地類別,從而確定地震動參數(shù)。依據(jù)中國抗震設(shè)計規(guī)范的場地類別判定條件,結(jié)合作者收集到的國內(nèi)鉆孔數(shù)據(jù)發(fā)現(xiàn),國內(nèi)大多數(shù)鉆孔只打到20 m或到剪切波速超過500 m/s的層就停止,即達(dá)成判定場地類別的基本條件就停止向下鉆探。故選取一批鉆孔深度大于30 m(便于得到真實VS30值),并具有上述特點(diǎn)的鉆孔進(jìn)行回歸分析,探究相關(guān)規(guī)律。
3)計算VS30真實值與估計值之間的殘差
σBCV=VS30-REL-VS30-BCV
(2)
式中σBCV為真實VS30與估計VS30之間的殘差,VS30-REL表示真實值。其中計算常數(shù)外推VS30值時,將鉆孔基巖層首層(剪切波速首次超過500 m/s的巖層)的底部深度假定為式(1)中的df。
4)建立σBCV與體現(xiàn)場地特征的典型參數(shù)之間的經(jīng)驗關(guān)系,給出修正模型。
為了建立修正模型,從日本KiK-net臺站數(shù)據(jù)庫中選擇合適的鉆孔數(shù)據(jù)。為了計算真實VS30值,鉆孔終孔深度(db)必須大于30 m。為了能夠還原中國常見的鉆孔深度低于30 m且已至基巖層的相似情況,要求鉆孔基巖層首層(剪切波速首次超過500 m/s的巖層)的底部深度Zrock1須小于30 m。鉆孔數(shù)據(jù)選取條件:1)db≥30 m;2)Zrock1<30 m;3)鉆孔剖面不存在明顯的軟弱夾層。
其中條件3)所述的軟弱夾層可能出現(xiàn)在具有多項沉積的場地條件下,該類場地下鉆孔剖面的各層剪切波速并非嚴(yán)格與鉆孔深度呈正相關(guān)趨勢。若軟弱夾層存在于外推深度范圍內(nèi),常數(shù)外推VS30值與真實值的偏差會變大,為排除此類少數(shù)特殊場地條件下鉆孔對修正效果的影響,規(guī)定此類鉆孔暫不適用于該方法。
最終收集到滿足上述條件的鉆孔共計109個,其地理空間分布見圖1(a),所有鉆孔的波速剖面見圖1(b)。圖1(b)中陰影部分區(qū)域為滿足上述篩選條件的鉆孔的剪切波速剖面線不與陰影區(qū)域相交的判定區(qū)域。圖1可見,選取的109個臺站鉆孔較均勻地分布在日本境內(nèi),所有鉆孔30 m以下無剪切波速小于500 m/s的土層或基巖層,即各鉆孔剪切波速隨深度分布曲線均沒有穿過圖中陰影部分,確保了與上文的鉆孔數(shù)據(jù)選取條件一致。
圖2繪制了所選取109個鉆孔的終孔深度db和Zrock1的分布,大多數(shù)鉆孔的db都在40 m以上,主要集中在50~90 m,保證了每個用于研究的鉆孔都能得到真實的VS30值,Zrock1較為均勻分布在10~30 m范圍內(nèi)。
圖1 本研究所選的日本KiK-net臺站的地理分布及鉆孔場地的剪切波速剖面
圖2 本研究所選的日本KiK-net臺站場地鉆孔深度統(tǒng)計分布
在建立模型之前,須確定與σBCV相關(guān)的可反映場地特征的參數(shù)。針對中國常見的鉆孔深度低于30 m且已下探至基巖層的情況,確定了5個可計算的備選參數(shù),見表1。
(3)
(4)
(5)
表1 反映場地特征的備選參數(shù)
多個自變量中存在兩個或多個變量線性相關(guān)的現(xiàn)象稱為自變量的共線性。在多元回歸分析中,存在一條基本假設(shè)是各自變量間不存在明顯的線性相關(guān)關(guān)系。其中3個或者更多變量之間相互線性相關(guān)的情況又稱為變量的多重共線性。變量的共線性會造成回歸方程中變量的冗余,增加了回歸模型的不穩(wěn)定性,樣本的微小擾動都可能帶來回歸模型參數(shù)很大的變化。因此在回歸前需要剔除相應(yīng)的共線性變量。
圖3 所選5個場地特征參數(shù)的相關(guān)系數(shù)矩陣
最優(yōu)子集法(又稱作最優(yōu)子集回歸)是一種篩選多個線性回歸模型中最優(yōu)模型的特征篩選方法,目的是從所有解釋變量中依據(jù)殘差平方和最小的原則選擇出不同變量個數(shù)的變量組合,最終從包含不同變量個數(shù)的方程集合中選擇出最優(yōu)模型。最優(yōu)子集法中選擇最優(yōu)參數(shù)子集的具體步驟:
1)建立全體回歸變量X1,X2,…,Xm對因變量Y的回歸方程Em;
2)分別剔除X1,X2,…,Xm,對余下參數(shù)建立回歸方程,得到m個回歸方程Em1、Em2、…、Emm,分別求出每一個回歸方程所對應(yīng)的殘差平方和,其中殘差平方和最小值所對應(yīng)的方程定義為Em-1;
3)Em、Em-1、Em-2、…、E1即為不同參數(shù)個數(shù)下的最優(yōu)參數(shù)子集,由上文可知,通過對變量去除多重共線性后,有效變量個數(shù)為3,因此m=3。
為了從中選擇最優(yōu)的回歸模型,采用調(diào)整后R2(R2為回歸模型的擬合優(yōu)度)、貝葉斯信息準(zhǔn)則(BIC準(zhǔn)則)和k倍交叉驗證3種方法對最優(yōu)參數(shù)子集對應(yīng)的回歸方程進(jìn)行特征選擇。
調(diào)整后R2按下式計算:
(6)
式中p為預(yù)測變量的個數(shù),N為總樣本容量。
貝葉斯信息準(zhǔn)則(BIC)是衡量統(tǒng)計模型擬合程度的一種標(biāo)準(zhǔn),當(dāng)回歸方程時,隨著預(yù)測變量的不斷增加,模型的復(fù)雜程度不斷增加,似然函數(shù)也隨之增大。ξBIC按下式計算:
ξBIC=pln(N)-2ln(L)
(7)
式中p、N含義同上,L為極大似然函數(shù)值。
針對回歸得到的多個較為合理的模型,通??紤]模型對數(shù)據(jù)集的描述能力(極大似然函數(shù)值)與模型的復(fù)雜程度(模型中變量個數(shù))來判斷各方程是否為最優(yōu)方程。一般來說,當(dāng)用于回歸模型的數(shù)據(jù)集越大,模型的擬合優(yōu)度越大,似然函數(shù)也越大;當(dāng)預(yù)測變量個數(shù)p過大時,似然函數(shù)增速減緩,使得BIC公式中第一項的值變小。因此BIC最小的模型是平衡了模型復(fù)雜度和對數(shù)據(jù)集的描述能力的最優(yōu)模型。即ξBIC值最小的方程是在模型擬合度(極大似然函數(shù)值)盡可能大的前提下,選擇模型的參數(shù)盡可能的少的擬合方程。因此,BIC準(zhǔn)則就是篩選ξBIC值最小的回歸模型作為最優(yōu)方程。
交叉驗證是測試通過訓(xùn)練集確定的預(yù)測方程在新測試集中使用效果的方法。由于模型在回歸過程中整個數(shù)據(jù)集是確定的,因此使用一種運(yùn)用數(shù)據(jù)集的子集作為測試集來驗證模型準(zhǔn)確性的方法——k倍交叉驗證。該方法將整個數(shù)據(jù)集隨機(jī)拆分成k個子集,分別選取k個子集作為測試集,并每次使用其余未被選擇的子集作為訓(xùn)練集進(jìn)行回歸方程,通過計算k組數(shù)據(jù)的均方根誤差(ERMS)和平均絕對誤差(EMA)來評價模型的好壞,ERMS和EMA值越小表明模型越優(yōu)。統(tǒng)計學(xué)上一般將測試集的容量占比定為20%左右,因此根據(jù)日本KiK-net鉆孔數(shù)據(jù)集容量,同時為保證每一個子集盡可能有足夠的鉆孔個數(shù),k值取為5。
通過最優(yōu)子集法對日本109個臺站鉆孔的3個參數(shù)的對數(shù)進(jìn)行最優(yōu)參數(shù)子集的計算,最終得到分別具有1個、2個、3個參數(shù)的方程1、方程2、方程3,各方程的參數(shù)選擇結(jié)果及對應(yīng)回歸方程的回歸系數(shù)見表2,其中“—”表示該變量不是該最優(yōu)參數(shù)子集中的元素。接下來將通過3種特征選擇方法選擇整體最優(yōu)的回歸方程。
表2 由最優(yōu)子集法確定的各方程參數(shù)及線性方程回歸系數(shù)
依據(jù)上述公式及原理,各參數(shù)子集的特征值計算結(jié)果見表3。
表3 各方程的特征選擇參數(shù)值
log(σBCV)=2.006-1.782×log(dS)+0.983×
(8)
采用BIC準(zhǔn)則,最優(yōu)回歸方程為方程2:
log(σBCV)=0.859-1.758×log(dS)+0.948×
(9)
上節(jié)通過最優(yōu)子集法與不同的擬合優(yōu)度評價方法得到了兩個不同的最優(yōu)回歸方程,本節(jié)將通過KiK-net鉆孔數(shù)據(jù)驗證這兩個方程的修正效果來分析其孰優(yōu)孰劣。
圖4繪制了前文KiK-net鉆孔的σBCV和通過3個修正方程計算得到的VS30殘差分布散點(diǎn)箱型圖,圖4虛線表示VS30殘差散點(diǎn)的正態(tài)分布曲線,箱體表示散點(diǎn)20%~80%的分布范圍,觸須線的上下限分別表示各組數(shù)據(jù)的正負(fù)一倍標(biāo)準(zhǔn)差。圖4可見,σBCV分布集中在0 m/s以上,具有明顯偏分布特點(diǎn),說明常數(shù)外推法對VS30的估計有系統(tǒng)性偏差,這符合常數(shù)外推法系統(tǒng)性低估的原理。通過各修正方程對VS30外推值的修正后,可以發(fā)現(xiàn)修正后的VS30殘差基本呈現(xiàn)正態(tài)分布,均值接近0 m/s,相較于σBCV,3個方程的整體殘差平均值更趨于穩(wěn)定。因此,可以認(rèn)為這3個方程均能有效地修正常數(shù)外推模型的系統(tǒng)偏差。
圖4 常數(shù)外推VS30預(yù)測值和3個方程修正后的VS30預(yù)測值的殘差分布
VS30-COR=VS30-BCV+σBCV
(10)
式中VS30-BCV和σBCV分別通過式(1)和式(9)計算。
式(10)適用的鉆孔須符合以下條件:1)鉆孔終孔深度db≤30 m,并存在基巖層(剪切波速VS>500 m/s)的鉆孔;2)鉆孔所在場地為非多相沉積場地條件。
鑒于上述修正函數(shù)是利用日本KiK-net鉆孔數(shù)據(jù)建立的,是否適用于中國,需要檢驗。下面以中國新疆地區(qū)為例,進(jìn)行適用性檢驗,具體步驟:
1)篩選出新疆地區(qū)符合第2節(jié)所述數(shù)據(jù)篩選要求的鉆孔共計821個;
2)將步驟1中篩選得到的鉆孔數(shù)據(jù)使用式(9)計算BCV模型的修正值σBCV;
3)利用式(1)和式(10)分別計算每一個鉆孔的VS30-BCV和VS30-COR,與KiK-net臺站的相應(yīng)計算結(jié)果一并繪制散點(diǎn)圖,見圖5。
圖5 KiK-net臺站鉆孔與新疆地區(qū)鉆孔VS30常數(shù)外推值以及修正值的散點(diǎn)分布
由圖5可知,對于KiK-net鉆孔,隨著VS30-BCV的增大,VS30-COR偏離VS30-BCV也越大,新疆地區(qū)鉆孔也呈現(xiàn)出這種趨勢。這是由于VS30較大的鉆孔往往具有較小的覆蓋層厚度,大部分情況是較淺的表層覆蓋土下臥硬度較大的基巖層,由式(9)可知,隨著dS的減小,回歸得到的σBCV也逐漸增大。圖5新疆地區(qū)的散點(diǎn)分布與KiK-net散點(diǎn)的分布整體上基本重疊,兩者并未出現(xiàn)系統(tǒng)性偏差,為進(jìn)一步說明這種現(xiàn)象,圖6繪制了這兩個地區(qū)VS30-BCV與VS30-COR的直方分布圖。圖6可見,兩個地區(qū)的VS30-BCV值主要分布于300~600 m/s范圍內(nèi),KiK-net的VS30-BCV在700~1 200 m/s范圍內(nèi)均有分布,而新疆地區(qū)在這一范圍內(nèi)幾乎無數(shù)據(jù);相比較VS30-BCV,VS30-COR在兩個地區(qū)的分布規(guī)律差別與VS30-BCV基本一致。因此,一定程度上說明大多數(shù)情況下采用日本鉆孔數(shù)據(jù)建立的修正函數(shù)在新疆地區(qū)是可以適用的。針對圖5中在較大的剪切波速段(VS30-BCV>600 m/s)的異常點(diǎn)進(jìn)行追溯原始鉆孔數(shù)據(jù)文件分析可知,該類鉆孔覆蓋層厚度很小(篩選出5個異常點(diǎn),dS分別為1.7、2、2、2、2.5 m),通過提出的修正方程修正,由式(9)可知,較小的dS值提供了較大的σBCV,造成圖中該類點(diǎn)離散到正常范圍外,從而導(dǎo)致最終修正后的VS30-COR誤差較大。為提高該模型在新疆地區(qū)使用的合理性及準(zhǔn)確性,對該修正函數(shù)在新疆地區(qū)的使用增加一個使用條件:當(dāng)鉆孔的覆蓋層厚度dS≥3 m時, 該模型可以用于新疆地區(qū)鉆孔的外推修正。
圖6 KiK-net臺站鉆孔與新疆地區(qū)鉆孔VS30常數(shù)外推值以及修正值的直方分布
不同地區(qū)的土層結(jié)構(gòu)分布是存在區(qū)域性差異的,經(jīng)驗?zāi)P屯ǔ4嬖趨^(qū)域適用性,圖5、6只能粗略地說明模型區(qū)域依賴性影響較小,未來還需要在新疆地區(qū)或國內(nèi)其他地區(qū)收集更多滿足條件的鉆孔數(shù)據(jù),以驗證上述修正函數(shù)的適用性,或者構(gòu)建本地區(qū)的經(jīng)驗修正函數(shù)。
1)選取5個可反映鉆孔剖面特征的參數(shù),通過相關(guān)系數(shù)矩陣排除共線性問題,確定其中3個參數(shù),包括覆蓋土層厚度、覆蓋土層下臥基巖面的剪切波速和覆蓋土層的平均剪切波速作為修正函數(shù)的回歸參數(shù)。
2)挑選適用的日本KiK-net臺站鉆孔數(shù)據(jù),利用最優(yōu)子集法建立了常數(shù)外推模型的VS30殘差σBCV與上述3個參數(shù)的優(yōu)選函數(shù)關(guān)系,通過調(diào)整后R2、貝葉斯信息準(zhǔn)則和k倍交叉驗證3種特征選擇方法確定其中的最優(yōu)關(guān)系。
3)根據(jù)修正后預(yù)測VS30與實際觀測VS30間殘差均值和標(biāo)準(zhǔn)差的分布,同時考慮模型的易操作性,給出了推薦的常數(shù)外推模型修正函數(shù)。最后,利用收集的鉆孔數(shù)據(jù),驗證了修正函數(shù)在中國新疆地區(qū)具有一定適用性。