劉大偉, 黃文鋒
(合肥工業(yè)大學 土木與水利工程學院,安徽 合肥 230009)
近年來,我國高層及大跨建筑物與構筑物層出不窮,這些高層和大跨結構對風的敏感性很強,風荷載也成為這些結構在設計時的主控因素之一。我國地處臺風頻發(fā)的西北太平洋西岸,海岸線較長,在相對發(fā)達的沿海地區(qū),建筑結構的設計風速是極為重要的安全因素。為了得到足夠多的臺風數據,只能借助數值模擬的方法。一次完整的臺風路徑模擬過程包括起點模擬、路徑模擬及終點模擬,起點模型的合理性直接決定了整個臺風模擬的準確性,這就要求在模擬臺風起點時建立合理的起點模型。
目前已有多種模擬臺風起點的方法。文獻[1-4]采用負二項分布對歷史年發(fā)生量進行擬合,并抽樣得到模擬臺風的年發(fā)生數量和發(fā)生位置;文獻[4-5]用泊松分布計算年發(fā)生率并采用Monte Carlo方法得到臺風的起點位置。上述方法都是基于參數化的統(tǒng)計方法,精度相對較低。在統(tǒng)計學中,密度函數通常用來描述數據的隨機性,核密度方法作為一種非參數化的統(tǒng)計方法,目前已經得到了很好的發(fā)展。文獻[6-7]采用一維高斯核函數模擬臺風起點;文獻[8]采用二維高斯核函數模擬臺風起點。一維和二維核函數都能較好地模擬臺風起點的空間位置分布,但沒有考慮時間因素的影響。臺風的發(fā)生位置受到季節(jié)因素的影響,文獻[9]在模擬臺風起點時采用三維高斯核函數來模擬臺風起點位置在時間與空間上的分布,使得模擬結果更加精確合理,但是,在模擬時需要對不同區(qū)域乘以不同的權值來修正模擬結果,且沒有給出權值的具體取值標準。本文以文獻[9]的研究為基礎,并對其進行了修正,能夠較好地模擬西北太平洋地區(qū)臺風發(fā)生位置在時間與空間上的分布。
本文首先對核函數及三維高斯核函數進行簡要介紹,然后使用一維高斯核函數模擬臺風發(fā)生次數,最后根據三維高斯核函數模擬臺風起點在時間與空間上的分布。
臺風起點模型數據采用中國氣象局1949—2016年的臺風實測數據。每個記錄點的實測數據包括記錄時間、臺風等級、緯度、經度、中心壓強及2 min最大平均風速6個參數。為了使起點模型更加準確,需要對得到的臺風觀測數據進行處理。
(1) 在臺風選取時,刪除了觀測數據中的熱帶低壓記錄,即臺風等級不超過1級的臺風記錄。
(2) 在起點選取時,會遇到如下2種情況:若第1個臺風記錄數據的2 min平均最大風速值不為0,則該點統(tǒng)計為臺風起點;若出現前幾次記錄的2 min平均最大風速值為0,則選取最后一個為0的記錄作為臺風起點。
根據該統(tǒng)計方法在68 a的臺風實測數據中得到1 854次臺風起點記錄。
起點模型包含發(fā)生數量和發(fā)生位置2個部分,年發(fā)生量可根據一維核密度函數隨機抽樣得到,對于臺風的發(fā)生位置,本文采用基于時間與空間的三維核概率密度函數(probability density function,PDF)對歷史樣本進行擬合,然后根據Monte Carlo原理進行隨機抽樣,最后得到模擬起點的具體位置。
1.2.1 年臺風發(fā)生數量
核密度估計是一種非參數化的估計方法,基本的PDF為:
(1)
其中,x為被估計的向量;xi為第i個樣本向量;n為樣本數量;h為窗寬;K(·)為核函數。本文采用高斯核函數,即
(2)
最佳窗寬值可采用有偏交叉驗證(biased cross-validation,BCV)方法確定,本文以文獻[10]給出的一維BCV的一般式為基礎,對具體表達式進行推導,推導過程如下:
(3)
(4)
(5)
將(5)式代入(4)式可得:
(6)
其中,Δij=(xi-xj)/h;xi、xj分別為第i年、第j年的臺風年發(fā)生數量。將(6)式代入(3)式可得一維BCV的具體表達式為:
(7)
1.2.2 臺風發(fā)生位置
文獻[11]給出了多維核PDF及其窗寬的BCV公式的通用表達式。本文結合具體分析對象給出兩者的公式如下:
(8)
(9)
其中,n為樣本數量;h1、h2、h3分別為緯度、經度及時間維度的最佳窗寬;xlat、xlon、xtime分別為緯度、經度及時間維度的模擬起點位置參數;xlat,i、xlon,i、xtime,i分別為3個維度的第i個歷史樣本;Slat、Slon、Stime分別為3個維度的標準差;Δijk=(xik-xjk)/hk,xik、xjk分別為第k(k為1、2、3)維的第i個、第j個正規(guī)化樣本。由于各維度的取值范圍及量綱不同,需要將3個維度的樣本進行正規(guī)化處理,即將歷史樣本減去相應維度的均值,再將得到的值除以其標準差??紤]到時間為1~366 d循環(huán)變化,為了兼顧前一年年末對當年年初的影響以及后一年年初對當年年末的影響,需要將樣本在時間維度上擴大3倍,前一年的時間值在原來的時間上減去366,后一年的時間值在原來的時間上加上366。為了保證3個維度的樣本量相同,需要將空間維度的樣本等值擴大3倍。
臺風的年發(fā)生次數可以根據(1)式進行隨機抽樣,但在抽樣之前需要確定窗寬的最優(yōu)值,最優(yōu)窗寬值可以根據BCV方法得到,即選擇適當的h值使(7)式中的DBCV取得最小值。臺風年發(fā)生次數概率的一維高斯核函數擬合如圖1所示。
圖1 臺風年發(fā)生次數概率的一維高斯核函數擬合
從圖1a可以看出,當h=3時DBCV有最小值。為了有效評估本次擬合的效果,本文進行了30次模擬,每次均模擬68 a的臺風發(fā)生數量,30次模擬的平均值為1 892.33次,與歷史值的偏差為2.07%,模擬結果較為可靠。
臺風的發(fā)生位置由緯度、經度及時間3個參數確定,根據(9)式可以確定樣本正規(guī)化以后3個參數的最佳窗寬分別為0.25、0.15、0.05,最后根據Monte Carlo方法結合(8)式可以模擬出大量臺風的起點位置。為了方便與歷史值相比較,本文模擬了1 854次臺風起點,模擬結果如圖2所示。
為了對比模擬起點與歷史起點的差異,本文在3個維度方向上分別作了統(tǒng)計,統(tǒng)計結果見表1~表3所列(表中的數據為30次模擬結果的平均值)。
從表1~表3可以看出,模擬結果與歷史統(tǒng)計結果相近,相對偏差較小,其中相對偏差大于10%的部分是由于歷史數據較少帶來較大的相對偏差。模擬值與歷史值的偏差主要來自2個方面:① 模型本身具有很高的隨機性,而隨機性帶來的偏差是不可避免的;② 臺風的起點位置受多種因素共同影響,本文模型沒有考慮除時間和空間以外其他因素的影響,但是有些因素不必單獨考慮,比如溫度和濕度與時間有很大的相關性,考慮時間因素在一定程度上兼顧了溫度和濕度的影響,因此本文選擇了3個最主要的因素。
圖2 歷史與模擬臺風起點分布對比
表1 臺風起點緯度對比
表2 臺風起點經度對比
表3 臺風起點時間對比
(1) 本文采用基于三維高斯核函數的方法模擬臺風發(fā)生位置在時間與空間的分布,該方法能夠考慮時間因素的影響,是臺風模擬發(fā)展的趨勢,也為臺風全路徑模擬打下了堅實的基礎。
(2) 最佳窗寬的選擇對核函數模擬的精確性有著很大的影響,為了保證模擬結果的可靠性需要確定合理的窗寬值,本文使用有偏交叉驗證方法計算出的窗寬具有較高的可靠性。
(3) 利用臺風起點模型對西北太平洋地區(qū)進行了1 854次模擬,并將模擬結果與歷史實測數據在3個維度上分別進行了對比,結果表明,模擬結果與歷史實測數據的偏差較小,偏差大于10%的部分是由于歷史數據較少帶來較大的相對偏差。