陳元坤, 毛 丹, 李壽科, 劉 敏, 陳曉強, 陳 俊, 孫洪鑫
(1. 中南建筑設(shè)計院有限公司,武漢 430071; 2. 武漢大學(xué) 土木建筑工程學(xué)院,武漢 430072; 3. 湖南科技大學(xué) 土木工程學(xué)院,湖南 湘潭 411201)
風(fēng)壓系數(shù)極值是確定建筑圍護(hù)結(jié)構(gòu)設(shè)計風(fēng)荷載的重要變量。區(qū)組最大極值方法(block maximum,BM)是風(fēng)壓系數(shù)極值估計常用方法,其理論基于三種漸進(jìn)型極值分布(極值Ⅰ型、Ⅱ型、Ⅲ型),對多個區(qū)組的樣本極值進(jìn)行概率分布擬合估計極值,在數(shù)據(jù)樣本較大的情況下被認(rèn)為是精確方法。BM方法使用過程中忽略了區(qū)組中的第二大、第三大、等峰值數(shù)據(jù),數(shù)據(jù)使用率較低,在數(shù)據(jù)樣本量較少的情況下,BM方法難以給出準(zhǔn)確的極值結(jié)果。因此,學(xué)者們提出了一些基于短時程樣本的極值計算方法[1-4]。同時,為充分利用區(qū)組的峰值數(shù)據(jù),Simiu等[5]提出可采用超越閾值模型(peak over threshold,POT)來解決數(shù)據(jù)樣本較少的問題,用于極值風(fēng)速估計。POT模型極值計算方法基于廣義Pareto分布(generalized pareto distribution,GPD)理論。數(shù)據(jù)獨立同分布是POT模型使用的前提,Simiu等提出相鄰獨立峰值間距必須要滿足一定的時間間隔(4天或者8天),Duthinh等[6]使用均值穿越獲得獨立峰值數(shù)據(jù),全涌等[7]則建議使用自相關(guān)分析方法確定獨立峰值數(shù)據(jù)。而在概率分布參數(shù)估計方法方面, Haan[8]提出的GPD模型參數(shù)估計的無偏估計方法。Naess等[9]通過C0估計器改進(jìn)Haan估計與矩估計方法。Hosking等[10]驗證極大似然估計,矩估計,概率加權(quán)矩估計方法對GPD模型兩參數(shù)估計的可靠性,用于水文領(lǐng)域。而對于風(fēng)壓系數(shù)極值估計領(lǐng)域,當(dāng)前缺乏GPD參數(shù)估計適用性研究。閾值選取可決定POT極值估計結(jié)果的穩(wěn)定性和準(zhǔn)確性[11-12]。Davison等[13]提出用平均剩余壽命圖衡量超出量函數(shù)隨閾值變化的曲線,超出量函數(shù)趨于線性時,線性范圍內(nèi)閾值都為最佳閾值,該方法具有較大的主觀性。Coles等[14-15]利用似然比檢驗證明形狀參數(shù)在最佳閾值之后具有不變規(guī)律,此方法為圖形診斷方法,具有一定的主觀性,選擇的閾值不唯一,存在人工觀測過程。Duthinh基于W統(tǒng)計量方法研究自動選擇閾值,并用Bootstrap方法驗證閾值選取方法的準(zhǔn)確性。Liang等[16]提出基于峰值穩(wěn)定性的閾值自動法,實現(xiàn)自動選取最佳閾值,用于水文處理。李正農(nóng)等[17-18]基于POT方法研究了風(fēng)壓系數(shù)極值求取問題,但缺乏對其閾值自動選取方面的研究。
本文主要針對POT在高層建筑風(fēng)壓系數(shù)極值計算中的參數(shù)估計和閾值選取方面展開研究,研究不同GPD分布參數(shù)估計方法的適用性,確定合適的參數(shù)估計方法用于風(fēng)壓系數(shù)峰值的GPD分布擬合;將變點理論引入閾值選取,使用局部比較法確定最佳閾值,建立新的閾值自動選取方法,對比不同方法的性能,完善當(dāng)前風(fēng)壓系數(shù)極值估計的POT方法。
對于獨立同分布的樣本峰值數(shù)據(jù)x,設(shè)定樣本閾值為μ,超過閾值的數(shù)據(jù)樣本(超閾值樣本),其概率分布將向GPD分布收斂[19]。
(1)
式中:μ為位置參數(shù);ξ為形狀參數(shù);σ為尺度參數(shù)。GPD分布尾部分位數(shù)xp-GPD及重現(xiàn)期由式(2)和式(3)給出,即
(2)
(3)
式中:xp-GPD為GPD分布概率為p的尾部分位數(shù);n為獨立數(shù)據(jù)總數(shù);Nu為超閾值數(shù)目總數(shù);λ為單位時間獨立同分布數(shù)據(jù)數(shù)目;R為重現(xiàn)期。
極值事件服從泊松點過程,峰值樣本獨立同分布。風(fēng)洞試驗采集的風(fēng)壓系數(shù)時程樣本,采樣頻率較高,樣本之間具有明顯的相關(guān)性。采取一定的方法提取獨立峰值樣本,才可依據(jù)POT方法進(jìn)行風(fēng)壓系數(shù)極值估計。常用的獨立峰值提取方法為均值超越峰值提取方法,指定一個特定值—均值,將平均值以下的風(fēng)壓時程舍去,平均值以上的風(fēng)壓時程將與上交叉點、下交叉點作為起點與終點進(jìn)行分組,單個組提取峰值,組成獨立數(shù)據(jù),該方法已被證明是一性能優(yōu)越方法[20]。
1.3.1 矩估計
矩估計方法可用于GPD分布參數(shù)估計,根據(jù)超出量的前兩階矩即可計算GPD參數(shù)
(4)
(5)
式中:E(x-μ)為超出量的平均數(shù);s(x-μ)為超出量的標(biāo)準(zhǔn)差;μ為閾值,同時也是位置參數(shù)。
1.3.2 概率加權(quán)矩估計
GPD分布參數(shù)可用概率加權(quán)矩估計方法計算,式(6)~式(10)給出概率加權(quán)矩估計計算方法,位置參數(shù)μ為閾值
(6)
(7)
(8)
式中,Wr為總體矩的樣本估計量,對于有限的樣本大小,一致的矩估計(Wr)可以計算為
(9)
總體矩估計可以用Landwehr提出樣本估計量Wr來替代
(10)
式中:xi,n為超閾值的數(shù)據(jù)樣本;n為樣本數(shù)量。
1.3.3 De Haan估計
Haan提出了GPD分布參數(shù)估計方法基于以下兩個估計量,即
(11)
(12)
式中,k為數(shù)據(jù)高于閾值的觀測次數(shù),閾值代表第(k+1)個最高數(shù)據(jù)點。最高,第二高,…,第k高,(k+1)高數(shù)據(jù)分別由xn,xn-1,…,xn-(k+1),xn-k表示。GPD參數(shù)由式(13)、式(14)給出
σ=ρxn-kHk,n
(13)
(14)
這里當(dāng)ξ≥0時,ρ=1,當(dāng)ξ<0時,ρ=1-ξ。
1.3.4 極大似然估計
將GPD分布分布函數(shù)作為似然函數(shù),得出對數(shù)似然函數(shù),即
(15)
本文給出三種閾值選取方法,基于W統(tǒng)計量的閾值選取方法和基于形狀參數(shù)或極值結(jié)果穩(wěn)定性結(jié)合變點理論的閾值選取方法。
1.4.1 基于W統(tǒng)計量的閾值自動選取方法
基于W統(tǒng)計量的閾值選取方法是根據(jù)閾值所選擇數(shù)據(jù)對GPD分布的擬合優(yōu)度來確定閾值,依據(jù)GPD分布擬合最佳效果確定最佳閾值。也可通過將數(shù)據(jù)轉(zhuǎn)換為一種統(tǒng)計量,檢驗統(tǒng)計量與其對應(yīng)分布擬合優(yōu)度,W統(tǒng)計量就屬于后一種轉(zhuǎn)換統(tǒng)計量,與W統(tǒng)計量所對應(yīng)的分布為標(biāo)準(zhǔn)指數(shù)分布,在式(16)中給出W統(tǒng)計量的計算方法
(16)
式中:ui為i時刻的閾值;Wi為對應(yīng)的W統(tǒng)計量;ξi為此時的形狀參數(shù);σi為尺寸參數(shù);μi為位置參數(shù);Yi超出量。以下給出使用W統(tǒng)計量閾值選取方法的具體步驟:
步驟1計算W統(tǒng)計量;
步驟2給出W統(tǒng)計量與標(biāo)準(zhǔn)極值分布圖,以超閾值計算標(biāo)準(zhǔn)極值分布的值為橫坐標(biāo),對應(yīng)的W統(tǒng)計量為縱坐標(biāo),繪制W統(tǒng)計量與標(biāo)準(zhǔn)極值分布圖,并做橫縱坐標(biāo)均為標(biāo)準(zhǔn)極值分布的直線;
步驟3計算圖上點到標(biāo)準(zhǔn)極值分布直線的距離之和,最小距離和時對應(yīng)的閾值為最佳閾值。
1.4.2 基于形狀參數(shù)或極值分位數(shù)穩(wěn)定性-變點閾值自動選取方法
本文結(jié)合變點理論以及形狀參數(shù)/極值分位數(shù)的穩(wěn)定性提出閾值自動選取新方法。由變點統(tǒng)計理論,指出“模型中的某個或某些量起突然變化的點”為變點,變點能反映事物某種質(zhì)的變化[21]。具體使用流程如下:首要任務(wù)就是確定閾值范圍,確定一個有高概率存在最佳閾值的閾值范圍。確定候選閾值范圍需要考慮以下三點。 ①總體閾值范圍??傮w閾值范圍起點為所有獨立峰值風(fēng)壓系數(shù)的最小值,終點為保證超閾值樣本數(shù)據(jù)量大于5。②候選閾值間隔。在確定總體閾值范圍后,基于等間距方法確立候選閾值。候選閾值間隔過大會忽略掉隱藏在大間隔中的合適閾值,閾值間隔過小則使計算時間大幅增加。在本文中,基于獨立峰值樣本的大小,將候選閾值間隔確定為峰值樣本最小間距,且保證每次計算得到的形狀參數(shù)有變化。③總體閾值范圍分段。依據(jù)峰值風(fēng)壓系數(shù)分布范圍,將總體閾值范圍均分為4個區(qū)間,從這些小區(qū)間中,選擇其中的區(qū)間作為候選閾值區(qū)間。用形狀參數(shù)差值比來衡量候選閾值區(qū)間是否存在最優(yōu)閾值。在候選閾值區(qū)間內(nèi),形狀參數(shù)差值比值保持為正值或負(fù)值,則表示其形狀參數(shù)在遞增或遞減,并未趨于穩(wěn)定,存在最優(yōu)閾值的概率較小;如形狀參數(shù)差值比圍繞0值波動,則表示形狀參數(shù)在波動,此候選區(qū)間存在合適閾值。
在確定候選閾值范圍后,在候選閾值區(qū)間計算對應(yīng)的形狀參數(shù)或極值分位數(shù)。進(jìn)而計算相鄰3個閾值點對應(yīng)的局部比較量的方差變化值,在方差變化最大值所對應(yīng)的位置,即為變點位置,其對應(yīng)的閾值,即為候選最優(yōu)閾值。計算重現(xiàn)期為4.5組的POT極值分位數(shù),基于概率相等原則與Cook &Maney的78%極值分位數(shù)對應(yīng)進(jìn)行比較。
本文主要研究POT極值估計方法在風(fēng)壓系數(shù)極值估計中的應(yīng)用,風(fēng)壓系數(shù)數(shù)據(jù)來源于CAARC高層建筑剛性模型測壓風(fēng)洞試驗。試驗在湖南科技大學(xué)風(fēng)工程試驗中心進(jìn)行,模擬GB 50009—2012《建筑結(jié)構(gòu)荷載規(guī)范》[22]規(guī)定的D類地貌。模型縮尺比1∶400,試驗時風(fēng)洞中參考高度與模型頂部高度一致,為45.72 cm,參考高度處風(fēng)速為10.2 m/s。CAARC高層建筑足尺尺寸長×寬×高為45.72 m×30.48 m×182.88 m,模型縮尺比為1∶400,試驗風(fēng)向角定義以及模型測點布置如圖1所示,總共布置有308個測壓點。選取0°典型風(fēng)向角,獨立重復(fù)采樣表面風(fēng)壓時程200次,單次采樣時間為30 s,采樣頻率為330 Hz,每個測點單次采樣數(shù)為10 000個。風(fēng)速比為1/3.3,可得時間縮尺比為1/120,可得實驗室采樣約為足尺時長60 min。
圖1 CAARC建筑模型示意圖(cm)Fig.1 CAARC building model (cm)
測點風(fēng)壓系數(shù)時程Cp,ij
(17)
3.1.1 提取獨立峰值量
選擇0°風(fēng)向時峰度最大測點29,將其單次風(fēng)壓系數(shù)時程,使用均值超越法提取獨立峰值。圖2給出測點29原始風(fēng)壓系數(shù)時程,以及使用獨立峰值提取方法后的風(fēng)壓時程圖。
圖2 風(fēng)壓系數(shù)時程圖Fig.2 Wind pressure coefficient time chart
圖2 中的原始數(shù)據(jù)個數(shù)為10 000個,使用獨立峰值提取方法后獨立峰值個數(shù)分別為2 251個。后續(xù)進(jìn)一步驗證提取峰值后樣本的相關(guān)性和同分布性。
3.1.2 獨立峰值自相關(guān)性分析
圖3中給出Tap 29的原始數(shù)據(jù),以及使用獨立峰值提取方法提取的獨立峰值自相關(guān)函數(shù)圖。圖3中可以明顯看到Tap 29原始數(shù)據(jù)的自相關(guān)性較強,在時間間隔為大于3 s時,自相關(guān)系數(shù)降至0.2以下;使用均值超越法提取的獨立峰值在非常小的時間間隔內(nèi),自相關(guān)系函數(shù)幅值下降至0.05以下,在-0.05~0.05波動,方法提取得到獨立峰值相關(guān)性低,獨立性強。
圖3 自相關(guān)系數(shù)圖Fig.3 Autocorrelation coefficient
3.1.3 獨立峰值齊次點泊松過程檢驗
適合擬合為GPD分布的獨立峰值,其相鄰時間間隔t需要滿足齊次點泊松過程。推測相鄰獨立峰值時間間隔是否滿足齊次點泊松過程,通過對點泊松分布式(18)求反函數(shù),將獨立峰值時間間隔的經(jīng)驗分位數(shù)代入,圖4中給出獨立峰值的齊次點泊松過程檢驗。圖4中獨立峰值由圓點表示,超越均值法所提取的峰值與擬合直線的擬合優(yōu)度良好。
圖4 齊次點泊松過程檢驗圖Fig.4 Test of Poisson point process
在提取獨立峰值數(shù)量,以及自相關(guān)系數(shù)檢驗,齊次點泊松過程檢驗3個方面,均值超越法在獨立峰值提取方面表現(xiàn)良好。
P(t)=1-e-λt
(18)
3.2.1 參數(shù)估計方法性能研究及評價標(biāo)準(zhǔn)
GPD參數(shù)估計方法多為二參數(shù)估計方法,需關(guān)注參數(shù)估計方法對形狀參數(shù)、尺寸參數(shù)的估計不確定性,同時衡量對樣本量的依賴性,本文采取蒙特卡洛方法進(jìn)行參數(shù)估計方法性能評估研究,具體步驟如下所示:
步驟1對于檢驗參數(shù),設(shè)定一個取值范圍,形狀參數(shù)設(shè)定為[-1.5,0.5],尺寸參數(shù)設(shè)定為(0,0.6],樣本量設(shè)定為[10,500],固定除檢驗參數(shù)以外的參數(shù),具體參數(shù)設(shè)置如表1所示,參數(shù)的變化幅值為0.1;
表1 參數(shù)估計方法參數(shù)設(shè)置表Tab.1 Parameter estimation method parameter setting
步驟2根據(jù)設(shè)定參數(shù)值,使用蒙特卡洛模擬GPD分布,生成1 000組數(shù)據(jù),單次數(shù)據(jù)長度為1 000,采用相應(yīng)的參數(shù)估計方法(概率加權(quán)矩、矩估計、De-Haan估計、極大似然估計)計算對應(yīng)的GPD參數(shù);
步驟3將設(shè)定參數(shù)GPD分布的99.9%保證率極值分位數(shù),與蒙特卡洛模擬的1 000組數(shù)據(jù)所得分位數(shù)平均值相減,得到偏差,用以衡量參數(shù)估計方法準(zhǔn)確性;同時計算均方根誤差(均方根誤差=偏差2+方差),判斷參數(shù)估計方法的穩(wěn)定性。
3.2.2 參數(shù)估計方法對形狀參數(shù)估計的不確定性
圖5中給出了基于形狀參數(shù)變化下的不同參數(shù)估計方法得到的極值分位數(shù)偏差、均方根誤差圖。圖5(a)中,除概率加權(quán)矩估計方法與De Haan估計方法,其余方法得到的POT極值分位數(shù)偏差均隨著形狀參數(shù)增大偏差增大,其中極大似然估計對于形狀參數(shù)的變化最為敏感,在形狀參數(shù)為[-0.3~0.5]內(nèi)偏差開始呈指數(shù)形式上升,最大偏差為-15.09;其次影響較大的是矩估計,最大偏差為-9.30;概率加權(quán)矩估計與De Haan估計對于形狀參數(shù)的變化不敏感。圖5(b)中顯示在形狀參數(shù)為正值時,分位數(shù)均方根誤差隨形狀參數(shù)增大而增大,均方根誤差概率加權(quán)矩估計>De Haan估計>極大似然估計>矩估計。參數(shù)估計方法準(zhǔn)確性易受到形狀參數(shù)的影響,當(dāng)形狀參數(shù)為正值時,概率加權(quán)矩估計以及De Haan估計的準(zhǔn)確性較好,而矩估計和極大似然估計的準(zhǔn)確性則較差;對于估計結(jié)果穩(wěn)定性,矩估計的穩(wěn)定性較好,其他參數(shù)估計方法的穩(wěn)定性比較接近。因此,建議使用概率加權(quán)矩估計方法、De Haan估計方法計算GPD分布的形狀參數(shù)。
圖5 基于形狀參數(shù)變化的分位數(shù)比較圖Fig.5 Quantile comparison based on the change of shape parameters
3.2.3 參數(shù)估計方法對尺寸參數(shù)估計的不確定性
圖6 給出了基于尺度參數(shù)變化下的不同參數(shù)估計方法得到的極值分位數(shù)偏差、均方根誤差圖。由圖6(a)可以看出,極值分位數(shù)偏差總體隨著尺寸參數(shù)的增大而增大,其中De Haan估計偏差絕對值最大,最大為-0.26,其次為極大似然估計,最大偏差為-0.12,概率加權(quán)矩估計與矩估計參數(shù)估計方法的偏差總體較小,接近于0值。由圖6(b)可以看出,針對于估計方法結(jié)果的穩(wěn)定性,極值分位數(shù)的均方根誤差隨形狀參數(shù)增大而增大,De Haan估計受到影響最大,最大值為 0.11,其次概率加權(quán)矩估計>矩估計>極大似然估計。
圖6 基于尺寸參數(shù)變化的分位數(shù)比較圖Fig.6 Quantile comparison based on the change of size parameters
綜上所述,De Haan參數(shù)估計方法受到尺寸參數(shù)的影響較大,隨著尺寸參數(shù)的增大(正值范圍內(nèi)),偏差與均方根誤差均增大,即準(zhǔn)確性與穩(wěn)定性降低;其次為極大似然估計方法,偏差較大,準(zhǔn)確性較低;綜合看來,概率加權(quán)矩估計方法對于GPD概率模型參數(shù)估計準(zhǔn)確性與穩(wěn)定性均較優(yōu)。
3.2.4 參數(shù)估計方法對樣本大小的依賴性
圖7(a)中給出樣本量變化時采用不同參數(shù)估計方法得到的GPD分布99.9%極值分位數(shù)偏差圖。概率加權(quán)矩估計、矩估計、極大似然估計隨樣本量增大而分位數(shù)偏差減小,偏差范圍為[0,0.5];De Haan估計的極值分位數(shù)偏差幾乎不變,誤差穩(wěn)定在[-0.13,-0.10]。圖7(b)給出樣本量變化時不同參數(shù)估計方法得到的極值分位數(shù)均方根誤差圖,與偏差圖一致,概率加權(quán)矩估計方法在樣本量較小(<40)的情況下效果不理想,在樣本量≥50的情況下,參數(shù)估計方法均方根誤差十分接近,并且較小。然而,在極值風(fēng)壓系數(shù)采用POT超閾值方法進(jìn)行估計,其獨立峰值樣本量均在100以上,因此對于樣本量敏感性方面,本文推薦的這幾個參數(shù)估計方法均可適用。
圖7 基于樣本量變化的分位數(shù)比較圖Fig.7 Quantile comparison based on the change of sample size
綜合本節(jié)不同參數(shù)估計方法對形狀參數(shù)、尺寸參數(shù)、樣本量的不確定性研究,可以看出,在進(jìn)行GPD參數(shù)估計時,最佳參數(shù)估計方法宜選用概率加權(quán)矩估計方法。
3.3.1 閾值選取方法性能評估算例設(shè)置
本節(jié)將研究閾值選取方法對樣本大小、樣本非高斯特性的敏感程度。對于樣本大小,將衡量單組,以及10,20,…,200組數(shù)據(jù)對閾值選取方法的依賴程度,比較POT估計極值與BM估計極值之間的偏差大小,從而衡量閾值選取方法的準(zhǔn)確性及性能。對于樣本非高斯特性方面,依據(jù)本文風(fēng)洞試驗結(jié)果,將風(fēng)壓系數(shù)時程的峰度與偏度劃分成不同范圍,研究不同非高斯程度樣本基于POT方法和BM方法估計極值之間的誤差,由此給出閾值選取方法對樣本非高斯特性的依賴程度,具體算例參數(shù)設(shè)定如表2所示。
表2 閾值選取方法性能研究參數(shù)設(shè)置表Tab.2 Threshold selection method specific parameter setting
3.3.2 閾值選取方法對樣本大小的依賴性
單組采樣長度30 s,樣本量在[1,200]組變化時,采用不同閾值選取方法選取閾值,依據(jù)POT極值估計方法得到極值分位數(shù),與標(biāo)準(zhǔn)極值(基于200組的風(fēng)壓系數(shù)時程采用BM極值估計方法的78%保證率分位數(shù))進(jìn)行比較,圖8中給出比較結(jié)果。
圖8 樣本量影響下不同閾值選取方法分位數(shù)比較圖Fig.8 Quantiles comparison of different threshold selection methods under the influence of sample size
圖8中給出典型測點Tap 29依據(jù)不同閾值選取方法進(jìn)行POT極值估計結(jié)果,與BM方法得到的標(biāo)準(zhǔn)極值(黑色水平線)比較結(jié)果。由圖8(a)可以看出,三種閾值選取方法在樣本量為1~10組時,POT極值分位數(shù)均快速逼近標(biāo)準(zhǔn)極值,在樣本量為10~100組時,三個方法所得結(jié)果非常接近,而樣本量為100~200組時,基于W統(tǒng)計量的閾值選取方法反而會偏離標(biāo)準(zhǔn)極值,而基于變點自動閾值選取方法的POT極值依然非常接近標(biāo)準(zhǔn)極值。圖8(b)給出所有測點在樣本容量為1~10組時依據(jù)不同閾值選取方法得到的POT極值分位數(shù)與標(biāo)準(zhǔn)極值的誤差率平均值,可以看出,三種閾值選取方法的POT極值誤差率平均值均約5%,并隨樣本量的增加而減小,在樣本量達(dá)到5組后趨于平穩(wěn),基于極值穩(wěn)定性-變點閾值自動選取方法的POT極值誤差平均值略高于其他閾值選取方法,基于形狀參數(shù)穩(wěn)定性-變點閾值選取方法的POT極值與基于W統(tǒng)計量閾值選取方法的POT極值總體誤差接近。
綜上所述,基于W統(tǒng)計量的閾值選取方法計算的POT極值會在樣本量較大的情況下,有所偏差?;跇O值穩(wěn)定性-變點閾值自動選取方法計算的POT極值,在小樣本容量下誤差率略大于其他方法。基于形狀參數(shù)穩(wěn)定性-變點閾值自動選取方法計算的POT極值,在樣本量變化的情況下有較高準(zhǔn)確性,且穩(wěn)定性較好。因此,從樣本大小適用性可以看出,基于形狀參數(shù)穩(wěn)定性-變點閾值自動選取方法可較好的實現(xiàn)POT極值估計方法的閾值選擇。
3.3.3 閾值選取方法對樣本非高斯特征的適用性
為研究閾值選取方法對樣本非高斯特征的敏感性,本節(jié)將選取0°風(fēng)向所有測點的風(fēng)壓系數(shù)數(shù)據(jù),樣本長度約5個足尺1小時,依據(jù)其峰度偏度分布范圍劃分為5段,使用不同閾值選取方法,依據(jù)POT極值估計方法計算風(fēng)壓系數(shù)極值與標(biāo)準(zhǔn)極值(BM-GEV分布78%保證率極值)進(jìn)行比較,表3~表5給出三種閾值選取方法計算的POT極值誤差率。同時,將表中所示的偏度與峰度范圍分為三種情況,低峰度-低偏度(偏度范圍為[-0.1 , 0.3]且峰度范圍為[2 , 3.5]),中等峰度-中等偏度(偏度范圍為[0.3 , 0.8]且峰度范圍為[3.5 , 5]),高峰度-高偏度(偏度>0.8或峰度>5)。
表3 基于形參穩(wěn)定性的變點閾值選取方法極值誤差率Tab.3 Based on shape parameter stability change-point threshold selection method extreme value error rate
表4 基于極值穩(wěn)定性的變點閾值選取方法極值誤差率Tab.4 Based on extreme value stability change-point threshold selection method extreme value error rate
表5 基于W統(tǒng)計量的閾值選取方法極值誤差率Tab.5 Based on W statistic threshold selection method extreme value error rate
圖9給出所有測點基于形狀參數(shù)穩(wěn)定性-變點閾值選取方法(簡稱“形參—變點閾值選取方法”)、基于極值穩(wěn)定性-變點閾值自動選取方法(簡稱“極值—變點閾值選取方法”)、基于W統(tǒng)計量的閾值選取方法計算POT極值與標(biāo)準(zhǔn)極值的誤差率平均值比較結(jié)果。
圖9 不同非高斯特征的測點POT極值分位數(shù)誤差Fig.9 Quantile error under the change of sample non-Gaussian characteristics
由圖9可以看出,隨偏度與峰度增大而POT極值誤差率增大。在低偏度—低峰度、中偏度—中峰度區(qū)域的測點,形參—變點閾值選取方法與W統(tǒng)計量閾值選取方法計算的POT極值的誤差率在3%~4%左右,低于極值—變點閾值選取方法的5%誤差率。在高偏度—高峰度區(qū)域的測點,極值—變點閾值選取方法的誤差率較低,為10.5%。綜上所述,基于形狀參數(shù)穩(wěn)定性的變點-閾值選取方法適用于低峰度-低偏度、中峰度-中偏度的測點;基于極值穩(wěn)定性的變點-閾值選取方法適用于高峰度-高偏度的強非高斯測點。
本文針對超越閾值模型極值估計中的關(guān)鍵步驟——參數(shù)估計方法和閾值選取方法開展了參數(shù)化研究,確定了不同方法的適用性。
(1) 均值超越獨立峰值提取方法提取的獨立峰值樣本的自相關(guān)性低,泊松點過程擬合效果效果好,較好的滿足了獨立同分布。
(2) 通過蒙特卡洛方法衡量了形狀參數(shù)、尺寸參數(shù)、樣本量對參數(shù)估計方法的影響,依據(jù)GPD參數(shù)估計方法準(zhǔn)確性、穩(wěn)定性、方法效果方面的研究結(jié)果,建議使用概率加權(quán)矩估計方法估計廣義Pareto分布參數(shù)。
(3) 基于變點理論提出了閾值選取方法,該閾值選取方法可實現(xiàn)閾值自動選取,受到樣本量以及樣本非高斯特性的影響較小,由此構(gòu)建的改進(jìn)超越閾值模型計算風(fēng)壓系數(shù)極值與標(biāo)準(zhǔn)極值的總體偏差小于5%。
(4) 對比研究了不同閾值選取方法的適用性,結(jié)果表明基于形狀參數(shù)穩(wěn)定性的變點-閾值選取方法適用于低峰度-低偏度、中峰度-中偏度的測點;基于極值穩(wěn)定性的變點-閾值選取方法適用于高峰度-高偏度測點。