溫華洋 朱華亮 劉壯 孔芹芹 馬文周 陳鳳嬌
(1.安徽省氣象信息中心,安徽 合肥230031;2.合肥工業(yè)大學,安徽 合肥230023)
均一的長序列氣象資料是氣候變化研究的基礎[1-2],但由于臺站在長期觀測過程中,不可避免的存在觀測方式、觀測儀器和周邊探測環(huán)境改變以及臺站遷移等非氣候因素造成了長序列數(shù)據(jù)的不連續(xù)[3]。為建立真實的氣候序列,眾多學者對資料序列的均一性檢驗和訂正工作開展了大量研究,形成了諸多方法。如標準正態(tài)均一化檢驗方法[4](簡記SNHT,下同)、二相回歸方法[5](TPR)、懲罰最大F檢驗方法[6](PMFT)等,這些方法在地面資料[7-9]、輻射資料[10]和高空資料[11]均一性檢驗上取得了一定的進展,形成了系列均一化數(shù)據(jù)集[12-14],在氣候變化研究等領域發(fā)揮重要作用。各種方法的比較表明,根據(jù)不同要素、不同區(qū)域、不同時間尺度選取不同的均一性檢驗與訂正方法較為有效[15-18]。
風的研究與大氣環(huán)境治理[19]、風能開發(fā)利用[20]和氣候變化[21-24]等工作密切相關,但風資料的均一性研究,國內(nèi)目前仍處于一些嘗試性的水平。劉小寧[21]采用SNHT方法對中國主要氣象臺站年平均風速進行了檢驗,何冬燕等[22]以兩站為例對比分析了直接檢驗方法(t-檢驗)和3種間接檢驗方法(SNHT、PMFT和PMTT(懲罰最大T檢驗))對年平均風速的檢驗效果。周昊楠等[23]利用PMFT對新疆地區(qū)105個站點年平均風速進行了檢驗,并分析了造成非均一性的主要原因。彭嘉棟等[24]利用改進的二相回歸法對中國中部典型高山站南岳和廬山平均風速進行了檢驗和訂正。這些檢驗方法中不少方法要求氣候序列服從正態(tài)分布,然而,有研究表明風速的概率分布并非完全是正態(tài)的,如劉小寧[21]使用的690個氣象站風速資料序列中,服從正態(tài)分布的僅171個,占比不足25%。Stewart和Essenwanger[25]通過45個站點的風速資料研究發(fā)現(xiàn),相較于其他分布,Weibull分布能較好地擬合實測風速的概率分布。Seguro和Lambert[26]研究表明,三參數(shù)Weibull分布對于年最大風速具有較高的擬合精度和較強的適應性,并用極大似然法估計出三參數(shù)Weibull風速分布的參數(shù)。Jandhyala等[27]采用似然比法探究了Weibull模型中的變點檢驗問題,并對極端氣溫數(shù)據(jù)開展應用。這些理論研究為開展基于Weibull分布的風速均一化檢驗提供了基礎。
為此,本文采用基于三參數(shù)Weibull分布的變點檢驗方法,對安徽省1980—2018年元數(shù)據(jù)記錄較為典型的郎溪站(包含了探測環(huán)境變化、臺站遷移、儀器換型及高度調(diào)整等人為因素可能導致變點的情況)年最大風速序列進行檢驗,依據(jù)臺站的元數(shù)據(jù)對檢驗出來的非均一點產(chǎn)生的原因進行了分析,最后應用該方法對安徽省部分臺站1981—2018年年最大風速序列進行檢驗,并與國內(nèi)普遍使用的PMFT法、SNHT法進行對比,為風速均一性檢驗提供參考。
選用安徽省1980—2018年年最大風速資料相對完整的56個國家級氣象站作為研究對象,站點分布見圖1,其中安徽省北部地區(qū)站點分布較為稀疏,南部地區(qū)站點分布較為密集。各站觀測資料均通過臺站—省級—國家級的三級質(zhì)量控制。為減少氣候因素對序列均一性檢驗結(jié)果的影響,需對檢驗序列進行去趨勢處理。首先,針對待檢驗序列X={x1980,x1981,…,x2018}的站點選取參考站,參考站選取標準為:(1)與待檢驗站點的直線距離小于200 km,地理環(huán)境相似;(2)1980—2018年年最大風速資料序列較為完整;(3)與待檢驗站點的歷年最大風速相關系數(shù)通過置信度α=0.05的顯著性檢驗,且排名前3位。其次,對三個參考站的年最大風速序列取平均值形成參考序列W={w1980,w1981,…,w2018}。最后,利用待檢驗臺站的年最大風速與參考站進行比值X/W,形成檢驗序列Z={z1,z2,…,z39},其中i=1,2,…,39。
圖1 安徽省56個國家氣象站站點分布Fig.1 Distribution of 56 national meteorological stations in Anhui province
Weibull分布是可靠性研究領域中應用最廣泛的一種統(tǒng)計分布模型,而三參數(shù)Weibull分布是Weibull模型中對數(shù)據(jù)適應能力最強、擬合效果最好的,尤其對風而言[26]。三參數(shù)Weibull分布函數(shù)見式(1)所示:
式(1)中,a>0為尺度參數(shù),b>0為形狀參數(shù),0<c<z為位置參數(shù)。給出一組序列長度為n的年最大風速序列Z={z1,z2,…,zn},利用K-S方法[28]檢驗序列是否服從Weibull分布(采用顯著性水平為0.05的檢驗)。對于服從Weibull分布的序列,再利用極大似然估計法[26]得到年最大風速序列的三參數(shù)Weibull分布的參數(shù)a,b,c,即得到序列Z的三參數(shù)Weibull分布函數(shù)F(z;a,b,c)。
假設存在一個分割集κ={3,4,…,n-2}將年最大風速序列Z分割為兩個新的子序列,即Z1={z1,z2,…,zk},Z2={zk+1,zk+2,…,zn},其中k∈κ。若序列Z1,Z2均通過K-S檢驗,則利用極大似然估計法可以得到序列Z1,Z2的三參數(shù)Weibull分布函數(shù)F1(z;a1,b1,c1)和F2(z;a2,b2,c2)。如果序列Z在分割點k發(fā)生突變,則有F1(z;a1,b1,c1)≠F2(z;a2,b2,c2)。為此,可以定義檢驗統(tǒng)計量:
式(2)中,Λk,n的定義見文獻[27],∈κ。當QN(^k)大于樣本量對應的檢驗統(tǒng)計量閾值(表1)時,認為序列Z在^k處發(fā)生突變;反之,則未發(fā)生突變。對于發(fā)生突變的序列,在突變點^k處應用二分法將序列分為兩個子樣本,并分別進行均一性檢驗,繼而檢測出序列的全部非均一點,而當子樣本長度小于8時,則不再進行均一性檢驗。
表1 不同樣本量對應的顯著性水平為0.05的檢驗閾值Table 1 Test threshold of significance level at 0.05 in terms of different sample sizes
2.1.1 序列去趨勢
1980—2018年郎溪氣象站年最大風速原始序列和去趨勢序列見圖2。由圖2可知,年最大風速序列的波動較大,序列的最大值達到16.1 m·s-1,最小值達到6.3 m·s-1,其中1980—1998年的年最大風速為10.3—15.3 m·s-1,均 值 為13.1 m·s-1,并 以1.16 m·s-1/10 a的速度下降。從1999年開始,年最大風速明顯變小,1999—2010年的年最大風速為6.3—11.0 m·s-1,均值為8.3 m·s-1,并以1.73 m·s-1/10 a的速度下降。到2010年之后,年最大風速又開始明顯變大,2011—2018年的年最大風速為9.8—16.1 m·s-1,均值為13.5 m·s-1,并以2.07 m·s-1/10 a的速度下降。總體上,整個序列呈現(xiàn)下降趨勢。為減少氣候因素對序列趨勢的影響,選用參考站進行去趨勢處理。經(jīng)檢查發(fā)現(xiàn),馬鞍山站、涇縣站和繁昌站的年最大風速資料序列較為完整,與郎溪站的距離較近,地理環(huán)境相似,年最大風速相關系數(shù)分別為0.77、0.33和0.33,且通過顯著性水平α=0.05的顯著性檢驗。利用馬鞍山站、涇縣站和繁昌站的年最大風速序列對郎溪站觀測序列進行去趨勢處理,得到郎溪站年最大風速去趨勢序列(圖2b)。由圖2b可知,序列在1999年、2010年前后發(fā)生了顯著的變化,將整個序列分為1980—1998年、1999—2010年和2011—2018年三段,各段內(nèi)序列基本無變化趨勢。
圖2 1980—2018年郎溪氣象站年最大風速原始序列(a)和去趨勢序列(b)Fig.2 The original sequence(a)and detrended sequence(b)of annual maximum wind speed at Langxi meteorological station from 1980 to 2018
2.1.2 Weibull分布檢驗及參數(shù)估計
針對郎溪站1980—2018年的年最大風速去趨勢序列Z,依次取分割點k=3,4,…,n-2(對應年份為1982,1983,…,2016),將序列分割為左右兩個子序列,利用K-S方法分別檢驗分割點左側(cè)序列和右側(cè)序列是否服從Weibull分布。圖3a為各分割點左側(cè)序列和右側(cè)序列K-S檢驗的P值,可以發(fā)現(xiàn)各分割點兩側(cè)序列的檢驗P值均大于0.05,通過顯著性檢驗,表明各分割點兩側(cè)的序列均服從Weibull分布。為此,可以采用極大似然估計法得到各分割點兩側(cè)序列的三參數(shù)Weibull分布的參數(shù)a,b,c,即得到各分割點兩側(cè)序列的三參數(shù)Weibull分布函數(shù)F(z;a,b,c)。如果序列Z在某一分割點處存在非均一點,則Weibull分布的參數(shù)a、b或c一定發(fā)生變化,通過線性變化^Z=(Z-c)/a,將Weibull分布的位置參數(shù)c標準化為0,尺度參數(shù)a標準化為1,則可以側(cè)重于研究Weibull分布形狀參數(shù)b的變化。圖3b為各分割點兩側(cè)序列的Weibull分布的形狀參數(shù)估計值,可以看出形狀參數(shù)在2010年附近出現(xiàn)了較大的跳躍,表明2010年前后可能出現(xiàn)了非均一點。
圖3 1980—2018年郎溪站不同分割點兩側(cè)序列的Weibull分布K-S檢驗P值(a)和形狀參數(shù)估計值(b)Fig.3 The P-values(a)and shape parameter estimation values(b)of Weibull distribution′s K-Stest on two side sequences at different segmentation points at Langxi meteorological station from 1980 to 2018
2.1.3 年最大風速的均一性檢驗
利用式(2)可以得到郎溪站1980—2018年的年最大風速去趨勢序列Z在不同分割點的檢驗統(tǒng)計值Qn(k),如圖4a所示,可以看出序列的檢驗統(tǒng)計值在2010年達到最大,且大于樣本量對應的檢驗統(tǒng)計量閾值16.38,表明郎溪站的年最大風速序列在2010年發(fā)生了突變。利用二分法將序列分為1980—2009年和2011—2018年兩段,并分別進行均一性檢驗,發(fā)現(xiàn)1980—2009年的序列檢驗統(tǒng)計值在1999年達到最大(圖4b),且大于樣本量對應的檢驗統(tǒng)計量閾值16.14,表明郎溪站的年最大風速序列在1999年也發(fā)生了突變。再對子樣本1980—1998年和2000—2009年進行均一性檢驗時,未發(fā)現(xiàn)非均一點。經(jīng)查郎溪站歷史沿革和《氣象臺站觀測環(huán)境綜合調(diào)查評估報告(安徽省郎溪)》,2007年郎溪站地面探測環(huán)境評分僅58.6分,不符合要求的人為障礙物累計遮擋方位達到357.2°,人為障礙物主要是1998—2000年建設完成的住宅樓、宿舍樓、辦公樓和廠房。隨著建筑物數(shù)量增多和高度增加,會對空氣的流動產(chǎn)生阻擋作用,造成觀測場的測量風速明顯變小。2011年觀測場由建筑物密集的城區(qū)搬遷至正北方向約3 km探測環(huán)境較好的郊區(qū),其地面探測環(huán)境評分為96.1分,無人為障礙物,因而探測到的風速變大,故認為該方法檢驗出的1999年和2010年兩個非均一點是真實存在的,考慮1999年和2010年前后觀測方式和統(tǒng)計方法無變化,風速傳感器未換型,且儀器高度無變化,認為探測環(huán)境變化和站址遷移是郎溪站年最大風速序列產(chǎn)生非均一點的主要原因。
圖4 1980—2018年(a)和1980—2009年(b)郎溪站年最大風速序列不同分割點的檢驗統(tǒng)計量Fig.4 Test statistics of annual maximum wind speed sequence at different segmentation points during 1980-2018(a)and 1980-2009(b)at Langxi meteorological station
采用三參數(shù)Weibull檢驗對安徽省1980—2018年年最大風速資料相對完整的56個臺站進行均一性檢驗,同時也用PMFT和SNHT方法對這些臺站進行均一性檢驗,其中SNHT方法選取參考站標準與Weibull方法一致,檢驗結(jié)果如表2和表3。
表2 1980—2018年安徽省56個臺站最大風速資料Weibull、PMFT和SNHT檢驗結(jié)果及原因分析Table 2 Test results of maximum wind speed data using the Weibull,PMFT,and SNHT methods and cause analysis at 56 stations of Anhui province from 1980 to 2018
注:“-”為沒有突變年份;“無法檢驗”為該臺站的年最大風速序列(或取對數(shù)后)不服從正態(tài)分布,無法用SNHT法檢驗;存在多個非均一點的,按檢驗結(jié)果前后次序給出。
表3 1980—2018年安徽省56個臺站最大風速資料Weibull、PMFT和SNHT檢驗結(jié)果統(tǒng)計Table 3 The statistical results of the test maximum wind speed data using the Weibull,PMFT and SNHT methods at 56 stations of Anhui province from 1980 to 2018
在Weibull檢驗方面,56個臺站的年最大風速序列均通過K-S檢驗,表明序列均服從Weibull分布,采用Weibull分布檢驗發(fā)現(xiàn)56個臺站中有15個臺站存在非均一點,合計檢測出18個非均一點,其中霍邱站、銅陵站和郎溪站均檢測到2個非均一點。18個非均一點中有15個探明原因,占比為83.3%,其中因遷站和儀器換型造成非均一點的有8個,占比為44.4%,因儀器高度調(diào)整或周圍障礙物導致探測環(huán)境變化的有7個,占比為38.9%,另外3個非均一點沒有得到相應臺站歷史沿革和探測環(huán)境綜合調(diào)查的印證,存在誤判的可能性;在SNHT檢驗方面,56個臺站中有19個臺站未通過正態(tài)分布檢驗,對這些臺站的年最大風速序列取對數(shù)變換后,仍有6個臺站未通過正態(tài)分布檢驗,對剩下的50個臺站進行SNHT檢驗,在檢測出符合顯著性的非均一點之后,再對分割點前后的兩個序列做檢測,檢查兩個序列是否均服從正態(tài)分布,發(fā)現(xiàn)有5個臺站分割點前后的分布不同時服從正態(tài)分布。故實際上有11個臺站是無法用SNHT法檢驗的。在剩下的45個臺站中,使用SNHT方法找到了20個非均一點,其中因遷站和儀器換型造成非均一點的有10個,占比為50%,因儀器高度調(diào)整或周圍障礙物導致探測環(huán)境變化的有5個,占比為25%,沒有得到相應臺站歷史沿革和探測環(huán)境綜合調(diào)查印證的有5個,占比為25%;同樣,在PMFT檢驗方面,50個年最大風速序列通過正態(tài)分布檢驗的臺站中檢測出4個臺站各存在一個非均一點,查閱臺站歷史沿革發(fā)現(xiàn)4個非均一點均由遷站造成。
綜合比較Weibull、PMFT和SNHT檢驗結(jié)果發(fā)現(xiàn),1980—2018年安徽省56個臺站的年最大風速序列均通過Weibull分布檢驗,而有11個臺站的年最大風速序列未通過正態(tài)分布檢驗,表明年最大風速序列更符合Weibull分布。56個臺站的年最大風速序列均可用Weibull檢驗,而只有50個臺站的序列可以采用PMFT檢驗,45個臺站的序列可以采用SNHT檢驗,且PMFT只檢測出4個非均一點,對年最大風速序列非均一點的敏感程度不如Weibull和SNHT。SNHT檢測出20個非均一點,Weibull檢測出18個非均一點,但Weibull方法找到的18個非均一點中有15個能得到臺站歷史沿革或者綜合調(diào)查等的印證,檢測準確率高達83.3%,而SNHT方法的檢測準確率只有75%,相較于SNHT方法,Weibull方法的檢測準確率更高。
(1)采用三參數(shù)Weibull分布對1980—2018安徽省郎溪站的年最大風速資料序列進行均一性檢驗表明,郎溪站年最大風速資料序列在1999年和2010年存在非均一點,查閱郎溪站臺站歷史沿革發(fā)現(xiàn),探測環(huán)境變化和站址遷移是郎溪站年最大風速序列產(chǎn)生非均一點的主要原因。
(2)通過對1980—2018年安徽省56個臺站的年最大風速資料序列的均一性檢驗發(fā)現(xiàn),56個臺站的年最大風速序列均通過Weibull分布檢驗,而只有50個臺站的年最大風速序列通過正態(tài)分布檢驗,表明年最大風速序列更符合Weibull分布。在檢驗結(jié)果方面,Weibull法檢測出18個非均一點,其中有15個點對應著臺站遷移、儀器換型、儀器高度調(diào)整和探測環(huán)境變化等原因,檢驗準確率為83.3%;PMFT法檢測出4個非均一點,這4個點均由遷站造成,檢驗準確率為100%;SNHT檢測出20個非均一點,其中有15個非均一點得到臺站歷史沿革的印證,檢驗準確率為75%。
(3)綜合比較Weibull、PMFT和SNHT檢驗結(jié)果發(fā)現(xiàn),PMFT法只檢測出4個非均一點,對年最大風速序列非均一點的敏感程度不如Weibull和SNHT,SNHT法對待檢序列要求較高,56個站點中有11個站點無法使用,且檢驗準確率不及Weibull法,這表明Weibull方法在年最大風速序列的均一性檢驗中更具有優(yōu)勢,但從檢驗過程來看,仍存在PMFT法和SNHT法同時檢測出而Weibull未檢測出的非均一點,如望江站2013年遷站引起的非均一點,表明Weibull分布檢驗存在著漏檢的情況,因此可以考慮將三者結(jié)合同時檢驗,相互補充,相互參照,以提高檢測的準確率。
(4)本研究重點探討了基于三參數(shù)Weibull分布的變點檢驗方法對年最大風速序列均一性檢驗效果,但對年平均風速序列均一性檢驗效果如何尚未討論,可作為后續(xù)研究工作,并與文獻[21—23]研究結(jié)論進行對比分析,進一步探討該方法的優(yōu)劣。此外,很多斷點是由臺站遷移、儀器變更等原因造成的,這些原因不僅會導致年最大風速序列出現(xiàn)斷點,也可能會導致相應的年平均風速序列出現(xiàn)斷點,兩者檢驗結(jié)果的互相比較、印證,也可作為后續(xù)工作重點進行探索。