費(fèi)強(qiáng) 許歡
摘 ? 要:氣象數(shù)據(jù)的記錄早期都是人工進(jìn)行觀測(cè)并記錄而獲得的。隨著計(jì)算機(jī)技術(shù)的發(fā)展、自動(dòng)化水平的提高,部分氣象觀測(cè)站點(diǎn)的氣象數(shù)據(jù)逐漸開(kāi)始應(yīng)用儀器自動(dòng)記錄氣象觀測(cè)數(shù)據(jù),如何將雙套站的兩套數(shù)據(jù)融合成一套數(shù)據(jù)成為氣象站業(yè)務(wù)投入前必須解決的問(wèn)題。文章利用安徽氣象局祁門(mén)站由A,B兩套儀器測(cè)得的氣溫觀測(cè)數(shù)據(jù),在對(duì)數(shù)據(jù)進(jìn)行有效的預(yù)處理之后,提出了3種融合數(shù)據(jù)算法:一是基于空間一致性的主備法;二是基于數(shù)據(jù)的滑動(dòng)方差和標(biāo)準(zhǔn)差,對(duì)數(shù)據(jù)賦以不同權(quán)重的權(quán)重法;三是基于差值訂正的合成法。將其進(jìn)行分析和評(píng)估并比較融合效果,結(jié)果表明,3種算法都是合理的,融合值基本可以反映真實(shí)的情況。
關(guān)鍵詞:氣象;滑動(dòng)方差;空間一致性;數(shù)據(jù)融合
1 ? ?我國(guó)自動(dòng)氣象站發(fā)展概述
我國(guó)是世界上氣候變化較大的地區(qū)之一,為了對(duì)極端天氣進(jìn)行提前預(yù)防和抵御,中國(guó)氣象局大力采取一系列措施,推動(dòng)和促進(jìn)大氣監(jiān)測(cè)自動(dòng)化快速發(fā)展[1]。從1999年我國(guó)自行研發(fā)第一批自動(dòng)氣象站開(kāi)始,到現(xiàn)在已有30 000多個(gè)自動(dòng)氣象站,在很大程度上增加了地面氣象觀測(cè)資料的時(shí)間密度并提高了觀測(cè)數(shù)據(jù)的精確度[2]。隨著氣象科技的發(fā)展,雙套自動(dòng)氣象站建成并已投入使用。雙套自動(dòng)站的建設(shè)工作是在原有自動(dòng)氣象站的基礎(chǔ)上,再建設(shè)一套新型自動(dòng)氣象觀測(cè)設(shè)備,從而取消人工對(duì)比觀測(cè),實(shí)現(xiàn)雙套自動(dòng)觀測(cè)數(shù)據(jù)的對(duì)比觀測(cè),在一定程度上解放了觀測(cè)員,推動(dòng)了氣象現(xiàn)代化的進(jìn)程[3-4]。
在雙套自動(dòng)氣象站出現(xiàn)的同時(shí),問(wèn)題也隨之而來(lái)。雙套站擁有A,B兩套儀器,每套儀器各測(cè)出一套數(shù)據(jù),許多服務(wù)只需要一套觀測(cè)數(shù)據(jù)進(jìn)行分析處理即可,因此,如何將A,B兩套儀器的觀測(cè)數(shù)據(jù)融合為一組數(shù)據(jù)成為自動(dòng)氣象站亟需解決的問(wèn)題[5-6]。本研究利用安徽氣象局祁門(mén)站由A,B兩套儀器測(cè)得的氣溫觀測(cè)數(shù)據(jù),對(duì)原始數(shù)據(jù)進(jìn)行有效處理后,利用基于空間一致性的主備法,基于數(shù)據(jù)的滑動(dòng)方差和標(biāo)準(zhǔn)差,對(duì)數(shù)據(jù)賦以不同權(quán)重的權(quán)重法,基于差值訂正的合成法氣象數(shù)據(jù)進(jìn)行融合。分別將3種方法的融合結(jié)果與安徽氣象局祁門(mén)站觀測(cè)數(shù)據(jù)進(jìn)行比較,對(duì)其進(jìn)行分析和評(píng)估[7-8],并比較3種方法的融合效果,得出結(jié)論。
2 ? ?算法簡(jiǎn)介
2.1 ?主備法
主備法的思想為當(dāng)兩套觀測(cè)數(shù)據(jù)偏差在最大許可范圍之內(nèi),將其中一套儀器作為主站,另一套作為備用站;當(dāng)數(shù)據(jù)差值異常時(shí),利用空間一致性判斷,用對(duì)應(yīng)的數(shù)據(jù)替換異常值。
3 ? ?算法結(jié)果與評(píng)估
本研究使用的數(shù)據(jù)是祁門(mén)雙套站2016年1—5月的數(shù)據(jù),涉及氣溫、地溫、氣壓、蒸發(fā)量等多個(gè)要素,以及同時(shí)期周邊4個(gè)臺(tái)站(休寧站、黟縣站、歙縣站、屯溪站)的氣象數(shù)據(jù)資料,和祁門(mén)站的人工檢測(cè)氣象數(shù)據(jù),如表1所示。
圖1—5為3種算法5種方法,合成法的融合結(jié)果、以A為主站的融合結(jié)果、以B為主站的融合結(jié)果、基于滑動(dòng)方差的融合結(jié)果、基于滑動(dòng)標(biāo)準(zhǔn)差的融合結(jié)果與觀測(cè)值的差值的比較。
由圖1和圖2可以直觀地看出,主備法差值的波動(dòng)程度最大,由算法公式可以看出,主備法的精確度為0.10,合成法的精確度為0.05,而權(quán)重法的精確度最高。所以并不能從超差率就斷言哪個(gè)算法最好。主備法的超差率最小的原因在于A,B兩站的觀測(cè)數(shù)據(jù)相差較小,在±0.4內(nèi),A,B兩站與本站觀測(cè)數(shù)據(jù)相差較大,若A數(shù)據(jù)與觀測(cè)值相差0.4,B數(shù)據(jù)與觀測(cè)值相差0.6,從算法角度而言,以A為主站的主備法融合差值為0.4,權(quán)重法的融合差值在0.4~0.6,而合成法差值為0.5,導(dǎo)致了權(quán)重法及合成法的超差率較主備法大。但論精度權(quán)重法最好,合成法次之,主備法最差。因此,如果A,B站與觀測(cè)值之間相差不大,權(quán)重法的融合效果最好。
由算法可知,主備法的優(yōu)勢(shì)在于利用了空間一致性。在發(fā)現(xiàn)原始數(shù)據(jù)出現(xiàn)較大異常的情況下,單單將缺測(cè)一方用另一方的數(shù)據(jù)來(lái)填補(bǔ)并不夠,還必須對(duì)其進(jìn)行數(shù)據(jù)是否差異過(guò)大進(jìn)行判斷[9]。當(dāng)選出差異過(guò)大的數(shù)據(jù)后,則應(yīng)找到一個(gè)標(biāo)準(zhǔn)來(lái)衡量是因?yàn)槟囊环降臄?shù)據(jù)異常,才導(dǎo)致了兩組數(shù)據(jù)差值過(guò)大的情況發(fā)生[10-11]。此時(shí),選擇1~2個(gè)與自動(dòng)站無(wú)關(guān)的數(shù)據(jù)作為標(biāo)準(zhǔn),顯然比直接選取A站或B站本身作為標(biāo)準(zhǔn)要合理。本研究選擇了與自動(dòng)站數(shù)據(jù)相獨(dú)立的周邊站臺(tái)數(shù)據(jù)作為衡量的標(biāo)準(zhǔn),擺脫了自動(dòng)站數(shù)據(jù)本身的影響。利用空間的均勻性加權(quán)得到的與自動(dòng)站所在位置的氣象數(shù)據(jù)相接近。選擇該數(shù)據(jù)作為處理異常數(shù)據(jù)的標(biāo)準(zhǔn),可以合理地找到異常的一方,即與標(biāo)準(zhǔn)數(shù)據(jù)差異較大的一方。再將標(biāo)準(zhǔn)數(shù)據(jù)替換掉異常的數(shù)據(jù),使得處理之后的數(shù)據(jù)與真實(shí)的數(shù)據(jù)值較為接近,且兩組數(shù)據(jù)的差異較小,有助于融合出更貼近真實(shí)值的數(shù)據(jù)[12]。
權(quán)重法的優(yōu)勢(shì)在于不僅利用主備法中的空間一致性對(duì)數(shù)據(jù)進(jìn)行了預(yù)處理,并且在數(shù)據(jù)融合的整個(gè)過(guò)程中,沒(méi)有采取傳統(tǒng)的對(duì)整個(gè)樣本求方差、標(biāo)準(zhǔn)差的方法,而是采用了只選取該點(diǎn)數(shù)據(jù)附近一定數(shù)量的數(shù)據(jù)作為計(jì)算樣本進(jìn)行運(yùn)算,將其稱之為滑動(dòng)方差、標(biāo)準(zhǔn)差。本文將滑動(dòng)長(zhǎng)度定為20,考慮到氣象數(shù)據(jù)會(huì)隨著時(shí)間的往后推移,呈現(xiàn)出較大的變化,或者出現(xiàn)周期性特征會(huì)對(duì)數(shù)據(jù)的方差、標(biāo)準(zhǔn)差產(chǎn)生影響,從而影響對(duì)于A,B自動(dòng)站本身觀測(cè)數(shù)據(jù)穩(wěn)定性的判斷,將方差的計(jì)算樣本控制在20以內(nèi),可以有效消除這種影響。
合成法的優(yōu)勢(shì)在于當(dāng)A,B站觀測(cè)數(shù)據(jù)在0.4之內(nèi)時(shí),將普遍意義上更接近于真值的均值當(dāng)作融合數(shù)據(jù);當(dāng)A,B站差值超出誤差允許范圍時(shí),將此時(shí)數(shù)據(jù)與前面4個(gè)時(shí)次的差值相比較,得出跟接近于真值的融合數(shù)據(jù)。
4 ? ?結(jié)語(yǔ)
本研究利用安徽氣象局祁門(mén)站的由A,B兩套儀器測(cè)得的氣溫觀測(cè)數(shù)據(jù),對(duì)主備法、權(quán)重法和合成法進(jìn)行分析和評(píng)估。結(jié)果表明,基于空間一致性的主備法,基于數(shù)據(jù)的滑動(dòng)方差和標(biāo)準(zhǔn)差、對(duì)數(shù)據(jù)賦以不同的權(quán)重的權(quán)重法,基于差值訂正的合成法這3種算法都是合理、可行的。三者的精確度不同,主備法的精確度為0.1,合成法的精確度為0.05,權(quán)重法的精確度最高。在不同的數(shù)據(jù)條件下三者的融合效果也不同,若在A,B站觀測(cè)值相近但與本站觀測(cè)數(shù)據(jù)相差較大的情況下,主備法的融合效果更佳;若在A,B站觀測(cè)值相近且與本站觀測(cè)值也相近的條件下,權(quán)重法的融合效果更好。
總的來(lái)說(shuō),雙套站的自動(dòng)觀測(cè)方法可以在很大程度上解決單套運(yùn)行的自動(dòng)站由于設(shè)備故障、環(huán)境因素所造成的觀測(cè)數(shù)據(jù)異常以及缺乏同時(shí)期、同要素?cái)?shù)據(jù)的對(duì)比問(wèn)題,大大提高了觀測(cè)氣象要素的準(zhǔn)確度。
[參考文獻(xiàn)]
[1]華連生,華洋,徐光清,等.“雙套站”氣溫模擬評(píng)估[C].廈門(mén):第28屆中國(guó)氣象學(xué)會(huì)年會(huì),2011.
[2]溫華洋,徐光清,華連生,等.“雙套站”數(shù)據(jù)處理方法探索[C].廈門(mén):第28屆中國(guó)氣象學(xué)會(huì)年會(huì)—S1第四屆氣象綜合探測(cè)技術(shù)研討會(huì),2011.
[3]唐為安,吳必文,徐光清,等.安徽國(guó)家基準(zhǔn)氣候站自動(dòng)與人工氣溫對(duì)比分析[C].杭州:第26屆中國(guó)氣象學(xué)會(huì)年會(huì)第三屆氣象綜合探測(cè)技術(shù)研討會(huì)分會(huì)場(chǎng),2009.
[4]溫華陽(yáng),徐光清,張虎,等.雙套自動(dòng)氣象站數(shù)據(jù)評(píng)估及其優(yōu)勢(shì)探討[J].應(yīng)用氣象學(xué)報(bào),2012(6):748-754.
[5]李艷萍.地理信息系統(tǒng)與氣象的融合應(yīng)用[J].廣西氣象,2004(S1):72-74.
[6]汪冬華.多元統(tǒng)計(jì)分析與SPSS應(yīng)用[M].上海:華東理工大學(xué)出版社,2010.
[7]盛驟,謝世千,潘乘毅.概率論與數(shù)理統(tǒng)計(jì)[M].北京:高等教育出版社,2008.
[8]鄭明,陳子毅,汪嘉岡.數(shù)理統(tǒng)計(jì)講義[M].上海:復(fù)旦大學(xué)出版社,2006.
[9]邱聲春.數(shù)據(jù)挖掘和數(shù)據(jù)融合技術(shù)在天氣預(yù)報(bào)和氣象服務(wù)中的應(yīng)用研究[J].山西氣象,2007(2):34-36.
[10]楊華,林卉.數(shù)據(jù)融合的研究綜述[J].礦山測(cè)量,2005(3):24-28.
[11]楊明,馮徑.氣象多數(shù)據(jù)源數(shù)據(jù)融合模型研究[J].計(jì)算機(jī)與現(xiàn)代化,2005(3):13-14.
[12]石陽(yáng),劉東華,邱宗旭,等.智能專業(yè)氣象信息融合與服務(wù)系統(tǒng)初步探討[J].廣東氣象,2012(6):51-54.
Abstract:The records of meteorological data were obtained by manual observation and recording in the early stage. With the improvement of computer technology and automation level, the meteorological data of some meteorological observation stations gradually began to use instruments to record meteorological observation data automatically. Based on the temperature observation data measured by A and B two sets of instruments in Qimen station of Anhui Meteorological Bureau, this paper proposes three fusion data algorithms after effective preprocessing of the data. One is the main-standby method based on spatial consistency, the other is the sliding variance and standard based on data ?difference, the weighting method with different weights on the data, and the third is the synthesis method based on the difference correction. The three algorithms are analyzed and evaluated and the fusion effect of the three methods is compared. The results show that the three algorithms are reasonable, and the fusion value can basically reflect the real situation.
Key words:meteorological; sliding variance; spatial consistency; data fusion