摘 "要:自動氣象站具有臺站分布密集,數據采集、傳輸完全自動化、資料實時強等特點,其觀測資料在預警預報、氣候分析、防災減災等方面都有重要作用。但是受各種主客觀條件的限制,自動站數據存在較多失真現象,沒有經過質控的自動站數據,使用范圍和價值都受到限制。對自動站數據進行質量控制,確保資料的代表性和準確性,是當前氣象業(yè)務工作迫切需要解決的技術難題。衡陽自動站數據質量控制系統(tǒng)(以下簡稱HY-AWSQC)的設計與實現,是為解決自動站數據失真問題,所做的有益嘗試和探索。系統(tǒng)運用氣候界限值檢查、時間連續(xù)性檢查、內部一致性檢查和空間一致性檢查,4種國內外有代表性的數據質控技術,實現對衡陽自動站數據的質量控制。
關鍵詞:自動氣象站(AWS);數據;質量控制;HY-AWSQC;衡陽;設計
中圖分類號:P415.1+2 " " "文獻標志碼:A " " " " "文章編號:2095-2945(2024)20-0013-04
Abstract: Automatic weather station (AWS) has the characteristics of dense distribution of stations, complete automation of data acquisition and transmission, strong real-time data and so on. Its observation data play an important role in early warning and forecasting, climate analysis, disaster prevention and reduction and so on. However, due to the limitations of a variety of subjective and objective conditions, there are many distortions in the automatic station data, and the application scope and value of the automatic station data without quality control are limited. The quality control of automatic station data to ensure the representativeness and accuracy of the data is an urgent technical problem to be solved in the current meteorological work. The design and implementation of Hengyang Automatic Weather Station data quality control system (hereinafter referred to as HY-AWSQC) is a beneficial attempt and exploration to solve the problem of automatic station data distortion. The system uses climate limit value check, time continuity check, internal consistency check and spatial consistency check, and four representative data quality control technologies at home and abroad to realize the data quality control of Hengyang automatic station.
Keywords: automatic weather station (AWS); data; quality control; HY-AWSQC; Hengyang; design
自動氣象站(英文縮寫AWS)是指能自動采集和傳遞氣象數據的觀測裝置,觀測項目通常為氣壓、氣溫、風向和雨量等常規(guī)氣象要素,經擴充后還可測量其他要素。根據中小尺度災害性天氣監(jiān)測、預警預報服務、當地經濟社會發(fā)展需要而加密建設的區(qū)域自動氣象站,大幅提升了空間密度和觀測頻次,在精密監(jiān)測、精準預警、防汛救災等方面發(fā)揮了重要作用[1]。但是數量眾多、型號不同的各類自動站,受安裝環(huán)境、設備質量、保障能力等主客觀條件的限制,觀測數據質量相比國家地面站有很大差距,可疑甚至錯誤數據較多,在一定程度上影響了數據的使用。為提高自動站數據的準確性與可用性,各地氣象部門都開展了自動站數據質量控制方法的探索和研究。
地處湖南省中南部、湘江中游的衡陽市,總面積1.53萬km2,轄5區(qū)、2市(縣級市)、5縣,常住人口657.74萬人(2022年),是湖南省域副中心城市。目前,衡陽已建成各類自動氣象站289個(區(qū)域站222個),實現全市鄉(xiāng)鎮(zhèn)全覆蓋,在氣象防災減災中作用顯著,社會與經濟效益明顯。但是觀測數據失真情況的存在,對決策和公眾氣象服務造成一定被動??蒲腥藛T在氣候論證、課題開發(fā)中,對自動(區(qū)域)氣象站歷史資料的使用非常慎重,擔心疑誤數據使研究結論產生偏差。為解決長期困擾的自動氣象站數據失真難題,提升數據的使用范圍和價值,衡陽氣象科研人員,設計研發(fā)了自動氣象站數據質量控制系統(tǒng)(以下簡稱HY-AWSQC),經過質控后的自動氣象站數據,準確性與可用性都有了明顯提高。
1 "系統(tǒng)設計與架構
1.1 "質量控制(QC)的實施對象
HY-AWSQC系統(tǒng)質控的范圍包括國家自動氣象站、區(qū)域自動氣象站和交通氣象站、農田氣候站等各類自動氣象站,質控要素為降水、溫度、氣壓、濕度、風速和風向6個。質控對象為自動氣象站正點實時觀測的逐小時數據。
1.2 "質量控制的研制思路
通過分析AWS原始資料可能存在以下錯誤:觀測數據超過本地區(qū)氣候學界限值、數據在長時間內連續(xù)無變化、小時數據變率過大、正點數據與相應小時內測量的極值不一致和在空間分布上存在明顯異常,如圖1所示,因此必須對AWS數據進行質量甄別檢驗。
1.3 "數據質量控制碼
在HY-AWSQC后臺的質控數據庫中,所有質控要素都帶有質控碼(QC)字段,用于該要素的存儲質控信息。QC代碼分別為0、1、2、8、9,與中國氣象局的標準一致。具體含義見表1。
1.4 "確定本地氣候極值
本地氣候極限(界限值)的確定,是質控系統(tǒng)設計的重要內容。通過對衡陽地區(qū)9個國家地面站,歷史(30 a)逐日氣溫、降水、氣壓和風等要素的統(tǒng)計分析,確定了衡陽日氣溫歷史最高(低)值、降水量、風速極值及氣壓最大(?。┲岛?、3 h氣壓、溫度變差最大值。并將所有極值數據用參數文件保存,便于系統(tǒng)進行氣候極限值檢查調用。區(qū)域站由于建站時間較短,無法統(tǒng)計各站點氣候極值,就統(tǒng)一以衡陽國家站的氣候界限值為標準。衡陽所轄南岳國家基準氣候站(簡稱南岳站)是湖南唯一的高山氣象站,海拔高度為1 280 m,其氣候極值與衡陽其他地面站有較大差異,所以南岳站的氣候極限值需單獨設置(圖2)。
2 "系統(tǒng)質控方法介紹
自動氣象站資料質量控制一般在2個層面開展:一是在觀測臺站進行基本質量控制;二是在省、市級數據處理中心進行。前者只針對單個臺站的觀測資料,后者可以對所有入數據庫的AWS資料進行質控。HY-AWSQC即支持臺站級也支持數據中心級(市級)的數據質控,其參考了國內外各種AWSQC技術方案,根據衡陽地形與氣候特點和資料應用要求,設計研發(fā)了氣候界限值檢查、時間連續(xù)性檢查、內部一致性檢查和空間一致性檢查4種較為成熟的數據質量控制方法。
2.1 "氣候界限值檢查
氣候界限值 (也稱極值)檢查包括氣候學界限值、要素允許值范圍檢查等。氣候學界限值是指從氣候學角度不可能出現的臨界值,氣候極值檢查就是檢查某要素值是否超過歷史最大值和最小值[2]。要素允許值范圍是指氣象要素值允許出現的規(guī)定范圍, 如風向只能是0~360°。氣候界限值檢查是AWS質控最直接也最有效的一個環(huán)節(jié)[3]。氣候極值檢查是HY-AWSQC質控的第一步,凡超出極限值范圍的數據被直接標志為錯誤,不再進行其他質控檢查。
2.2 "時間連續(xù)性檢查
根據氣象要素的自然變化規(guī)律,在相鄰時間段內,要素變化幅度必定在一定范圍內波動。2次觀測要素之間的相關性和間隔的時間長短有密切關系。HY-AWSQC的時間連續(xù)性檢查采用的是小時連續(xù)性和最小變化率檢查,通過檢查要素值是否連續(xù)多個時次無變化或變化太小,進而判斷是否為可疑或錯誤數據。
1)檢查數據連續(xù)多個時次無變化。如當要素數據∈(a1,a2)時,從當前時次開始前推,連續(xù)N1(N2)個及以上時次要素數據相等,則相應數據均判為可疑(錯誤)。
2)當前時次與其前1個時次數據最小變化率檢查(可疑判斷)如下。
衡陽:氣溫為5 ℃/h,氣壓為8 hPa/h,濕度為30%/h。
南岳:氣溫為8 ℃/h,氣壓為10 hPa/h,濕度為40%/h。
2.3 "內部一致性檢查
內部一致性檢查是根據氣象要素之間的邏輯關系, 對同一站點同一時刻觀測資料中的氣象要素進行氣象學相關物理特性對比,檢測它們之間是否存在矛盾現象[4]。內部一致性檢查作為系統(tǒng)質控的輔助方法,用于檢測疑似數據。例如,內部一致性檢查時單一要素在同一觀測時段應有如下邏輯關系, 即最高值大于等于平均值大于等于最低值, 如同一時段的某項要素出現與上述邏輯關系有矛盾的情況, 則判斷為數據中有錯誤數值; 同一時刻相同要素不同項目間的一致性檢查, 如風向和風速的一致性檢查, 風速還應特別注意,如極大風速大于等于最大風速等。
2.4 "空間一致性檢查
空間一致性檢查對于孤立的錯誤數據,是一種比較有效的質控方法。由于在AWS各項氣象要素中,溫度與濕度要素與空間的關聯程度較高,所以空間一致性檢查僅對這2項要素進行。HY-AWSQC的空間一致性檢查主要是采用區(qū)域平均值比較法,即將整個衡陽地區(qū)劃分為北部、中部、南部和南岳高山4個空間區(qū)域,以劃分的4個空間區(qū)域為界線,對本區(qū)域內同一時次內的溫度和濕度分別求平均值,然后再將站點觀測數據與平均值進行比較,小于或等于平均值的數據則為正常數據,大于平均值的數據則判斷為錯誤或可疑數據。
3 "系統(tǒng)特點與功能
衡陽自動氣象站數據質量控制系統(tǒng)(HY-AWSQC),由界限值設置、系統(tǒng)參數、報文入庫接口、自動質控和人工交互5個子模塊組成,允許選擇自動質控和人工訂正2種方式,實現對AWS數據的質量控制。其工作流程為:首先將需要質控的自動氣象站資料(省局天擎平臺下載、臺站自動站原始數據),通過系統(tǒng)的數據入庫接口導入到數據庫原始資料表中,然后對其中的降水、溫度、氣壓等6個常規(guī)觀測要素,即可使用氣候界限值檢查、時間連續(xù)性檢查等單一方法,或者綜合運用4種方法,對自動站原始數據進行質控,最后將數據檢查結果以質控碼形式標注在質控數據表中(圖3)。下面介紹HY-AWSQC系統(tǒng)各個模塊的主要功能。
3.1 "界限值與質控設置模塊
HY-AWSQC系統(tǒng)的界限值與質控設置模塊能分別顯示和修改南岳高山和衡陽自動氣象站的氣候學界限值(最大值和最小值)、小時時間變率值(最大值)等界限值標準數值。同時,在該模塊還允許用戶根據使用需要選擇一種或多種質控方法,上述界限值標準和質控參數信息都被保存在系統(tǒng)的參數配置文件中。
3.2 "系統(tǒng)參數配置模塊
該模塊用于設置連接需要進行質控的原始資料數據庫,數據庫連接參數只需在系統(tǒng)第一次運行時進行設置,連接成功后選擇“保存配置”按鈕后,HY-AWSQC將質控數據庫連接參數保存到系統(tǒng)參數文件中。系統(tǒng)再次運行自動讀取參數信息,只要沒有修改數據庫配置,HY-AWSQC將自動連接質控數據庫。在系統(tǒng)參數模塊中還可以設置“是否啟動自動運行質控”,以及“系統(tǒng)自動運行質控的時間間隔”等配置信息,用戶根據實際使用需要進行設定。
3.3 " AWS數據導入模塊
該模塊是HY-AWSQC能否發(fā)揮作用的基礎和前提,其將從省局天擎平臺或者臺站業(yè)務計算機中獲取的自動氣象站數據,通過該模塊將降水、溫度、氣壓、濕度和風等要素值,導入到質控數據庫中的原始資料表中。
3.4 自動質量控制模塊
自動質控模塊是HY-AWSQC的核心功能模塊,該模塊能根據用戶選擇的資料日期區(qū)間、質量控制方法、質控要素,對數據庫中的原始資料進行數據甄別后,自動判定資料是否正常、錯誤、可疑或者缺測,并根據檢驗結果在數據庫中標注質控碼(QC)。
HY-AWSQC目前支持氣候界限值檢查、時間連續(xù)性檢查、內部一致性檢查和空間一致性檢查4種國內外比較成熟且有代表性的氣象數據質控方法。自動質控模塊通過單獨或綜合使用上述4種質控方法,能夠甄別出AWS原始資料中絕大部分錯誤、可疑或缺測數據,極大提高了AWS數據質控的效率與價值。
3.5 人機交互質控模塊
由于客觀條件和質控方法的限制,系統(tǒng)的自動質控模塊無法100%完成對AWS數據的檢查和甄別。對于自動QC無法判定和鑒別的可疑數據,以及能夠確認的由人為因素或環(huán)境干擾所產生的錯誤數據,HY-AWSQC提供了人機交互質控功能。在該模塊用戶可以選擇某個時間段和某縣(市)的AWS數據,進行人工修改和訂正,修正數據后點“保存”按鈕在存儲數據的同時,將自動為該項要素標注質控碼。人機交互功能增加了HY-AWSQC的質控手段,提高了系統(tǒng)的適用性與靈活性。
4 系統(tǒng)應用情況
HY-AWSQC于2020年完成系統(tǒng)研發(fā),衡陽市局業(yè)務人員和開發(fā)人員對系統(tǒng)進行了全面測試,其間業(yè)務人員使用系統(tǒng)對衡陽所轄國家站、區(qū)域站的實時和歷史資料進行了質量檢驗,對發(fā)現的問題和缺陷進行了修改和完善。HY-AWSQC正式版推出后,在衡陽市局承擔的湖南省局2020年重點科研項目“衡邵干旱監(jiān)測及預警評估技術研究”中進行了應用,主要用于對從天擎平臺下載的衡邵干旱走廊內的衡陽、永州、邵陽和婁底地區(qū)的33個市(縣、區(qū))2010—2022年觀測資料進行數據甄別質控。通過系統(tǒng)質控后的數據,存入了課題設計建立的衡邵干旱風險數據庫中,為課題的衡邵干旱風險區(qū)劃和干旱預警評估技術分析研究提供了可靠、準確的基礎數據。HY-AWSQC為該重點課題的順利實施和驗收結題,以及相關研究論文的發(fā)表起到了重要技術支撐作用。目前,衡陽市局正在研究的其他課題,也需要使用HY-AWSQC對自動氣象站資料進行質控,為課題研究提供準確、可靠的基礎數據。
5 結束語
影響自動氣象站數據質量的因素很多,質控方法必定是一個非常復雜的過程。HY-AWSQC僅僅在這方面做了一個初步的嘗試,特別是質控方法還有很大的改進空間。同時,希望系統(tǒng)能起到拋磚引玉的作用,對省內外類似系統(tǒng)的研發(fā)提供參考和借鑒。
各國氣象部門均高度重視氣象觀測數據的質量,國內外對數據質量控制也做了大量研究,提出了不少有建設性的技術方案[5]。但是自動氣象站數據質量控制技術研究是一項基礎性、系統(tǒng)性、持續(xù)性的工作,目前和今后一個時期都難形成一個通用與標準的方法與模式,只能根據自動氣象站技術發(fā)展和業(yè)務應用需求不斷地改進和提高現有質控方法。
參考文獻:
[1] 段樹海,梁艷芳.自動氣象站實時數據質量控制的研究[J].微計算機信息,2017(4):25-26.
[2] 陶士偉,仲踦芹,徐枝芳.地面自動站資料控制方案及應用[J].高原氣象,2009,28(5):1202-1209.
[3] 李秀英,荀偉唯,李瑞蘇,等.地面自動氣象站風向數據質量控制閾值的判定[J].氣象水文海洋儀器,2022,39(4):91-93.
[4] 封秀燕.地面自動氣象站實時資料自動質量控制[M].北京:氣象出版社,2017.
[5] 吳歡峰,董海濤,楊喆,等.國家級自動站數據監(jiān)控技術的研究與實現[J].數碼設計(上),2020,9(8):32-33.