劉志剛 吳東麗 邵長亮 吳麗俠 胡樹貞 宋樹禮
(1.秦皇島市氣象局,河北 秦皇島066000;2.中國氣象局氣象探測中心,北京100081;3.莒縣氣象局,山東 莒縣276500)
中國氣象局定義凍土是指含有水分的土壤因溫度下降到0℃或以下而呈凍結的狀態(tài)[1]。凍土自動觀測儀(以下簡稱“觀測儀”)是根據含有水分土壤的凍融特性,通過測量水的相態(tài)、土壤頻域反射[2]或溫度判識等方法,利用閾值判斷測量土壤凍結層次和深度的儀器(中國氣象局綜合觀測司,《凍土自動觀測規(guī)范》,2019)。2020年4月1日全國地面氣象觀測自動化改革業(yè)務正式運行,凍土自動觀測儀作為凍土自動化觀測設備在業(yè)務中應用。國內主要采用電阻法、電容法[3-4]、測溫法、射線法、時域反射法和紅外遙感法等觀測方法,但目前氣象業(yè)務中缺少統(tǒng)一的凍土自動觀測分鐘數據質量控制閾值參數[5-7]。氣象自動化觀測于21世紀初開始全面展開,各種地面氣象數據質量控制方法也在氣象業(yè)務、科研和服務中應用。周建華[8]研究了單站質量控制方法,依據氣溫與相對濕度之間相關性高的特點,提出了一種基于GEP算法的地面逐時氣溫資料質量控制方法,實現了相對濕度對氣溫的質量控制。前人在自動氣象站的實時資料數據質量控制方面做了較多研究,結合計算機程序化特點,設計了氣象自動站業(yè)務軟件[9-12],并對全球地面氣象預報的歷史資料和1971—2000年全國700多個基準站基本站月氣候數據進行了質量驗證[13-15]。廖捷和熊安元[16]針對中國飛機觀測的氣象歷史數據做了質量控制。國外在氣象數據評估和質量控制方面早于國內,也取得較多成果[17-21]。本文利用遼寧喀左國家氣象觀測站(以下簡稱喀左站)、遼陽國家氣象觀測站(以下簡稱遼陽站)和內蒙古自治區(qū)滿洲里國家基準氣候站(以下簡稱滿洲里站)凍土自動觀測外場試驗的數據資料,以喀左站、遼陽站和滿洲里站的人工定時對比觀測數據為參考,采用縱橫極值集合法,探討凍土分鐘數據時間一致性質量控制參數變化取值范圍[22],為開展凍土自動觀測業(yè)務的數據質量控制提供參考。
按照氣象觀測專用技術裝備測試方法要求(中國氣象局綜合觀測司,《氣象觀測專用技術裝備測試方法 總則(修訂)》,2017),考慮不同氣候區(qū)及最大凍土深度,選擇喀左站(41°7′N,119°46′E)、遼陽站(41°14′N,123°10′E)和滿洲里站(49°34′N,117°19′E)(圖1),3站近30 a最大凍土深度分別為116 cm、100 cm和367 cm(中國氣象局綜合觀測司,《綜合觀測司關于發(fā)布國家級氣象觀測站名錄》,2020)。安裝4組觀測儀及TB1-1型[23]人工觀測凍土器(其中滿洲里2組),在安裝布局時考慮傳感器測量相互之間不受影響,5種觀測儀以TB1-1型凍土器為圓心,等半徑(50 cm)呈圓形排列安裝。
圖1 實驗站點分布Fig.1 Distribution of observation sites
2019年2—3月在3個試驗站安裝了4組觀測儀,采集包括電阻和測溫2種不同測量原理5種型號的試驗資料和TB1-1型人工對比觀測資料(表1)。電阻式測量是利用水的相態(tài)發(fā)生改變時體積、電阻等物理特性隨之變化的原理,通過非純凈水做感應介質,測量相關物理量得到凍結層次和上下限深度,該原理利用水相變時阻值突變的原理,與TB1-1型凍土器測量原理相同。測溫式測量是根據水凝結成冰或冰融化成水的溫度變化特性,結合凍點確定算法,獲得凍結層次和上下限深度,該原理是采用溫度要素測量冰點的方式判斷土壤凍結深度[24]。
表1 2019年喀左站、遼陽站和滿洲里站觀測儀與人工試驗數據表Table 1 Automatic and manual data table at Kazuo station,Liaoyang station,and M anzhouli station in 2019
對所收集的數據進行數據完整性和層次一致性分析,應用縱橫極值集合法計算凍土分鐘數據變化值,最后進行時間一致性質量控制[25],并確定相關的閾值參數。本文采用Delphi 7.01、Python 3.7和M icrosoft Excel 2013軟件進行數據讀取與處理分析。
1.2.1 凍土分鐘界限值檢查及數據完整性
根據氣象部門業(yè)務要求,凍土自動觀測儀在設備端已經對凍土觀測的瞬時值進行了界限值檢查,檢查瞬時值是否在傳感器的測量范圍內,如果未通過檢查,則該值不能用于進一步計算?!罢_”瞬時值的判斷條件為上限0 cm,下限450 cm(中國氣象局綜合觀測司,《凍土自動觀測儀功能規(guī)格需求書》,2018)。然而在實際觀測過程中,凍土傳感器長度往往達不到450 cm,因此下限應取凍土傳感器實際長度。
試驗中數據缺測的原因包括未通過界限值檢查和外界異常干擾,以分鐘數據為完整性分析單元,對缺測數據進行統(tǒng)計,計算觀測儀分鐘數據的缺測率,即:
式(1)中,M為試驗期內觀測儀累計缺測分鐘次數;N為應觀測總分鐘次數。
1.2.2 凍土層次一致性
采用每天08時、14時、20時人工定時觀測凍土數據為參考標準[26],4組TB1-1型凍土器共觀測到505組定時凍土數據,變化次數為1168次;觀測到凍土數據1224578 min,采集到各層變化次數3094502次(表1)。由凍土平均層次分析可知,A組中人工觀測平均1.16層,觀測儀平均凍土層數1.65層;B組中人工觀測平均1.19層,觀測儀平均凍土層數1.42層;C組中人工觀測平均1.14層,觀測儀平均凍土層數1.15層;D組中人工觀測平均1.16層,觀測儀平均凍土層數1.24層;C組和D組與人工觀測最接近,A組中A4和A5設備相差略大,由設備自身閾值設置導致。總體人工觀測平均凍土層數1.16層,觀測儀平均1.36層,自動與人工一致,觀測結果符合業(yè)務凍土分布特性[27]。
1.2.3 縱橫極值集合法計算凍土分鐘數據
凍土是氣象觀測要素中唯一包含上下限值和不定層數的觀測要素,根據其要素特點,凍土自動觀測分鐘數據變化包含橫向分鐘對應層次變化和縱向自身層高變化兩種情況。橫向對應層次變化是指前后2 min采集的凍土數據,各層凍土的上下限對應變化;縱向自身層高變化是指相鄰2 min采集的凍土數據,對應自身層次深度的高度變化,縱向與橫向變化最大值作為凍土自動觀測分鐘數據變化值,見圖2。
圖2 相鄰兩分鐘凍土觀測數據變化對比示意Fig.2 Sketch map of comparison of frozen soil observation between adjacent two m inutes
縱橫極值集合法計算變化值見下式:
式(2)中,Δτi為第i個變化值;xi為橫向初始分鐘狀態(tài)第i個層次值;yi為當前分鐘狀態(tài)對應第i個層次值;zi為縱向自身第i個層次深度的變化值;當橫向變化融化消失或新生凍結層時|xi-yi|按0 cm處理。
1.2.4 凍土分鐘數據時間一致性質量控制
依據縱橫極值集合法,確定凍土逐分鐘的每一層凍土變化值,與人工對比觀測對應層變化值作比較,生成層對比變化時間一致性質量控制參數序列,見下式:
式(3)中,fi為第i層凍土分鐘數據時間一致性質量控制參數(以下簡稱“質控參數”),其大小可表示變化Δτi值的質量狀況,Δτi引用式(2),顯然|fi|越大,Δτi越可疑,甚至為異常數據;Ri為當前分鐘所在兩次定時內人工觀測第i層凍土變化值。當Ri=0時,只記錄Δτi不計算fi值,Ri≠0時,根據剔除異常值統(tǒng)計學原理,將質控參數|fi|≥3的數據標注為奇異值(即錯誤數據),|fi|≤1標識數據正確,1>|fi|>3標識數據可疑[6]。上述基于線性回歸數據評估方法來計算數據的質控參數值,以判斷數據質量的檢查算法,稱為線性回歸質量檢查算法。
由式(1)計算和表1可知,2019年喀左站、遼陽站和滿洲里站20套觀測儀共計運行2923200 m in,實際采集到數據2911165 min,數據缺測率為0.41%。其中,A 組觀測儀數據缺測率最高為0.70%,D 組最低為0.10%,B組和C組分別為0.46%和0.34%;ZY4100型號觀測儀完整性最好,平均缺測率為0.00%,XLX1型號完整性略差,平均缺測率為0.70%,DOD1型號平均缺測率為0.22%,DTD1型號平均缺測率為0.47%,HY-DT1型號平均缺測率為0.67%。全部觀測儀完整性較好,均滿足氣象部門資料缺測率不大于2%的要求(中國氣象局綜合觀測司,《凍土自動觀測儀功能規(guī)格需求書》,2018)。
由式(2)可得,圖2中第一層38—43 cm經過1 min變化后全部融化,即縱向融化變化均取5 cm,橫向無對比參考值故按0 cm處理;初始第二層和第三層1 min后兩層凍結合并為當前分鐘的第一層,縱向26—29 cm層凍結消失,故均取3 cm,橫向上限由22 cm 變?yōu)?3 cm 融化1 cm,下限33 cm 變?yōu)?4 cm,凍結1 cm,同一層凍土數據變化既包含橫向又包含縱向變化時,取變化大值作為變化范圍計算值,因此計算變化量時取縱向變化3 cm;初始第四層變化為當前第二層,上限對應無變化取0 cm,下限凍結4 cm,即橫向和縱向均變化4 cm;初始第五層變成當前第三層,狀態(tài)無變化,因此對應變化量均為0 cm。按照此方法統(tǒng)計A、B、C、D四組觀測儀設備3094502次變化幅度及人工觀測1168次變化幅度出現次數及比例情況見表2。
由表2可知,凍土自動觀測數據變化集中在0—4 cm,占總數的99.99%以上,大于4 cm的變化不足0.01%,其中5—10 cm變化占0.0051%,大于10 cm變化占0.0029%;人工凍土對比數據6 h最大變化14 cm 出現3次,次大變化12 cm 出現8次,0—10 cm變化占98.63%。
表2 2019年喀左站、遼陽站和滿洲里站凍土觀測儀與人工觀測凍土數據變化幅度與出現次數統(tǒng)計Table 2 Comparisons of variable am plitude and frequency between automatic and manual observations of frozen soil at Kazuo station,Liaoyang station,and Manzhouli station in 2019
2.2.1 質控參數閾值
凍土分鐘變化幅度與觀測點的土壤、地理位置等多因素有關。質控參數是凍土數據質量好壞的決定性參數,控制參數值過小會引起大量真實數據剔除,造成數據失去連續(xù)性,過大則會將錯誤數據引入氣象大數據平臺,影響區(qū)域氣候分析和專業(yè)氣象服務效果。依據2019年喀左站、遼陽站和滿洲里站凍土數據的變化幅度和凍土分鐘數據完整性情況統(tǒng)計,對分鐘數據應用式(3)逐條進行驗證,得出5種型號的變化幅度及異常值次數分布統(tǒng)計見表3。
表3結果表明,3094502個變化數據中,0—4 cm變化數據正確,5—10 cm變化157次中存在67次奇異值的錯誤變化占42.7%,52次變化為可疑(無法確定正確或錯誤)占33.1%,38次變化為正確,占24.2%,大于10 cm的89次100%為錯誤變化。根據數據時間一致性檢查結果,采用人工復核對全部錯誤變化數據進行分析歸納,分為突變野值、鋸齒跳變和其他錯誤數據三種情況,見圖3。
表3 2019年喀左站、遼陽站和滿洲里站凍土觀測分鐘變化幅度及異常值統(tǒng)計Table 3 Statistics ofm inutely change of amp litude and abnormal value of frozen soil observation data at Kazuo station,Liaoyang station,and M anzhouli station in 2019
觀測過程中部分數據變化雖然超過4 cm,如圖3a中第3—4 min,但是從數據的前后一段時間內變化與人工觀測值對比分析看,變化符合規(guī)律,正確變化范圍0—10 cm在試驗中均出現過,見表4示例1。圖3a中第10—11min和圖3b中第21min、41min為突變野值,這種凍土深度數據或變化量突變主要表現為一段時間較穩(wěn)定,突然出現1 min變化較大數據,由于0—4 cm變化全部正確,因此跳變數據大于4 cm認為數據異常。此類數據在試驗中出現33次,跳變范圍5—62 cm,見表4示例2和示例3。圖3a中第20—29 m in為鋸齒跳變,此類數據主要表現為一段較短時間內數據震蕩跳變多次,無固定規(guī)律,跳變幅度超過4 cm,在試驗中出現52次,見表4示例4。其他異常數據,包括數據前后變化無對應層次關系等, 試驗中出現71次,見表4示例5。
圖3 2019年喀左站、遼陽站和滿洲里站凍土分鐘變化量(a)和深度變化(b)Fig.3 M inute change curve of frozen soil in variation quantity(a)and in-depth(b)at Kazuo station,Liaoyang station,and M anzhouli station in 2019
表4 2019年喀左站、遼陽站和滿洲里站凍土分鐘數據變化量示例Table 4 Exam ples of variation of frozen soilm inute data at Kazuo station,Liaoyang station,and M anzhouli station in 2019
出現異常數據的原因主要是觀測儀采集算法與分鐘數據處理方法缺陷、計算機對觀測儀校對時造成數據采集中斷、沖擊電壓等外界信號干擾影響等因素造成,試驗后期采取優(yōu)化采集算法、調整數據處理方法和加裝UPS穩(wěn)壓電源等措施后錯誤數據顯著減少。
2.2.2 數據質量
應用2019年喀左站、遼陽站和滿洲里站3個試驗站的數據進行了數值試驗,對凍土分鐘數據異??梢蔀? cm和異常閾值為11 cm及時間一致性質量控制和縱橫極值集合法進行驗證,所選時間段為設備在試驗站安裝完畢,數據穩(wěn)定采集48 h之后5 d的凍土分鐘數據,數據驗證基本情況見表5。由表5可知,5 d內102778個變化數據中,102742個變化數據正確,5—10 cm變化21次中存在8次異常值的錯誤變化占38.1%,大于10 cm的15次變化100%為錯誤,該結果與表3統(tǒng)計一致,表明該閾值和方法準確、合理有效。
表5 2019年喀左站、遼陽站和滿洲里站觀測儀分鐘數據質量控制情況Table 5 Quality control of observed m inute data from instrument in frozen soil at Kazuo station,Liaoyang station,and M anzhouli station in 2019
(1)2019年喀左站、遼陽站和滿洲里站觀測儀分鐘數據完整性較好,數據缺測率為0.41%,數據完整率為99.59%,滿足氣象部門資料完整性要求,從而也能反映出設備可靠性較好。3個外場試驗站的觀測儀平均凍土層數1.36層,與人工觀測平均1.16層基本吻合,同時也符合凍土業(yè)務數據分布特點,自動化后凍土層次與原人工觀測有較好的連續(xù)性。
(2)3個外場凍土分鐘數據對比同期人工觀測凍土數據,確定凍土自動觀測分鐘數據質量控制的變化量范圍為0—4 cm,異??梢蓴祿淖兓糠秶鸀?—10 cm,異常數據的變化量范圍為>10 cm。觀測表明,該5種類型觀測儀能較好地反演出不同氣候區(qū)域的凍土分鐘數據時間一致性變化特征[28],凍土自動觀測分鐘數據變化范圍可以作為凍土時間一致性質量控制指標。
(3)觀測數據中變化量范圍為0—4 cm包含了99.99%的數據,但大于4 cm變化中出現156次分鐘異常數據,主要原因是設備采集算法、數據處理方法和受到外界干擾等因素造成,觀測后期應用優(yōu)化采集算法、調整數據處理方法等措施,顯著降低了錯誤數據來源,提高了分鐘數據質量。
(4)凍土觀測在氣象服務中作用較為重要,在中國全國開展平行觀測后,當分鐘數據足夠多時,建議開展“一站一評估”,對凍土自動觀測采集算法及數據內部一致性、空間一致性等其他質量控制方法進一步研究,全面提升凍土數據質量控制的準確性。