張茂林,鄧小波,劉海磊,劉夢琪,陳衛(wèi)星
(成都信息工程大學(xué)電子工程學(xué)院,四川成都 610225)
氣溫(Ta)是區(qū)域和全球尺度輻射平衡、能量收支和水循環(huán)研究的關(guān)鍵參數(shù)。氣溫數(shù)據(jù)也是陸面過程建模的重要輸入[1],如地表蒸散發(fā)估算[2]、農(nóng)田監(jiān)測[3]和氣候變化分析[4]。獲取氣溫的傳統(tǒng)方法是在地面站進行測量。然而,測得的氣溫點不能反映大面積的溫度[5]??臻g插值法可將離散空間分布的地面站所測量的氣溫擴展到大面積,其中一個常用的因素是距離[6]。除考慮氣溫變化和距離的空間相關(guān)性外,進一步發(fā)展了先進的插值方法,納入更多的因素,如海拔、緯度和經(jīng)度[7],但空間插值不適用于地面站不足的地區(qū)。
氣候模型已被證明是調(diào)查氣候系統(tǒng)和氣候變化的有效工具,可獲全球范圍的氣候數(shù)據(jù)。近年來,CMIP5(coupled model intercomparison project 5)利用全球氣候模型(GCM)開發(fā)了大量氣候模擬[8]。隨著氣候模式的發(fā)展,已經(jīng)生成可提供長期氣溫的產(chǎn)品,如國家環(huán)境預(yù)測中心和國家大氣研究中心(NCEP/NCAR)已經(jīng)生成了可供用戶使用的再分析數(shù)據(jù)集和ERA5 再分析數(shù)據(jù)集[9-11]。盡管這些GCM 可以捕捉到主要的大尺度環(huán)流特征,但其在區(qū)域氣候模擬中的應(yīng)用研究有限,因為它們的空間分辨率從0.0625°~1°甚至更粗,無法獲得區(qū)域尺度上氣候特征的有用信息[11-12],特別是在地形變化劇烈的山區(qū)[13]。
為滿足局部地區(qū)的應(yīng)用,如何獲得中高空間分辨率的氣溫數(shù)據(jù)已成為關(guān)注的焦點,從全球氣候模型(GCM)做出的大規(guī)模氣候預(yù)測中提取局部或區(qū)域尺度信息的過程稱為縮小尺度,也稱之為降尺度。氣候變化文獻中存在動態(tài)降尺度和統(tǒng)計降尺度兩大類降尺度方法。動態(tài)降尺度方法是建立在區(qū)域氣候模式(regional climate model,RCM)基礎(chǔ)上的,GCM 為RCM 提供初邊值條件,通過高分辨率區(qū)域氣候模式的數(shù)值積分獲得高分辨率天氣氣候信息[14]。RCM 采用數(shù)學(xué)物理方程描述氣候系統(tǒng)內(nèi)部的各種動力和熱力學(xué)過程。隨著地球生物化學(xué)等過程的引入,區(qū)域氣候模式正逐漸向區(qū)域地球系統(tǒng)模式方向發(fā)展,這些模式可以描述大氣—陸地—水—經(jīng)濟等過程之間的相互作用[15-16]。然而,動力降尺度需要大量的計算資源,隨著區(qū)域氣候模式分辨率的提高,計算量呈指數(shù)形式增長。
統(tǒng)計降尺度方法建立在觀測的局地氣候與大尺度場之間的統(tǒng)計關(guān)系基礎(chǔ)上,假定上述統(tǒng)計關(guān)系在未來的氣候情景下仍然適用,從而實現(xiàn)對全球模式未來氣候變化預(yù)估結(jié)果的降尺度。統(tǒng)計降尺度有以下優(yōu)點:能夠以很高的計算效率由大尺度氣象要素得到區(qū)域尺度的氣象要素;能輸出較高分辨率或站點尺度的氣象要素;模型參數(shù)可以受區(qū)域下墊面特征的控制。統(tǒng)計降尺度能夠彌補動力降尺度的一些不足,因而得到廣泛應(yīng)用[17-19]。
統(tǒng)計降尺度已被證明是提高氣溫空間分辨率的有效工具。Schoof 等[20]檢驗了回歸模型和神經(jīng)網(wǎng)絡(luò)模型在氣溫降尺度中的表現(xiàn);通過這兩種模型的簡化,得到了相似的結(jié)果。通過選擇中歐和西歐作為研究區(qū)域,Huth[21]開發(fā)了一種統(tǒng)計方法,通過站點網(wǎng)絡(luò)對每日測量的氣溫進行降尺度處理,引導(dǎo)許多科學(xué)家開始關(guān)注通過降尺度獲取中等空間分辨率的氣溫。Pan[13]利用天氣研究與預(yù)報(weather research and forecasting,WRF)模型生成了一個5 km/1 h的氣溫數(shù)據(jù)集,用于驅(qū)動中國黑河流域的水文模型。Hofer 等[22]利用統(tǒng)計降尺度方法獲得了數(shù)據(jù)稀疏冰川山脈環(huán)境下的氣溫。Jha[23]提出了氣溫降尺度的地質(zhì)統(tǒng)計學(xué)框架。
Ramírez 等[24]分別針對不同的地域,將神經(jīng)網(wǎng)絡(luò)(NN)與線性回歸、CCA 等線性方法用于統(tǒng)計降尺度的對比研究,表明多數(shù)情形下NN 的降尺度能力更好。因此,本研究構(gòu)建一個神經(jīng)網(wǎng)絡(luò)降尺度模型(DS),用于建立臺站觀測氣溫與氣候模式數(shù)據(jù),包括GFS 氣溫數(shù)據(jù)、海拔(ElE)數(shù)據(jù)和歸一化植被指數(shù)(NDVI)數(shù)據(jù)等之間的關(guān)系。然后將該網(wǎng)絡(luò)模型用于高空間分辨率氣溫制圖,并通過大量實驗驗證其有效性和優(yōu)越性。
研究區(qū)域為中國湖南省(108.8 °E~114.2 °E,24.7 °N~30.1 °N)。作為中國的內(nèi)陸省份,湖南擁有復(fù)雜的地理環(huán)境,海拔高度0~2100 m,擁有多種地貌特征,山地占全省總面積的51.22%,丘陵占15.40%,崗地占13.87%,平原占13.11%,水面占6.39%。
臺站數(shù)據(jù)被認(rèn)為是地面氣溫的真值,被用于氣溫估算模型的訓(xùn)練和驗證。使用湖南省2020年的97 個國家級自動氣象站的逐小時地面氣溫數(shù)據(jù)進行研究(http://data.cma.cn)。這些氣溫數(shù)據(jù)經(jīng)過了包括氣候?qū)W界限值、區(qū)域界限值、時間一致性及空間一致性檢查等在內(nèi)的嚴(yán)格質(zhì)量控制,可用率達98.9%[25]。湖南省的海拔和其97 個臺站分布如圖1所示。表1 總結(jié)了主要數(shù)據(jù)的特征,包括數(shù)據(jù)的時空分辨率和來源。
表1 數(shù)據(jù)的時空信息及來源
圖1 研究區(qū)域海拔和氣象臺站位置空間分布圖
美國國家環(huán)境預(yù)測中心(NCEP)運營的GFS 在全球范圍內(nèi)提供0.25°、0.5°和1°網(wǎng)格化氣溫數(shù)據(jù)。網(wǎng)格包括分析和預(yù)測時間步長,0~240 h是預(yù)測時間步長為3 h的網(wǎng)格數(shù)據(jù),240~384 h是預(yù)測時間步長為12 h的網(wǎng)格數(shù)據(jù),模型預(yù)測運行在每天00、06、12 和18UTC進行。
本研究使用2020年分辨率為0.25°的GFS 預(yù)測氣溫。美國國家大氣研究中心(NCAR)的研究數(shù)據(jù)檔案(RDA)擁有NCEP GFS 0.25°全球預(yù)報網(wǎng)格(https://rda.ucar.edu/datasets/)的完整歷史檔案。RDA 提供了一個子集工具,用于通過可自定義的數(shù)據(jù)請求選擇變量、時間和區(qū)域,使其易于下載和使用氣溫預(yù)測。GFS 氣溫預(yù)報是通過https://rda.ucar.edu/datasets/ds084.1 使用可定制的數(shù)據(jù)請求下載的。實時GFS 氣溫預(yù)報可從NOAA NCEP(https://www.nco.ncep.noaa.gov/pmb/products/gfs/)獲得。
為更好地驗證DS 模型的結(jié)果,使用ERA5-Land再分析數(shù)據(jù)進行比較。ERA5-Land 是新一代的再分析和同化數(shù)據(jù),比以前的版本具有更好的時空分辨率和準(zhǔn)確性[26-27]。
ERA5-Land 提供每小時氣溫數(shù)據(jù),網(wǎng)格大小為0.1°×0.1°,通過重播ECMWF ERA5 氣候再分析的土地部分而制作。通過使用物理定律,重新分析將模型數(shù)據(jù)與來自世界各地的觀測結(jié)果組合成一個全球完整且一致的數(shù)據(jù)集。ERA5-Land 數(shù)據(jù)通過https://climate.copernicus.eu/the-climate-data-store 下載。
研究表明,海拔、緯度、NDVI、JD 和小時數(shù)據(jù)等輔助數(shù)據(jù)可以提高氣溫降尺度的精度[28-32]。使用航天飛機雷達地形任務(wù)(SRTM)的高程數(shù)據(jù)集,分辨率為3 弧秒(~90 m)。SRTM3 數(shù)據(jù)從ftp://e0srp01u.ecs.nasa.gov/srtm/version2/SRTM3/下載。
緯度和時間信息取自AGRI 地理位置數(shù)據(jù),并使用中分辨率成像光譜輻射計(MODIS)的16 天植被指數(shù)產(chǎn)品(MOD13Q1)。MOD13Q1 NDVI 產(chǎn)品的空間分辨率為250 m。數(shù)據(jù)來自土地處理分布式活動存檔中心(LP DAAC;https://lpdaac.usgs.gov/)。
目前,一般降尺度方法都是基于大氣溫度垂直遞減率理論(ALR)開展的。垂直遞減率是氣溫通常隨著高度的升高而下降,下降速度約為5~6 ℃/km,一般公式如下:
Ta=T-ALR×(H-H0)
式中,H0是高分辨率的海拔數(shù)據(jù),T是低分辨氣溫,H是低分辨率的海拔數(shù)據(jù),Ta是高分辨率氣溫。但考慮到夏季垂直遞減率更為顯著,對其他季節(jié)的適用性有待進一步驗證。所以選用神經(jīng)網(wǎng)絡(luò)來構(gòu)建氣溫與預(yù)測因子間的映射關(guān)系。神經(jīng)網(wǎng)絡(luò)是由多個神經(jīng)元構(gòu)成的非線性模型,能夠更好地獲取預(yù)測變量和輸出變量的非線性關(guān)系,被廣泛應(yīng)用于氣溫的降尺度。神經(jīng)網(wǎng)絡(luò)能從訓(xùn)練數(shù)據(jù)集中學(xué)習(xí)到不同尺度下海拔(ElE)、NDVI 差異所帶來的氣溫差,從而實現(xiàn)高空間分辨率氣溫模型的構(gòu)建。DS 模型的結(jié)構(gòu)公式:
Ta=f(GFS,ElE,JD,Hour,Lon,Lat,NDVI)
其中f(·)表示DS 模型需要建模的非線性估計函數(shù)。
DS 模型算法可分為3 個部分:數(shù)據(jù)處理、DS 降尺度模型建立以及降尺度結(jié)果的驗證和分析。
數(shù)據(jù)處理。首先,對GFS 數(shù)據(jù)進行雙線性插值處理,將0.25°×0.25°的GFS 數(shù)據(jù)插值為250 m×250 m的網(wǎng)格數(shù)據(jù),再將SRTM 數(shù)據(jù)從90 m重采樣到250 m。空間分辨率為0.25°和250 m的數(shù)據(jù)分別是粗分辨率和細(xì)分辨率中擬合關(guān)系的輸入?yún)?shù)。利用2020年湖南臺站的時空信息采用最近鄰域法去匹配對應(yīng)的GFS、海拔、NDVI 等數(shù)據(jù),得到2020年的數(shù)據(jù)集。經(jīng)過處理后,總共識別出274301 組樣本。根據(jù)臺站隨機劃分,將其中約一半的數(shù)據(jù)用于訓(xùn)練模型,稱為訓(xùn)練集,而另一半數(shù)據(jù)用于驗證模型,稱為驗證集,具體如表2。
表2 訓(xùn)練和驗證數(shù)據(jù)集
模型的建立和應(yīng)用。模型的建立如圖2 紅虛線部分:將訓(xùn)練集數(shù)據(jù)放進神經(jīng)網(wǎng)絡(luò)中進行訓(xùn)練,并用驗證集數(shù)據(jù)去驗證模型的精度,最終得到DS 模型。應(yīng)用部分如圖2 藍實線部分:將實時的數(shù)據(jù)集輸入DS 模型,經(jīng)過模型的輸出,最終得到250 m×250 m的近地面氣溫數(shù)據(jù)。
圖2 算法流程圖
降尺度結(jié)果的驗證和分析。使用相關(guān)系數(shù)(R)、均方根誤差(RMSE)和偏差來評估降尺度模型的準(zhǔn)確性,如下所示:
式中,Ta是降尺度的氣溫,Tsta是氣象站觀測到的氣溫,N是數(shù)據(jù)樣本的總數(shù)。
圖3 為降尺度模型驗證與臺站氣溫的二維直方圖,降尺度的氣溫(DSTa)與臺站觀測氣溫(In-situTa)吻合度較好。DS 的均方誤差為1.54 ℃,相關(guān)系數(shù)為0.982。平均偏差為-0.03 ℃,表明降尺度氣溫整體沒有明顯的高估或低估??偟膩碚f,結(jié)果表明該模型在縮小溫度數(shù)據(jù)方面表現(xiàn)良好。
圖3 DS Ta 與In-situ Ta 的二維直方分布圖
圖4 顯示了模型的Ta降尺度誤差(DS-In-situTa)的垂直分布。DSTa的誤差呈正態(tài)分布,大多數(shù)誤差在±2.5 ℃(>80.92%的樣本)。DSTa誤差小于±1.5 ℃的數(shù)據(jù)點占63.55%。這意味著DS 模型是可行的。
圖4 DS Ta 和In-situ Ta 之間的差異直方圖
為進一步評估該模型在湖南地區(qū)的適用性,本文逐個站點評估了降尺度氣溫的誤差。圖5 為模型的R、RMSE 和Bias 的空間分布圖??偟膩碚f,模型的所有站點都表現(xiàn)較好。R在0.974~0.994,這表明估算氣溫和臺站實測氣溫相關(guān)性較高;RMSE 在1.05 ℃~1.99 ℃,Bias 在±0.5 ℃以內(nèi),表明DS 模型有較高的精度。
圖5 模型的R、RMSE 和Bias 的空間分布圖
DS 的誤差展現(xiàn)了一定的空間分布特征。從圖5可以看出,位于湖南省邊界的臺站展現(xiàn)了較大的RMSE 和較小的R,通過和湖南地形圖比較,發(fā)現(xiàn)這些站點的海拔較高。這種誤差空間分布特征可能是由高海拔地區(qū)通常地形較為復(fù)雜,導(dǎo)致溫度垂直遞減率在空間和時間上有所不同[33]。通常情況下,山區(qū)的垂直遞減率比平原地區(qū)復(fù)雜[34-35]。
表3 給出了兩種數(shù)據(jù)集(GFS 和DS)在不同海拔處的驗證結(jié)果,可以看出,DS 在各個海拔都對GFS 數(shù)據(jù)有著很好的訂正效果。GFS 數(shù)據(jù)在各個海拔上都呈現(xiàn)出明顯的負(fù)偏差,在400~600 m的海拔范圍內(nèi)的Bias 達到了-1.9 ℃,而DSTa的偏差不超過±0.2 ℃。在各個海拔段里,DSTa比GFSTa有著更小的RMSE,且DSTa也比較穩(wěn)定,RMSE 穩(wěn)定在1.48 ℃~1.67 ℃。這意味著DS 能夠很好的處理不同海拔下的氣溫數(shù)據(jù)。
表3 不同高程間隔的GFS 和DS 的誤差分析
作為示例,圖6 為2021年6 天(即DOY 10、69、130、191、253、314)的GFS 原始數(shù)據(jù)、ERA5-Land 和DS 氣溫分布圖。圖6 可以發(fā)現(xiàn),DSTa顯示了更多關(guān)于氣溫的細(xì)節(jié),尤其是在南部和西部有許多山脈,其對應(yīng)位置的氣溫都較低。雖然GFS(0.25°)和ERA5-Land(0.1°)的氣溫可以呈現(xiàn)整個區(qū)域的氣溫空間模式,但粗分辨率不能滿足在局部尺度上繪制氣溫的要求。DSTa(250 m)可以清晰地反映氣溫的空間分布。圖6 表明,降尺度前后和ERA5-Land 的氣溫圖像在尺度上非常相似,包括幅度和空間細(xì)節(jié):中部和東北部因海拔較低而偏暖,而西部和南部因海拔較高而較冷(海拔見圖1)。總的來說,這3 個數(shù)據(jù)集的空間分布和溫度梯度非常相似,都顯示出相似的季節(jié)性氣溫動態(tài)。但DS 空間分辨率高(250 m×250 m),相比于ERA5-Land(0.1°×0.1°)和GFS(0.25°×0.25°)能展現(xiàn)更多的空間細(xì)節(jié)。圖7 為圖6 中6 個時刻的誤差散點分布圖,從圖7 DSTa與GFSTa和ERA5Ta對比發(fā)現(xiàn),DSTa更集中,GFSTa和ERA5Ta較為發(fā)散。DSTa的RMSE 為1.674 ℃,而GFSTa和ERA5Ta的RMSE 為2.867 ℃和2.772 ℃,這表明DS 還能提高GFS 氣溫的精度。
圖6 2021年1、3、5、7、9、11月10日6 UTC 時刻的GFS、ERA5-Land 和DS 氣溫空間分布圖
圖7 6 個時刻的散點對比圖
本研究假設(shè)影響DS 的是地表特征和時間,如海拔和JD?;谏鲜?7 個氣象站的瞬時Ta,通過以下方法對該假設(shè)進行檢驗。以所有輸入的因素為自變量進行網(wǎng)絡(luò)訓(xùn)練模型;測試了可能因素的不同組合,包括案例1:海拔;案例2:海拔和時間;案例3:海拔、時間和緯度;案例4:海拔、時間、緯度和經(jīng)度;案例5:海拔、時間、緯度,經(jīng)度和NDVI。海拔被選為主要因素,因為Ta隨著海拔的升高而降低,尤其是在山區(qū)。緯度和經(jīng)度代表位置和太陽角,時間代表季節(jié)性和白天黑夜,使用NDVI 來參數(shù)化植被覆蓋率。氣溫還受到其他地表特征的影響,如土壤水分和降水[36]。然而,本研究未考慮土壤水分和降水,因為當(dāng)前產(chǎn)品具有粗糙的空間分辨率和時間分辨率[37-38],且無法滿足氣溫的降尺度要求。各個案例的RMSE 如圖8所示,案例1 和2 中的海拔和TIME 解釋了整個研究區(qū)域內(nèi)Ta空間變化的主要內(nèi)容。當(dāng)DS 模型中僅包含海拔和時間時,RMSE 的增量在0.3 ℃~1.4 ℃,因此,海拔和時間可以作為Ta降尺度的主要因素。如Li 等[39]還發(fā)現(xiàn)緯度也會影響Ta的空間變化。但對于97 個臺站而言,緯度、經(jīng)度和NDVI 對氣溫空間變化的貢獻是可忽略的:在案例3、案例4 和案例5 中,RMSE 的最大增量<0.15 ℃。這些不同數(shù)據(jù)集組合的模型精度證實了在模型中融合多源數(shù)據(jù)在氣溫降尺度中實際上是有意義的。另一方面,當(dāng)使用更多數(shù)據(jù)集時,映射結(jié)果將在空間上以更詳細(xì)的信息進行優(yōu)化。
圖8 Ta 與研究區(qū)不同因子線性回歸中的RMSE
在氣候變化、水文、生態(tài)學(xué)等研究中,氣溫是一個重要的參數(shù)。然而,目前氣溫產(chǎn)品的粗空間分辨率已不能滿足相關(guān)研究和應(yīng)用日益增長的需求,如GFS,ERA5 等。本研究以中國湖南省為研究區(qū)域,提出一種將GFS 提供的氣溫數(shù)據(jù)集從粗分辨率(0.25°)降為高分辨率(250 m)的神經(jīng)網(wǎng)絡(luò)降尺度方法。
首先根據(jù)97 個氣象站對DSTa的精度進行評價。結(jié)果表明:從GFS 產(chǎn)品降尺度后,97 個站點的氣溫均方根誤差為1.53 K;與降尺度前的氣溫相比,降尺度后的氣溫與地面實測的氣溫有更好的一致性。此外,從圖像質(zhì)量的角度對DSTa圖像進行評價,整體空間分布情況大致相同,降尺度后的氣溫圖像具有良好的圖像質(zhì)量,能夠清晰地反映山區(qū)氣溫的空間變化。與現(xiàn)有的氣溫降尺度方法相比,本文方法的機理不依賴地面實測數(shù)據(jù),因此,可以更容易地應(yīng)用于大面積地區(qū)。本研究僅使用了國家標(biāo)準(zhǔn)氣象站,未來可以引入更多的區(qū)域氣象站來提高降尺度精度。