徐彬仁, 魏瑗瑗
(1.中國(guó)科學(xué)院遙感與數(shù)字地球研究所,北京 100101; 2.中國(guó)科學(xué)院大學(xué),北京 100049)
水循環(huán)促進(jìn)了自然界的物質(zhì)運(yùn)動(dòng)和能量交換,對(duì)氣候的形成與變化產(chǎn)生了深刻影響。流域降水量是影響流域水循環(huán)最重要的因素。有“亞洲水塔”之稱的青藏高原是亞洲大江大河的發(fā)源地,印度河、恒河、雅魯藏布江、長(zhǎng)江和黃河均源自青藏高原[1-2]。因此,青藏高原的流域的降水資料對(duì)我國(guó)乃至全球的水文、氣象、生態(tài)和農(nóng)業(yè)等領(lǐng)域的發(fā)展具有重要的研究意義。與氣象站點(diǎn)降水資料相比,衛(wèi)星資料空間覆蓋連續(xù),有助于解決研究區(qū)站點(diǎn)數(shù)量不足、分布不均勻的問題。但是,由于探測(cè)平臺(tái)的限制,衛(wèi)星遙感降水產(chǎn)品的分辨率仍然無法滿足流域尺度研究的要求。為進(jìn)一步了解青藏高原流域尺度上降水的時(shí)空分布特征,需要開展青藏高原遙感降水?dāng)?shù)據(jù)的空間降尺度方法的研究。
目前,空間降尺度方法主要有動(dòng)力降尺度和統(tǒng)計(jì)降尺度2種??臻g動(dòng)力降尺度是借助全球環(huán)流模式(global climate models, GCMs)和嵌套區(qū)域氣候模式(regional climate models, RCMs)來提高氣象要素的空間分辨率。該方法不受觀測(cè)資料的影響,但其計(jì)算量大、模型不易構(gòu)造,獲得的氣象要素的空間分辨率不能滿足區(qū)域尺度的要求[4]。統(tǒng)計(jì)降尺度充分考慮到局地氣候不僅以大尺度氣候?yàn)楸尘?,且顧及下墊面特征的影響,利用下墊面特征信息建立大尺度和小尺度氣候變量的聯(lián)系[5]。與空間動(dòng)力降尺度方法相比,統(tǒng)計(jì)降尺度方法構(gòu)造的模型更加靈活多樣,引入較高空間分辨率的區(qū)域下墊面特征變量,能大大提高遙感降水資料的空間分辨率[6]。2009年Immerzeel團(tuán)隊(duì)以歐洲南部伊比利亞半島為例,基于降水與植被的關(guān)系,采用熱帶降水測(cè)量計(jì)劃衛(wèi)星(Tropical Rainfall Measuring Mission, TRMM)降水?dāng)?shù)據(jù)與SPOT -VEGETATION 歸一化植被指數(shù)(normalized difference vegetation index, NDVI)數(shù)據(jù),建立了的指數(shù)回歸降尺度模型,最終將TRMM降水?dāng)?shù)據(jù)降尺度為1 km分辨率?;贗mmerzeel的研究,2011年賈紹鳳研究團(tuán)隊(duì)開展了柴達(dá)木盆地降水降尺度研究,同時(shí)引入了植被數(shù)據(jù)SPOT-VEGETATION NDVI和航天飛機(jī)雷達(dá)地形測(cè)繪任務(wù)地形數(shù)據(jù)(Shuttle Radar Topography Mission,SRTM) 數(shù)字高程模型(digital elevation model,DEM)因子作為流域降水的影響因子,建立了多元線性回歸模型,也得到了1 km空間分辨率的降水?dāng)?shù)據(jù)[8]。與Immerzeel團(tuán)隊(duì)的研究相比,后者引入DEM變量代表地形因子參與建模,并對(duì)降水的降尺度結(jié)果進(jìn)行了誤差分析,進(jìn)一步提高了降水資料的準(zhǔn)確性。此外,非線性時(shí)間序列可以提高降水的預(yù)測(cè)精度[16]。在諸多非參數(shù)統(tǒng)計(jì)回歸模型中,隨機(jī)森林算法在分類和預(yù)測(cè)方面對(duì)自變量的多元共線性不敏感,可以同時(shí)輸入多個(gè)影響因子,在很大程度上解決了過度擬合的問題等。因此,本文基于Immerzeel和賈紹鳳研究團(tuán)隊(duì)的研究和隨機(jī)森林算法的優(yōu)勢(shì),選擇NDVI,DEM,坡度、坡向和經(jīng)緯度信息,針對(duì)青藏高原流域的長(zhǎng)時(shí)間序列TRMM遙感降水?dāng)?shù)據(jù),開展了空間統(tǒng)計(jì)降尺度分析研究。
青藏高原平均海拔4 500 m,整體面積達(dá)250×104km2,是世界上平均海拔最高的地區(qū)。獨(dú)特的地理環(huán)境使其對(duì)亞洲地區(qū)以及世界氣候具有重要的影響[1]。該地區(qū)地面氣象觀測(cè)站點(diǎn)主要集中于東部和南部,極少數(shù)分布在高原西部和北部,存在氣象資料空間分布不勻及稀缺現(xiàn)象。已有站點(diǎn)大多安置于低海拔的交通可抵達(dá)區(qū)域,并且觀測(cè)站測(cè)量的氣象要素受其周圍區(qū)域小氣候影響較大[14]。為彌補(bǔ)青藏高原地區(qū)傳統(tǒng)觀測(cè)數(shù)據(jù)稀缺、受局地氣候影響和空間分布不連續(xù)等不足,本文采用TRMM3B43降水?dāng)?shù)據(jù)開展了青藏高原地區(qū)降水量的空間統(tǒng)計(jì)降尺度研究。
受孟加拉灣暖濕空氣的影響,雅魯藏布江大拐彎區(qū)域年降水十分充沛; 高原的腹地湖泊數(shù)量較多,湖泊集聚區(qū)的降水分布普遍高于周圍地區(qū); 而受喜馬拉雅山體影響,來自印度洋的水汽輸送受到阻擋,喜馬拉雅山北坡的降水明顯少于周圍地區(qū)??傮w而言,青藏高原降水空間分布呈現(xiàn)自東南向西北遞減、自南向北逐漸減少的趨勢(shì)[14]。
TRMM是世界上第一顆搭載測(cè)雨雷達(dá)的衛(wèi)星,攜帶了微波成像儀、可見光和紅外掃描儀[15]。TRMM3B43產(chǎn)品綜合了4類相互獨(dú)立的降水?dāng)?shù)據(jù),包括微波、近紅外等傳感器融合估算數(shù)據(jù),以及美國(guó)國(guó)家海洋、大氣管理局和全球降水氣候中心的降水雨量計(jì)分析數(shù)據(jù)等[14],是衛(wèi)星降水?dāng)?shù)據(jù)與其他降水?dāng)?shù)據(jù)聯(lián)合反演的最佳降水產(chǎn)品。本文選用2000—2012年間空間分辨率為0.25°×0.25°的TRMM3B43日降水產(chǎn)品,對(duì)青藏高原地區(qū)進(jìn)行降水?dāng)?shù)據(jù)降尺度研究,數(shù)據(jù)由中國(guó)氣象科學(xué)數(shù)據(jù)共享服務(wù)網(wǎng)站提供。此外,采用研究區(qū)內(nèi)92個(gè)站點(diǎn)氣象站點(diǎn)在2000—2012年間降水觀測(cè)數(shù)據(jù)作為參照。與站點(diǎn)實(shí)測(cè)降水量相比,TRMM3B43數(shù)據(jù)產(chǎn)品普遍存在高估的現(xiàn)象(圖1)。已有學(xué)者研究發(fā)現(xiàn),利用最小二乘方法建立TRMM3B43與站點(diǎn)降水?dāng)?shù)據(jù)的冪函數(shù)回歸模型,可以取得較好的校準(zhǔn)效果[8]。
圖1 氣象站與TRMM降水?dāng)?shù)據(jù)的回歸分析圖Fig.1 Regression analysis of precipitation data from weather station and TRMM
圖1中,縱坐標(biāo)表示氣象站點(diǎn)年總降水量,橫坐標(biāo)是TRMM年均降水量,冪函數(shù)作為回歸方程時(shí),判斷系數(shù)為0.78,擬合方程為
v=0.92·u0.95,
(1)
式中:v為氣象站年均實(shí)測(cè)降雨量;u為校準(zhǔn)后的TRMM3B43年均降雨量。圖中虛線為y=x線,由此可見經(jīng)校準(zhǔn)模型修正后的數(shù)據(jù)較好地克服了TRMM原始數(shù)據(jù)在研究區(qū)內(nèi)對(duì)降雨量高估的問題。圖2為青藏高原地區(qū)TRMM校準(zhǔn)后的多年平均降水分布情況。
圖2 2001年青藏高原TRMM降水量空間分布圖Fig.2 Spatial distribution of TRMM precipitation in the Tibet Plateau in 2001
圖2表明,青藏高原地區(qū)降水量空間分布極其不均勻,降水量空間分布呈現(xiàn)自東南向西北遞減、自南向北逐漸減少的特點(diǎn)[14]; 局部地區(qū)受其他環(huán)境因子的影響,降水分布較為復(fù)雜。因此,考慮整個(gè)研究區(qū)內(nèi)降水空間分布的整體趨勢(shì)對(duì)模型的影響,本文建立了經(jīng)緯度比值指標(biāo),即
(2)
式中:ll(i,j)表示第i列第j行像元的經(jīng)緯度比;lon(i,j)和lat(i,j)分別表示第i列第j行像元的經(jīng)度和緯度。
已有研究表明,NDVI與其他景觀地理學(xué)屬性,如葉面積指數(shù)[17]、地表溫度[18]、地表蒸散發(fā)[19]等有關(guān),并且這些變量在世界不同區(qū)域均與降水有相關(guān)關(guān)系[11-12,20]。此外,甚高分辨率光譜儀(advanced very high resolution radiometer,AVHRR)的NDVI數(shù)據(jù)的時(shí)空覆蓋范圍廣,與遙感降水產(chǎn)品相比,空間分辨率相對(duì)較高,可以有效地提高降水?dāng)?shù)據(jù)的空間分辨率。本次研究采用美國(guó)國(guó)家航空和宇宙航行局NASA官網(wǎng)提供的AVHRR-NDVI日產(chǎn)品作為降尺度模型的輸入變量。
本文采用最大合成算法(maximum value composite,MVC)計(jì)算每個(gè)像元的月最大值,并計(jì)算每一年12個(gè)月最大NDVI數(shù)據(jù)的年平均值,應(yīng)用最鄰近像元法將8 km分辨率數(shù)據(jù)重采樣為0.25°分辨率。圖3以2001年為例,青藏高原地區(qū)年平均NDVI空間分布,可知植被分布的總體趨勢(shì),與降水量分布的總體趨勢(shì)大致相同。
圖3 2001年青藏高原NOAA-AVHRR NDVI空間分布圖Fig.3 Spatial distribution of NDVI from NOAA- AVHRR in the Tibet Plateau in 2001
梭雷達(dá)地形測(cè)量任務(wù)是由美國(guó)國(guó)家地理空間情報(bào)局(NGA)和NASA共同推行的國(guó)際研究項(xiàng)目。其雷達(dá)系統(tǒng)可獲得56°S~60°N近全球覆蓋范圍的數(shù)字高程模型,空間分辨率有30 m和90 m兩種。本次研究采用青藏高原地區(qū)90 m分辨率的DEM數(shù)據(jù),并變換為0.25°尺度。數(shù)據(jù)由http: //gdem.ersdac.jspacesystem.org提供。在模型建立的過程中,除DEM外,并根據(jù)青藏高原DEM數(shù)據(jù)提取坡向和坡度數(shù)據(jù)[21]。
3.1.1 隨機(jī)森林算法
隨機(jī)森林算法(random forest,RF)在分類和預(yù)測(cè)方面具有優(yōu)勢(shì),目前已被廣泛地應(yīng)用于降水和生態(tài)等諸多領(lǐng)域。20世紀(jì)80年代Breiman等人將分類樹方法發(fā)展成為隨機(jī)森林算法。與神經(jīng)網(wǎng)絡(luò)算法相比,其計(jì)算量小且精度較高。該算法的優(yōu)點(diǎn)在于: ①對(duì)多種資料,可以產(chǎn)生高準(zhǔn)確度的分類器; ②可處理大量的輸入變量; ③在決定類別時(shí),能夠評(píng)估變量的重要性。鑒于降水與多個(gè)變量存在相關(guān)關(guān)系,模型不僅需要多個(gè)輸入變量,而且有大量數(shù)據(jù)作為訓(xùn)練樣本。因此,本次研究采用隨機(jī)森林算法建立降尺度模型是可行的。
相比于神經(jīng)網(wǎng)絡(luò)和多元回歸,隨機(jī)森林算法作為集成學(xué)習(xí)方法,在分類和回歸運(yùn)算方面具有優(yōu)越性,該算法已經(jīng)被成功用于需水預(yù)測(cè)[15]和海表面鹽度反演[16]的研究中。其建模步驟為: ①從原始訓(xùn)練樣本中可重復(fù)地隨機(jī)抽取M個(gè)樣本; ②從解釋變量中不重復(fù)地隨機(jī)抽取N個(gè)樣本,從抽中的變量中選擇最能有效分割數(shù)據(jù)的變量,使分割的子集內(nèi)部的變異性最??; ③依據(jù)步驟②得到的變量將數(shù)據(jù)分割為2個(gè)純度較高的子集; ④對(duì)子集重復(fù)步驟③直到分割停止,即完成了單棵分類樹的建模; ⑤重復(fù)步驟①—④X次,構(gòu)建包含X棵樹的隨機(jī)森林模型; ⑥建立評(píng)價(jià)指標(biāo),檢驗(yàn)?zāi)P偷木取?/p>
本文應(yīng)用R軟件中隨機(jī)森林程序包作為建模工具,針對(duì)本文的研究問題進(jìn)行建模,表1簡(jiǎn)單地羅列了該程序包中包含的主要函數(shù)。
表1 隨機(jī)森林包主要函數(shù)名與功能Tab.1 Random forest package main function name and function
3.1.2 模型的假設(shè)
已有研究表明,NDVI是降水量降尺度模型的重要輸入因子。由于本文研究區(qū)內(nèi)存在水體,它們對(duì)分析植被與降水的統(tǒng)計(jì)關(guān)系有很大的影響。因此,在建立模型的過程中不考慮NDVI小于等于零的樣本,將其視為異常值從數(shù)據(jù)中剔除。
3.1.3 模型的準(zhǔn)備與建立
本次研究基于隨機(jī)森林算法,以2001年為例對(duì)校準(zhǔn)后的TRMM降水?dāng)?shù)據(jù)進(jìn)行降尺度方法的研究,步驟如下: ①分別將8個(gè)變量:降雨量(precipitation),降水與歸一化差值植被指數(shù)(NDVI)、數(shù)字高程(DEM)、經(jīng)緯度比值(ll)、坡向(aspect),坡度(slope),經(jīng)度(lontitude)及緯度(lattitude)讀入數(shù)組中,使每個(gè)數(shù)組對(duì)應(yīng)位置的元素值代表圖像中同一個(gè)像元的特征,并寫入同一個(gè)矩陣中; ②剔除異常值; ③將數(shù)據(jù)隨機(jī)分成大小相同的兩組,組1數(shù)據(jù)作為建模樣本,組2數(shù)據(jù)用來檢驗(yàn); ④利用R軟件的建模工具,建立Random Forest模型; ⑤輸入組2模型進(jìn)行檢驗(yàn)。
3.1.4 模型的應(yīng)用
對(duì)上節(jié)中建立的模型進(jìn)行有效性檢驗(yàn)后,本節(jié)將對(duì)降水?dāng)?shù)據(jù)進(jìn)行降尺度計(jì)算,具體步驟為: ①采用最鄰近像元法將NDVI,DEM,ll,slope及aspect原始數(shù)據(jù)重采樣為8 km×8 km分辨率數(shù)據(jù); ②按照模型輸入變量的數(shù)據(jù)格式,創(chuàng)建經(jīng)緯度和經(jīng)緯度比值數(shù)據(jù); ③剔除異常值; ④輸入已建立隨機(jī)森林,計(jì)算8 km分辨率的降水量; ⑤采用最鄰近像元法,對(duì)未進(jìn)行降雨量預(yù)測(cè)的異常值像元進(jìn)行降雨量插值; ⑥將上文獲得的訂正誤差與預(yù)測(cè)值求和,計(jì)算得到降尺度結(jié)果; ⑦采用最鄰近像元法獲得與氣象站位置對(duì)應(yīng)像元降尺度結(jié)果,與氣象站數(shù)據(jù)進(jìn)行回歸分析。
降水量變化是典型的非線性時(shí)間序列,其中包含了大量的時(shí)序動(dòng)態(tài)變化特征。由表2 可知,降水量與環(huán)境具有強(qiáng)相關(guān)性。目前常見的預(yù)測(cè)方法是將相關(guān)因子作為輸入向量,建立多元回歸預(yù)測(cè)模型,這種方法考慮了環(huán)境因子對(duì)降水時(shí)序變化的影響,但是缺乏時(shí)序動(dòng)態(tài)分析,不能反映內(nèi)部變化規(guī)律; 另一種常見的方法是時(shí)間序列分析,該方法充分考慮了降水變化的內(nèi)部因子,卻忽略了降水與外在因子之間的關(guān)聯(lián),進(jìn)而影響預(yù)測(cè)精度。
為了提高降水量預(yù)測(cè)精度,本次研究在考慮降水變化時(shí)序動(dòng)態(tài)變化特征的同時(shí),引入了環(huán)境因子,基于隨機(jī)森林算法建立降水量的預(yù)測(cè)模型。步驟如下: 首先,需要為模型定階,即判斷降水受自身發(fā)生量影響的時(shí)效長(zhǎng)短,采用F測(cè)驗(yàn)進(jìn)行逐步比較確定,本次研究采用2000—2012年均降水?dāng)?shù)據(jù)作為研究對(duì)象,預(yù)測(cè)時(shí)效期為預(yù)測(cè)時(shí)間點(diǎn)的前5 a; 然后,將時(shí)效時(shí)間段內(nèi)的發(fā)生量作為降水內(nèi)部變化的描述因子,并選擇NDVI作為外在影響因子,基于隨機(jī)森林算法建立非線性預(yù)測(cè)模型; 將2000—2004年和2005年降水?dāng)?shù)據(jù)和2005年NDVI數(shù)據(jù)作為輸入向量,建立預(yù)測(cè)模型,隨后將2001—2005年降水?dāng)?shù)據(jù)和2006年NDVI數(shù)據(jù)作為輸入向量,預(yù)測(cè)2006年降水量。
為提高訓(xùn)練樣本的合理性,采用隨機(jī)方法生成樣本個(gè)數(shù)相等的訓(xùn)練樣本和檢驗(yàn)樣本,將表2中8個(gè)參數(shù)作為輸入量,建立隨機(jī)森林預(yù)測(cè)模型,對(duì)檢驗(yàn)樣本進(jìn)行預(yù)測(cè),以2001年降水?dāng)?shù)據(jù)為例,預(yù)測(cè)結(jié)果與校準(zhǔn)后TRMM降水?dāng)?shù)據(jù)的比較圖4所示。
圖4 隨機(jī)森林模型預(yù)測(cè)值與校準(zhǔn)的 TRMM3B43檢驗(yàn)值擬合圖Fig.4 Random forest model predictions and calibrated TRMM3B43 values
圖4中,縱坐標(biāo)代表對(duì)模型輸入檢驗(yàn)數(shù)據(jù)集的自變量后,輸出的降水量的預(yù)測(cè)值,橫坐標(biāo)代表檢驗(yàn)數(shù)據(jù)集中的TRMM校正值,兩者的判斷系數(shù)R2為 0.87。
鑒于賈紹鳳團(tuán)隊(duì)采用線性回歸模型,對(duì)柴達(dá)木盆地的TRMM降水產(chǎn)品進(jìn)行降尺度研究,其模型取得了較好的檢驗(yàn)精度。本文建立降水量與其他自然地理變量之間的線性回歸模型,與隨機(jī)森林模型比較。如表2列出了降水與歸一化差值植被指數(shù)(NDVI)、數(shù)字高程(DEM)、經(jīng)緯度比值(ll)、坡向(aspect)、坡度(slope)和經(jīng)緯度(lon和lat)的線性相關(guān)性。
表2 降水與其他變量的線性相關(guān)性Tab.2 Linear correlation between precipitation and other variables
根據(jù)變量之間的線性相關(guān)系數(shù)明顯可知,降雨量與另外7個(gè)變量之間的相關(guān)性差別較大。因此,本文采用向后逐步回歸的方法,在0.25°分辨率下從模型包含所有預(yù)測(cè)變量開始,一次刪除一個(gè)變量直到會(huì)影響模型變量(Akaike information criterion, AIC)為止,即
AIC=(2K-2L)/n,
(3)
(4)
式中:k為參數(shù)的數(shù)量;L為對(duì)數(shù)似然值;n為樣本數(shù)目;sse為殘差平方和。AIC的大小取決于L和k。k取值越小,AIC越??;L取值越大,AIC值越小。k小表明模型簡(jiǎn)潔,L大表明模型精確。因此AIC和修正的決定系數(shù)類似,在評(píng)價(jià)模型是兼顧了簡(jiǎn)潔性和精確性。
經(jīng)后向逐步回歸分析后本文建立了降水與NDVI,DEM,slope,lon,lat和ll,6個(gè)變量(X1,X2,X3,X4,X5和X6)間多元線性回歸模型(圖5)。模型預(yù)測(cè)值與檢驗(yàn)值的判斷系數(shù)為0.77。鑒于模型擬合效果不如基于隨機(jī)森林的降尺度模型效果好,本文選擇后者對(duì)青藏高原地區(qū)降水?dāng)?shù)據(jù)進(jìn)行降尺度研究。
圖5 多元線性模型預(yù)測(cè)值與校準(zhǔn)的 TRMM3B43檢驗(yàn)值擬合圖Fig.5 Multivariate linear model predictions and calibrated TRMM3B43 values
為分析降尺度結(jié)果在研究區(qū)內(nèi)空間分布的準(zhǔn)確性,本次研究將TRMM校準(zhǔn)值(圖6)與8 km×8 km降尺度結(jié)果(圖7)進(jìn)行比較分析,隨機(jī)森林輸出結(jié)果的空間分布特點(diǎn)呈現(xiàn)從南到北、從東南到西北逐漸減小的趨勢(shì),與TRMM校準(zhǔn)值的空間分布趨勢(shì)相同,但是在具有特殊地理環(huán)境的局部區(qū)域,例如,在珠穆朗瑪峰少雨區(qū)、祁連山脈多雨區(qū)和青藏高原腹地區(qū)域,降尺度結(jié)果不夠理想。
圖6 2001年青藏高原TRMM降水校準(zhǔn)值空間分布圖Fig.6 Spatial distribution of TRMM precipitation calibration value of Tibet Plateau in 2001
圖7 2001年青藏高原隨機(jī)森林輸出結(jié)果空間分布圖Fig.7 Spatial distribution of random forest output in the Tibet Plateau in 2001
因此,本次研究在此建模尺度上,預(yù)測(cè)0.25°分辨率的降水量,結(jié)合TRMM校準(zhǔn)后降水值求出模型在該尺度上的誤差分布,采用最鄰近像元方法將結(jié)果插值為8 km×8 km分辨率的誤差分布,結(jié)果如圖8所示。將8 km×8 km誤差分布與隨機(jī)森林輸出的8 km×8 km降水結(jié)果求和,即得到降尺度結(jié)果,如圖9所示。
圖8 8 km×8 km空間分辨率誤差分布圖Fig.8 8 km × 8 km spatial resolution error distribution
圖9 降尺度結(jié)果圖Fig.9 Downscaling results
本文采用回歸系數(shù)R2作為檢驗(yàn)標(biāo)準(zhǔn)對(duì)降尺度結(jié)果進(jìn)行驗(yàn)證分析。TRMM校準(zhǔn)值和降尺度結(jié)果與站點(diǎn)降水量回歸分析圖見圖10。如圖10所示,降尺度結(jié)果與氣象站點(diǎn)降水觀測(cè)量的判斷系數(shù)為0.89,提高了原始數(shù)據(jù)的空間分辨率。同時(shí)與0.25°校準(zhǔn)數(shù)據(jù)(與站點(diǎn)數(shù)據(jù)判斷系數(shù)為0.81)相比,提高了數(shù)據(jù)與站點(diǎn)數(shù)據(jù)的擬合系數(shù)。因此,采用隨機(jī)森林算法對(duì)研究區(qū)進(jìn)行降尺度計(jì)算,不僅將降水?dāng)?shù)據(jù)的空間分辨率從0.25°提高到8km,而且提高了降水?dāng)?shù)據(jù)的準(zhǔn)確度。
(a) TRMM校準(zhǔn)值與站點(diǎn)降水量回歸分析圖
(b) 降尺度結(jié)果與站點(diǎn)降水量回歸分析圖圖10 TRMM校準(zhǔn)值和降尺度結(jié)果 與站點(diǎn)降水量回歸分析圖Fig.10 TRMM calibration and downscaling results with site precipitation analysis
圖11分別為研究區(qū)內(nèi)5個(gè)觀測(cè)站點(diǎn)降水量測(cè)量值和預(yù)測(cè)結(jié)果隨時(shí)間變化的曲線。5個(gè)站點(diǎn)依次為昌都站(31.15°N,97.17°E)、那曲站(31.48°N,92.07°E)、林芝站(29.67°N,94.33°E)、拉薩站(29.7°N,91.13°E)和日喀則站(29.25°N,88.88°E)。分析表明,在5個(gè)觀測(cè)站點(diǎn)處的降水量預(yù)測(cè)值有效地描述了降水的年際變化趨勢(shì)和降水量的數(shù)量級(jí)。
(a) 昌都站點(diǎn) (b) 那曲站點(diǎn) (c) 林芝站點(diǎn)
(d) 拉薩站點(diǎn)(e) 日喀則站點(diǎn)
圖115個(gè)站點(diǎn)觀測(cè)值與預(yù)測(cè)值的年際變化曲線
Fig.11Interannualvariationofobservedandpredictedvaluesforfivesites
采用上述預(yù)測(cè)方法,預(yù)測(cè)結(jié)果與原始TRMM降水?dāng)?shù)據(jù)的擬合系數(shù)見表3。
表3 2006—2012年預(yù)測(cè)結(jié)果與校準(zhǔn)后的 TRMM降水量擬合系數(shù)Tab.3 Predicted results for 2006—2012 and TRMM precipitation fitting coefficient after calibration
本文采用TRMM3B43產(chǎn)品進(jìn)行降尺度研究。該產(chǎn)品綜合了4類相互獨(dú)立的降水?dāng)?shù)據(jù),包括微波、近紅外等傳感器融合估算數(shù)據(jù),以及美國(guó)國(guó)家海洋、大氣管理局和全球降水氣候中心的降水雨量計(jì)分析數(shù)據(jù)等[14],是衛(wèi)星降水?dāng)?shù)據(jù)與其他降水?dāng)?shù)據(jù)聯(lián)合反演的最佳降水產(chǎn)品。首先,數(shù)據(jù)產(chǎn)品本身存在誤差,該誤差可能由2方面引起: ①在觀測(cè)4類相互獨(dú)立降水?dāng)?shù)據(jù)的過程中引入了誤差; ②使用聯(lián)合反演算法進(jìn)行數(shù)據(jù)融合的過程中引入了誤差。其次,本次研究采用站點(diǎn)觀測(cè)數(shù)據(jù)雖對(duì)TRMM3B43原始數(shù)據(jù)進(jìn)行了校準(zhǔn),但所用的站點(diǎn)數(shù)據(jù)較少且分布不勻,導(dǎo)致校準(zhǔn)模型在校準(zhǔn)過程中引入了誤差。以上各種誤差均可影響降水?dāng)?shù)據(jù)的真實(shí)性,進(jìn)而降低了降尺度結(jié)果的精度。
降水是受多種因素影響的氣象要素。本次研究?jī)H僅考慮了植被和地形因素對(duì)其產(chǎn)生的作用,忽略了氣候帶、海陸位置、季風(fēng)和人類活動(dòng)等因素對(duì)降水的影響。另外,本次研究模型的輸入變量并不具有相互獨(dú)立性,在一定程度上降低了模型的有效性,因而影響了降尺度結(jié)果的準(zhǔn)確性。
影響預(yù)測(cè)結(jié)果精度的因素主要有2個(gè)方面: ①統(tǒng)計(jì)模型缺乏物理機(jī)制,無法充分描述內(nèi)部和外部因子對(duì)降水變化的影響。②本次研究所采用的降水?dāng)?shù)據(jù)為TRMM3B43的2000—2012年間的年均降水?dāng)?shù)據(jù),時(shí)間尺度較短,因而影響了時(shí)間序列分析的有效性和準(zhǔn)確性,使預(yù)測(cè)結(jié)果無法達(dá)到理想的精度。
基于已有青藏高原的遙感降水等資料,本文根據(jù)降水與植被和地形因子的相關(guān)關(guān)系,使用TRMM3B43降水、NOAA-AVHRR NDVI和SRTM DEM等數(shù)據(jù),采用隨機(jī)森林算法建立了0.25°尺度下的降尺度模型,并求出了該尺度下的誤差分布,采用最鄰近像元方法插值為8 km分辨率,結(jié)合8 km模型預(yù)測(cè)值計(jì)算得出了青藏高原降水分布的降尺度結(jié)果。經(jīng)分析驗(yàn)證,降尺度結(jié)果與地面站點(diǎn)降水量觀測(cè)數(shù)據(jù)的R2為0.89,高于TRMM3B43校準(zhǔn)值與地面站點(diǎn)降水量觀測(cè)數(shù)據(jù)的R2(0.81)。此外,綜合考慮內(nèi)部因子和外部因子對(duì)降水變化的影響,基于隨機(jī)森林算法,融合時(shí)間序列分析和多元回歸分析,建立降水量預(yù)測(cè)模型,有效地描述了降水的年際變化趨勢(shì)和降水量的數(shù)量級(jí),并且2000—2012年均降水量預(yù)測(cè)結(jié)果與TRMM3B43降水?dāng)?shù)據(jù)擬合系數(shù)均達(dá)到0.8以上。因此本研究得出了下述認(rèn)識(shí):
1)基于下墊面因子和隨機(jī)森林算法的降尺度方法,能夠較準(zhǔn)確地估計(jì)實(shí)際降水情況,不僅可提高衛(wèi)星遙感降水產(chǎn)品的空間分辨率,同時(shí)可提高原始數(shù)據(jù)的反演精度。
2)融合時(shí)間序列分析的降水預(yù)測(cè)模型,可以有效地描述降水的年際變化趨勢(shì)和降水量的數(shù)量級(jí)。