吳 溪,史文嬌
(1.中國科學院地理科學與資源研究所/ 陸地表層格局與模擬院重點實驗室,北京 100101;2.江蘇省測繪工程院,江蘇 南京 210013;3. 中國科學院大學資源與環(huán)境學院,北京 100049)
在全球氣候變化和水資源匱乏的情況下,由于森林水源涵養(yǎng)具有攔蓄降雨、調(diào)節(jié)徑流和凈化水質(zhì)等作用,森林水源涵養(yǎng)量及其空間分布受到極大關(guān)注[1-3]。準確估算森林水源涵養(yǎng)量的方法主要分為2類:一是基于水量平衡的思想利用模型計算森林水源涵養(yǎng)量[4-5];二是基于經(jīng)驗模型利用實測數(shù)據(jù)測算森林水源涵養(yǎng)量。前者基于模型可計算大尺度區(qū)域森林水源涵養(yǎng)量,但是其準確性需要實測數(shù)據(jù)驗證;后者可以較準確地估算森林水源涵養(yǎng)量,但是由于工作量較大,極少用于全國等較大空間尺度?;谡军c實測數(shù)據(jù)的大尺度區(qū)域森林水源涵養(yǎng)量空間化研究,既要搜集完整的站點實測數(shù)據(jù),又要基于實測數(shù)據(jù)分析森林水源涵養(yǎng)量的影響因素,雖工作量巨大,但具有重要的研究意義。一是基于站點實測數(shù)據(jù),可以更加準確和清晰地認識大尺度區(qū)域森林水源涵養(yǎng)量空間分布特征的影響因素,從而為認識森林水源涵養(yǎng)量影響機制提供科學依據(jù);二是基于站點實測數(shù)據(jù)與影響因素開展分析,可為大尺度水文模型或遙感估算森林水源涵養(yǎng)量提供實測驗證數(shù)據(jù)和時空趨勢對比,進而為開發(fā)和改進更符合大尺度區(qū)域地理特征的森林水源涵養(yǎng)量相關(guān)模型奠定基礎(chǔ)。
在基于站點實測數(shù)據(jù)估算森林水源涵養(yǎng)量的過程中,選取對森林及各蓄水層水源涵養(yǎng)量具有顯著影響的因子,可為森林水源涵養(yǎng)量空間化提供輔助信息,而合理的站點空間化方法是決定森林水源涵養(yǎng)量估算精度的關(guān)鍵。在水源涵養(yǎng)量影響因子分析方面,林冠截留量、枯落物持水量、土壤蓄水量和森林水源涵養(yǎng)量的影響因子分析始于20世紀80年代。雖然已有研究在全國尺度上對森林及各蓄水層水源涵養(yǎng)量影響因子進行分析[6],但選取的站點相對較少。目前基于站點的森林及各蓄水層水源涵養(yǎng)量影響因子研究多是在較小的空間尺度開展,少量研究雖為全國尺度,卻僅停留在森林的單一蓄水層上,如林冠層[7]或枯落物層[8],對于大尺度區(qū)域基于站點的森林及各蓄水層水源涵養(yǎng)量的影響因子研究尚較缺乏。對于森林水源涵養(yǎng)量空間化方法,基于站點利用賦值法進行空間化主要應用在空間異質(zhì)性較小的區(qū)域[9-11]。對于大尺度區(qū)域,例如疆域遼闊的中國,回歸法、機器學習與地統(tǒng)計分析在實現(xiàn)空間化方面運用廣泛?;貧w法從20世紀90年代就已開始應用[12],如根據(jù)全國47個林分的林冠截留能力與所在地的經(jīng)緯度和海拔因素構(gòu)建多元地理空間模型[6]。機器學習與地統(tǒng)計分析方法的發(fā)展時間較長,于2005年起開始應用于森林及各蓄水層水源涵養(yǎng)量參數(shù)空間化方面[13-14]。
為了明確森林及各蓄水層水源涵養(yǎng)量的顯著影響因子,對比基于站點實測數(shù)據(jù)的空間化方法特點,梳理區(qū)域森林水源涵養(yǎng)量空間化過程中存在的問題。筆者首先總結(jié)基于實測站點的大尺度區(qū)域森林水源涵養(yǎng)量空間化的整體框架,然后對于框架中各個部分展開深入研究:(1)林冠截留量、枯落物持水量、土壤蓄水量和森林水源涵養(yǎng)量的影響因子及其作用方式,為森林水源涵養(yǎng)量空間化提供輔助信息;(2)站點空間化方法的原理及優(yōu)缺點;(3)估算大尺度區(qū)域森林水源涵養(yǎng)量的不確定性。
基于實測站點的大尺度區(qū)域森林水源涵養(yǎng)量空間化的前提是站點數(shù)據(jù)的收集與整合。該研究基于綜合蓄水能力法[9]對中外文獻資料中關(guān)于中國實測站點的林冠截留、枯落物持水、土壤蓄水相關(guān)參數(shù)和影響因子進行搜集整理,構(gòu)建森林及各蓄水層水源涵養(yǎng)參數(shù)和影響因子數(shù)據(jù)庫。其中,實測站點包括國家森林生態(tài)系統(tǒng)定位研究站、林業(yè)等部門或科研機構(gòu)在典型生態(tài)保護區(qū)、自然保護區(qū)、退耕還林區(qū)、石漠化地區(qū)、防護林、生態(tài)公益林和水源保護林等地設置的野外實驗站點。
基于實測站點的大尺度區(qū)域森林水源涵養(yǎng)量空間化過程需要確定森林及各蓄水層水源涵養(yǎng)量的主要影響因子和空間化方法(圖1)。首先,在前人研究基礎(chǔ)上,分析影響林冠截留[7]、枯落物持水[15]、土壤蓄水[16]和森林水源涵養(yǎng)量[16-17]的主要影響因子,進而構(gòu)建森林及各蓄水層水源涵養(yǎng)量影響因子空間數(shù)據(jù)集,為森林及各蓄水層水源涵養(yǎng)量空間化提供輔助信息;然后,綜述由點到面的森林及各蓄水層水源涵養(yǎng)量的空間化方法,提出適合空間異質(zhì)性較大區(qū)域的森林水源涵養(yǎng)量空間化方法;最后以收集的站點參數(shù)為基礎(chǔ)數(shù)據(jù),依據(jù)林冠截留、枯落物持水、土壤蓄水和森林水源涵養(yǎng)的主要影響因子建立空間柵格數(shù)據(jù)集,基于空間化方法構(gòu)建林冠截留量、枯落物持水量、土壤蓄水量和森林水源涵養(yǎng)量空間分布模型,預測中國森林及各蓄水層水源涵養(yǎng)量的空間分布,實現(xiàn)由點到面的森林及各蓄水層水源涵養(yǎng)量空間模擬。
由于大尺度區(qū)域的氣候、地形和環(huán)境信息等存在極大差異,森林水源涵養(yǎng)量空間化需以林冠截留量、枯落物持水量、土壤蓄水量和森林水源涵養(yǎng)量的影響因子作為輔助變量,結(jié)合空間化方法進行大尺度區(qū)域森林水源涵養(yǎng)量估算。
林冠層截留過程十分復雜,是森林對降雨的第1層攔截和分配,受氣象因子[18]、地形因子、植被類型和植被冠層屬性等影響[19]。林冠截留量隨氣候因子中降雨量的增加呈先增加后趨于飽和的趨勢[18,20-21],降雨量在10~20 mm時,林冠截留量隨降雨量增加而減緩[21];林冠截留量與降雨強度和溫度呈正相關(guān)關(guān)系[16,20,22];同時林冠截留量隨風速的提高先增加后減少[18];林冠截留量隨地形因子中坡面的增高而減小[23]。從植被的葉片形狀來看,針葉林對降雨的攔截效果優(yōu)于闊葉林,如岷江冷杉針葉林優(yōu)于川滇高山櫟闊葉林[24]。森林覆蓋度[21]、冠層厚度[21]、葉面積指數(shù)[18, 20]、郁閉度[18, 20]、林分密度[18,20]、林齡[18]、樹高[25]、胸徑[25]和冠幅[25]等植被特性與林冠截留量呈正相關(guān)關(guān)系。
圖1 基于實測站點的區(qū)域森林水源涵養(yǎng)量空間化框架
枯落物層凋落物疏松多孔,是對降雨的第2層攔截。氣象因子、地形因子、植被類型和植被冠層屬性、枯落物屬性等因子影響枯落物持水量??萋湮锍炙颗c氣象因子中的降雨量[16,26]和溫度[27-28]呈負相關(guān)關(guān)系,降雨量在5 mm以上時枯落物持水能力明顯下降[16]。地形因子和緯度通過水熱條件變化影響枯落物持水量,枯落物持水量隨海拔的升高先增加后減小[29-30],與坡度呈負相關(guān)關(guān)系[16],陰坡的枯落物持水能力優(yōu)于陽坡[16],緯度與枯落物持水量呈正相關(guān)關(guān)系[26]。植被類型和植被特性主要通過影響枯落物蓄積量改變枯落物持水量,針葉林的枯落物蓄積量和枯落物持水量大于闊葉林[31-32];植被覆蓋度[21]、林分密度和郁閉度[16,27,33-34]、林齡[35]等植被特征與枯落物持水量呈正相關(guān)關(guān)系,東北地區(qū)蒙古櫟林郁閉度從0.95降到0.6時,枯落物最大持水量從2.2降到1.9 mm[21]。枯落物屬性中的枯落物蓄積量[16, 21]、枯落物厚度[36]和枯落物分解程度[16]與枯落物持水量呈正相關(guān)關(guān)系,一般枯落物持水量可達枯落物蓄積量的2~3倍[6]。
林下土壤層對森林水源涵養(yǎng)貢獻最大,是對降雨的第3層攔截。土壤蓄水量與地形因子、植被冠層屬性、枯落物屬性、土壤類型和土壤屬性等相關(guān)。土壤蓄水量隨地形因子中海拔的升高而減小[29-30];陽坡的土壤蓄水量弱于陰坡[16,37],遼東地區(qū)胡桃楸植被的北坡土壤平均蓄水量為2 820 t·hm-2,西南坡土壤平均蓄水量為1 883 t·hm-2 [37]。植被屬性與枯落物屬性通過影響土壤理化性質(zhì)進而影響土壤蓄水量,林分密度[34, 37]、郁閉度[33]、林齡[35]等植被屬性與土壤蓄水量呈正相關(guān)關(guān)系,如30 a左右的中齡林土壤具有較高的涵養(yǎng)水源能力[27];枯落物屬性中的枯落物蓄積量[21,27]和枯落物分解速度[32]與土壤蓄水量呈正相關(guān)關(guān)系。土質(zhì)疏松、孔隙度大、通透性強且黏粒表面大的土壤類型蓄水量大[38]。土壤屬性中的土壤厚度[16,37]、非毛管孔隙度[16,33]和土壤滲透能力[27,33]與土壤蓄水量呈正相關(guān)關(guān)系,土壤厚度由43降至35 cm時,土壤蓄水量由2 820降至2 526 t·hm-2 [37];土壤容重與土壤蓄水量呈負相關(guān)關(guān)系[16, 33]。
氣象、地形、植被、土壤等因子變化影響森林的水源涵養(yǎng)功能。降雨量和溫度是森林水源涵養(yǎng)的重要影響因子,溫遠光等[6]研究表明降雨量的空間分布與森林水源涵養(yǎng)量的空間分布趨勢一致,溫度與森林水源涵養(yǎng)量呈正相關(guān)關(guān)系[39]。地形因子的影響因地而異,森林水源涵養(yǎng)量隨高程的增大先增加后減小[40],就大尺度空間分布規(guī)律而言,峰值高度還有待研究。全國尺度上,坡度與森林水源涵養(yǎng)量呈正相關(guān)關(guān)系[39],但也有小尺度區(qū)域研究表明坡度與森林水源涵養(yǎng)量呈負相關(guān)關(guān)系。如唐玉芝等[10]在烏江流域的研究表明,坡度與森林水源涵養(yǎng)量的相關(guān)系數(shù)為-0.910,坡度平均每增加1°,森林水源涵養(yǎng)量相應減少2.44 t·hm-2。地理位置上,大尺度區(qū)域森林水源涵養(yǎng)量空間分布主要受水熱條件影響,如中國的森林水源涵養(yǎng)量從西北向東南遞增[11,39]。由于闊葉林和針葉林的適宜生長環(huán)境不同,針葉林耐寒,闊葉林喜溫,闊葉林的森林水源涵養(yǎng)量高于針葉林[6,10],但還需根據(jù)具體的立地條件和植被屬性(如植被覆蓋度[11]和林齡[41]等)綜合考慮。森林水源涵養(yǎng)量各影響因子中土壤蓄水量的貢獻最大,土層厚、毛管孔隙大、水土保育能力強的土壤類型水源涵養(yǎng)量相對較高,如范亞寧等[42]研究的秦嶺粗骨土和棕壤以及陳姍姍等[43]研究的陜西商洛黃棕壤土。
氣象因子中降水和溫度均是林冠截留量、枯落物持水量和森林水源涵養(yǎng)量的重要影響因子,但是降水和溫度對林冠截留量和森林水源涵養(yǎng)量的影響方式與枯落物持水量相反,氣象因子對土壤蓄水量的影響小于其他蓄水層。地形因子和位置因子主要是通過改變當?shù)厮疅釛l件(氣象因子)間接影響森林及各蓄水層水源涵養(yǎng)量。植被冠層屬性保持在合理的范圍內(nèi),對森林及各蓄水層水源涵養(yǎng)量均有積極影響。枯落物屬性主要影響枯落物持水量和土壤蓄水量,通過改善土壤屬性間接影響土壤蓄水量。土壤層對森林水源涵養(yǎng)的貢獻大于林冠層和枯落物層,因此土壤屬性對森林水源涵養(yǎng)量的影響方式與其對土壤蓄水量的影響方式一致。
森林水源涵養(yǎng)量的空間化即基于試驗觀測站點上觀測的林冠截留、枯落物持水和土壤蓄水參數(shù),利用模型預測森林水源涵養(yǎng)量的空間分布,實現(xiàn)由點到面的森林水源涵養(yǎng)量空間模擬。目前已有的基于站點的水源涵養(yǎng)量空間化方法主要分為賦值法、回歸法、機器學習與地統(tǒng)計分析?;谡军c的林冠截留量、枯落物持水量、土壤蓄水量和森林水源涵養(yǎng)量的空間化方法及其優(yōu)缺點見表1。
提高森林水源涵養(yǎng)量空間化的精度有利于準確估算森林水源涵養(yǎng)量,預測森林水源涵養(yǎng)量空間分布趨勢。對于賦值法,在相關(guān)參數(shù)空間異質(zhì)性較小的條件下,矢量賦值法的精度主要與收集的參數(shù)相關(guān),參數(shù)分布越均勻,參數(shù)可信度越高,越有利于提高森林及各蓄水層水源涵養(yǎng)量空間化結(jié)果的精度;柵格賦值法的精度不僅與收集的參數(shù)相關(guān),也與植被覆蓋度的精度有關(guān)。對于回歸法,作為自變量的影響因子選擇是否合理、客觀和全面,決定了森林及各蓄水層水源涵養(yǎng)量的估算模型的精度。對于機器學習與地統(tǒng)計分析,地統(tǒng)計方法的插值精度決定了森林及各蓄水層水源涵養(yǎng)量的空間化精度,而用于機器學習的樣本數(shù)據(jù)和用于空間化的站點數(shù)據(jù)的空間分布則極大地影響基于機器學習模型的森林及各蓄水層水源涵養(yǎng)量的空間化精度。因此在收集數(shù)據(jù)時要保證其準確性,盡最大可能使站點數(shù)據(jù)均勻分布在有植被覆蓋的區(qū)域。
表1 森林及其各蓄水層水源涵養(yǎng)量的空間化方法[9-13,44-46]
Table 1 Spatialization methods of forest and its aquifers water conservation
方法優(yōu)點缺點賦值法 在大量文獻和實驗資料的基礎(chǔ)上獲得相關(guān)參數(shù),小區(qū)域尺度空間化結(jié)果準確度較高忽略了各參數(shù)空間異質(zhì)性,僅適用于小區(qū)域尺度回歸法 在前人經(jīng)驗的基礎(chǔ)上全面收集水源涵養(yǎng)量影響因子,根據(jù)相關(guān)分析客觀選擇影響因子僅適用于自變量和因變量關(guān)系基本不變的地理過程機器學習與地統(tǒng)計分析 適用于大區(qū)域尺度,自變量和因變量關(guān)系可變化空間化結(jié)果與訓練樣本質(zhì)量、已有站點分布是否均勻相關(guān)性較大
3.1.1線性回歸模型
線性回歸模型以氣象、地形和森林特征等為影響因子,利用相關(guān)分析得出各參數(shù)的顯著影響因子作為模型的自變量,以林冠截留量、枯落物持水量、土壤蓄水量和森林水源涵養(yǎng)量及其參數(shù)為因變量,構(gòu)建影響因子與林冠層、枯落物層、土壤層和森林水源涵養(yǎng)量或其參數(shù)的線性回歸模型,進而預測空間上未知點的水源涵養(yǎng)量或其參數(shù)。該方法在小區(qū)域尺度枯落物蓄積量[47]和土壤深度[48]研究方面均有應用。但建立線性回歸方程的方法更適用于樣地尺度,屬于局地性質(zhì)的研究。此外,該方法未考慮植被類型和土壤類型等定性因子。
3.1.2地理加權(quán)回歸模型(GWR)
基于回歸分析,BRUNSDON等[49]提出了地理加權(quán)回歸模型,該方法以反距離為權(quán)重,不同位置上的回歸系數(shù)是變化的。在大尺度區(qū)域森林水源涵養(yǎng)空間化過程中,可利用氣象、位置信息和地形等因子作為因變量來構(gòu)建地理加權(quán)回歸模型,對綜合蓄水能力法參數(shù)的空間分布進行預測。MISHRA等[50]在美國中西部城市使用地理加權(quán)回歸模型預測土壤有機碳儲量,精度比多元線性回歸(MLR)提高22%。但是該方法忽略了自變量間的交叉相關(guān)[51],而實際上森林水源涵養(yǎng)量各影響因子間存在極大的相關(guān)性。
3.1.3廣義線性模型(GLM)與廣義加法模型(GAM)
廣義線性模型是線性回歸模型的擴展[52],適用于不符合正態(tài)分布的數(shù)據(jù),但該模型只考慮響應變量與預測變量之間的線性關(guān)系,不能處理復雜的響應關(guān)系[53]。生態(tài)變量之間關(guān)系復雜,為了解決該問題,有學者提出了廣義線性模型的非參數(shù)擴展模型——廣義加法模型[54]。廣義線性模型、廣義加法模型和分類回歸樹(CART)3個模型均可應用于中國樹種地理分布模擬,模擬效果均較好,其中廣義加法模型最優(yōu)[55]。因此可結(jié)合站點立地條件和林分結(jié)構(gòu)等,利用廣義加法模型模擬森林水源涵養(yǎng)量及其參數(shù)空間分布。
隨著機器學習模型和地統(tǒng)計分析的發(fā)展,KURIAKOSE等[56]和HEDLEY等[57]將機器學習與地統(tǒng)計分析應用于土壤水分預測,預測結(jié)果優(yōu)于回歸模型。因此,機器學習與地統(tǒng)計分析是森林水源涵養(yǎng)量及其參數(shù)空間化的重要選擇。
3.2.1模糊c均值聚類(FCM)
模糊c均值聚類是應用較廣泛的用于預測的模糊聚類方法,其利用統(tǒng)計方法計算每個樣本與每類原型在多屬性空間中的距離,以隸屬度進行加權(quán),最終達到類內(nèi)加權(quán)誤差平方和目標函數(shù)最小化[58]。王改粉等[59]采用該方法預測土壤厚度,預測效果滿足精度要求。但是該方法存在主觀性,即聚類數(shù)選擇問題,聚類數(shù)改變,預測結(jié)果將會改變,因此需尋求最佳聚類數(shù)[60]。
3.2.2決策樹(RT)
決策樹是一種樹狀結(jié)構(gòu)的預測模型,表示對象屬性與對象值之間的一種映射關(guān)系,且訓練時間相對較少,可以處理多種類型的預測變量[61]。植被類型和土壤類型等分類變量是森林水源涵養(yǎng)的顯著影響因子,所以決策樹較適用于森林水源涵養(yǎng)量的預測。周斌等[62]利用決策樹預測浙江省龍游縣土壤性質(zhì)的連續(xù)空間分布,預測結(jié)果可以解釋75%~81%的土壤性質(zhì)空間變異。但是單一的決策樹模型不穩(wěn)定性較大,變量的細小改動會改變預測結(jié)果,因此需要將多個決策樹組合成單一模型,以穩(wěn)定和提高預測精度[63]。
3.2.3支持向量機(SVM)
20世紀90年代,有學者提出了支持向量機,它在小樣本、非線性變量分析及高維模式識別中表現(xiàn)出的優(yōu)勢越來越明顯[64]。GARCA等[65]使用該方法利用遙感數(shù)據(jù)成功預測北美溫帶闊葉混交林和溫帶針葉林的森林冠層高度。但是,傳統(tǒng)支持向量機算法存在計算效率低、很難找到局部最優(yōu)值的問題,因此模型參數(shù)尋優(yōu)是提高精度的重要過程,例如郭李娜等[66]采用網(wǎng)格搜索與K-fold交叉驗證結(jié)合的方法對支持向量機模型進行參數(shù)尋優(yōu),并進行土壤容重預測。
3.2.4隨機森林(RF)
2001年BREIMAM[67]開發(fā)了一種分類與回歸結(jié)合的隨機森林模型,可用于處理關(guān)系復雜且呈非線性的變量,是一種可以預測離散和連續(xù)數(shù)據(jù)的非參數(shù)決策樹分類器,即使變量之間有許多缺失值,甚至預測變量數(shù)目極大超過觀測值數(shù)據(jù)也同樣有效,因此較適用于大尺度區(qū)域森林水源涵養(yǎng)量預測。TESFA等[68]應用廣義加法和隨機森林模型預測土壤深度的空間格局,結(jié)果表明隨機森林模型較優(yōu)。隨機森林模型還能用于南非的林冠截留能力預測[69]。但是該模型也存在分類規(guī)則復雜、收斂到非全局的局部最優(yōu)解和過度擬合等缺點。
3.2.5人工神經(jīng)網(wǎng)絡(ANN)
人工神經(jīng)網(wǎng)絡是模擬人腦生物過程的智能系統(tǒng),具有較強的自學習能力和處理非線性問題能力[70]。BP網(wǎng)絡是人工神經(jīng)網(wǎng)絡中應用最廣泛的一種,BP網(wǎng)絡可適用于存在大量未知內(nèi)部結(jié)構(gòu)和機理的生態(tài)系統(tǒng)[71]。目前已有研究將神經(jīng)網(wǎng)絡應用于土壤蓄水[46]和枯落物蓄積量[72]的預測中,且預測精度較高,土壤蓄水量的預測精度達87%以上,枯落物蓄積量的預測精度為89.71%。但是人工神經(jīng)網(wǎng)絡存在局部極小和收斂速度慢的缺陷[73]。
3.2.6地統(tǒng)計與高精度曲面建模
插值在大尺度區(qū)域空間化中應用較為廣泛,可用于預測森林水源涵養(yǎng)量及其計量參數(shù)。史文嬌等[74]對傳統(tǒng)的克立格插值法、反距離權(quán)重法和樣條插值法等插值方法進行了詳細的總結(jié)。目前已應用于土壤厚度[56]和土壤毛管孔隙度[75]的插值方法中,改進的克立格插值法居多,且預測效果優(yōu)于普通克立格插值法。此外,STAELENS等[76]使用克立格插值法預測了闊葉混交林的枯落物空間分布;JOST等[13]使用地統(tǒng)計插值成功預測了奧地利的挪威云杉和歐洲山毛櫸下30 cm土壤蓄水量的空間分布。高精度曲面建模在土壤屬性插值中也應用廣泛,且精度不斷提高。SHI等[77]首次將高精度曲面建模方法應用于土壤pH插值,獲得了比克立格插值法、反距離權(quán)重法和樣條插值法更高的精度。因此高精度曲面建模是森林水源涵養(yǎng)量及其計量參數(shù)插值較好的選擇,不過該方法較少應用于森林水源涵養(yǎng)量的空間化處理。
以上方法均存在不同的預測誤差,因此將多種方法綜合集成、互相彌補缺點是提高預測精度的方法之一。廣義線性模型與殘差克里格法是最早提出的組合方法之一[78],采用廣義線性模型-克里格模型預測土壤屬性的誤差小于其他克里格方法。GUO等[79]采用逐步線性回歸、隨機森林和隨機森林加殘差克里格法預測橡膠園土壤有機質(zhì)的空間分布,結(jié)果表明隨機森林加殘差克里格法的預測誤差低于逐步線性回歸,決定系數(shù)R2高于逐步線性回歸。SCARPONE等[80]利用廣義線性模型、隨機森林、廣義線性模型加殘差克里格法、隨機森林加殘差克里格法預測土壤厚度,結(jié)果表明廣義線性模型加殘差克里格法是預測0~200 cm內(nèi)土壤厚度的最佳預測方法。因此,相較于回歸模型和機器學習與地統(tǒng)計分析,多種方法綜合集成是提高預測精度較為有效的方法之一。
不同的空間化方法適用性不同,尤其是回歸模型和機器學習模型。回歸模型中,線性回歸模型適用于變量之間彼此獨立、自變量和因變量關(guān)系基本不變的空間數(shù)據(jù);地理加權(quán)回歸模型適用于參數(shù)隨空間地理特征變化而變化、參數(shù)受多個環(huán)境變量影響的空間數(shù)據(jù);廣義加法模型適用于變量之間關(guān)系復雜、可能不符合正態(tài)分布的數(shù)據(jù)(如生態(tài)變量)。各機器學習方法的適用條件也存在差異。模糊c均值聚類模型適用于連續(xù)性空間地理現(xiàn)象的預測,例如土壤屬性;決策樹模型適用于多種類型的變量,例如連續(xù)變量、分類變量,且訓練事例能夠用屬性-結(jié)論的方式表達出來;支持向量機適用于小樣本、非線性和高維數(shù)據(jù);隨機森林模型適用于變量之間關(guān)系復雜且呈非線性關(guān)系,或存在大量缺失的數(shù)據(jù);人工神經(jīng)網(wǎng)絡適用于變量之間存在大量未知關(guān)系和機理的數(shù)據(jù)。目前已有的空間化方法在土壤層參數(shù)預測方面應用較多且較成熟,相較于回歸模型,機器學習與地統(tǒng)計分析的預測效果較好,但是兩者結(jié)合的預測效果更優(yōu)。
綜合蓄水能力法是在林冠截留、枯落物持水和土壤蓄水均理想的情況下,預測森林各蓄水層截留降雨的最大值之和。但長時間尺度上降雨會發(fā)生蒸散,而綜合蓄水能力法忽略蒸散作用[81],所以該方法更適用于降雨事件;森林水源涵養(yǎng)有攔蓄降雨、調(diào)節(jié)徑流、凈化水質(zhì)等作用,但該方法僅從攔蓄降雨作用方面入手;此外,該方法參數(shù)較多,且參數(shù)獲取過程中存在較多的不確定性。
綜合蓄水能力法是參數(shù)較多、較全面的一種森林水源涵養(yǎng)評價方法,參數(shù)選擇決定了水源涵養(yǎng)評價的質(zhì)量,需要根據(jù)實驗目的選擇參數(shù),明確各個參數(shù)的物理意義及存在的問題。林冠層、枯落物層和土壤層在參數(shù)選擇方面均存在不確定性。
林冠層降雨量的定義包括研究年份或月份的總降雨量[3]、平均降雨量[82]、最大一日面降雨[9]、單次最大降雨量[83]等。不同學者選用的降雨定義不同,因此較難根據(jù)已有研究比較分析全國尺度的林冠截留量空間分布。
綜合蓄水能力法在測量枯落物層中枯落物持水量時會同時測量枯落物有效持水量和最大持水量,最大持水量是將枯落物試樣浸水24 h后測量處于飽和狀態(tài)的枯落物持水量[84],而枯落物有效持水率為高雨強下的實際有效持水量[85]??萋湮锏淖畲蟪炙糠从晨萋湮飳映炙阅艿淖顑?yōu)狀態(tài),綜合蓄水能力法估算的森林水源涵養(yǎng)量是理想狀態(tài)下對降雨的最大攔截量,因此最大持水量預測更適宜采用綜合蓄水能力法。
土壤層中毛管總孔隙度是毛管孔隙度與非毛管孔隙度之和,綜合蓄水能力法在計算過程中既可選擇土壤總孔隙度也可選擇非毛管孔隙度。通常土壤非毛管孔隙是土壤重力水移動的主要通道[86],是土壤主要的儲水場所,因此在綜合蓄水能力法中較多學者選擇用非毛管孔隙度衡量土壤蓄水量。
空間化的對象不同使得空間化結(jié)果存在差異。在模擬水源涵養(yǎng)量空間分布格局的過程中,可以基于3類對象進行空間化。一是綜合蓄水能力法計算過程中,對降雨量、林冠截留率、枯落物蓄積量、枯落物最大持水率、土壤厚度和土壤非毛管孔隙度6個參數(shù)進行空間化,再依據(jù)6個空間化圖層計算區(qū)域尺度的林冠截留量、枯落物蓄水量、土壤蓄水能力和森林水源涵養(yǎng)量。6個參數(shù)是計算森林水源涵養(yǎng)量的站點測量數(shù)據(jù),以此為依據(jù)進行各參數(shù)的空間化,處理結(jié)果更接近實際空間分布,但是根據(jù)參數(shù)空間化結(jié)果計算林冠截留量、枯落物持水量、土壤蓄水量,進而計算森林水源涵養(yǎng)量,會產(chǎn)生多次誤差疊加。二是根據(jù)提取的站點參數(shù)通過綜合蓄水能力法計算站點的森林水源涵養(yǎng)量,然后對其進行空間化,該方法避免了空間化計算過程中的誤差疊加,但是由于綜合蓄水能力法需要每個站點林冠層、枯落物層和土壤層3層均有觀測信息,使得部分單層或2層的觀測數(shù)據(jù)站點不可用,會造成大尺度區(qū)域范圍內(nèi)可用站點數(shù)量少或站點分布不均等問題,導致預測精度降低。三是根據(jù)提取的站點參數(shù)計算林冠截留量、枯落物持水量和土壤蓄水量,然后對其進行空間化,再通過綜合蓄水能力法計算森林水源涵養(yǎng)量,該方法存在以上2種方法的缺點,但是空間計算過程中誤差疊加次數(shù)少于第1類對象,可用站點多于第2類對象。
大尺度區(qū)域森林水源涵養(yǎng)量空間化不僅要選擇適合的空間化方法,也要選擇與森林水源涵養(yǎng)量相關(guān)性顯著的輔助變量,在此基礎(chǔ)上分區(qū)域分模型空間化。筆者認為以下幾個方面還需繼續(xù)探討。
(1)輔助變量的選擇。筆者主要總結(jié)結(jié)合輔助變量的空間模擬方法,因此對于輔助變量的篩選至關(guān)重要。目前輔助變量方面存在2個難點:一是部分輔助變量的空間數(shù)據(jù)較難獲得,例如森林郁閉度、樹高和冠幅等,這些變量對森林水源涵養(yǎng)能力影響較大,不可忽視;二是選擇相關(guān)性顯著的變量才能夠準確合理地預測森林水源涵養(yǎng),如果輔助變量中存在相關(guān)性較小或無關(guān)的變量,可能會擾亂預測結(jié)果。因此,大尺度區(qū)域森林水源涵養(yǎng)量空間化過程中,在選擇適合的空間化方法的基礎(chǔ)上,還要選擇與森林水源涵養(yǎng)量相關(guān)性顯著的輔助變量。
(2)分區(qū)分模型空間化。由于大尺度范圍地理特征空間異質(zhì)性較大,所以需分區(qū)域進行各蓄水層水源涵養(yǎng)量的空間化。樣本點參數(shù)和影響因子數(shù)據(jù)特征顯著,樣本點參數(shù)和部分影響因子為連續(xù)變量,部分影響因子如植被類型、土壤類型為分類數(shù)據(jù)。參數(shù)和影響因子之間關(guān)系復雜,多為非線性關(guān)系。就地理空間連續(xù)性而言,林冠層、枯落物層和森林是非連續(xù)性空間地理現(xiàn)象,土壤層為連續(xù)性空間地理現(xiàn)象。因此需根據(jù)不同區(qū)域樣本數(shù)據(jù)特征和參數(shù)空間連續(xù)性選擇不同的空間化方法。
(3)空間動態(tài)變化。大尺度區(qū)域站點數(shù)據(jù)時間跨度較大,森林的環(huán)境信息隨時間發(fā)生變化,如果不考慮站點數(shù)據(jù)的采樣時間,森林水源涵養(yǎng)量的空間化估算就不具有代表意義,且無法探究大尺度區(qū)域森林水源涵養(yǎng)量動態(tài)空間分布變化。因此需要估算不同時間序列森林水源涵養(yǎng)量,對比不同時間序列森林水源涵養(yǎng)量的變化。