何南騰,鄒嘉南*,郭文弟,周笑遷,狄 迪
(1.南京信息工程大學(xué)中國氣象局氣溶膠與云降水重點(diǎn)開放實(shí)驗(yàn)室,南京 210044;2.中國地質(zhì)調(diào)查局西安礦產(chǎn)資源調(diào)查中心,西安 710100)
蒸散發(fā)是陸面水循環(huán)中重要的水文過程之一,也是聯(lián)系植物碳交換和水分利用的關(guān)鍵生態(tài)過程[1]。作為大氣和地表之間的聯(lián)系,蒸散量作為水文參量同時出現(xiàn)在地表水量和能量平衡方程中,是陸面過程數(shù)值模擬研究中不可缺少的重要邊界條件。此外,Rosenberg 等[2]認(rèn)為70%降落到地球表面的降水是通過蒸發(fā)或蒸散作用回到大氣中的,在干旱區(qū)這個比例可達(dá)90%。因此,它對于了解作物蒸散發(fā)過程規(guī)律、水資源管理以及提高水資源利用效率以及干旱評定等[3-5]有重要意義。近年來,Santos 等結(jié)合遙感技術(shù)與土壤水量平衡模型,估算了西班牙西南地區(qū)棉田2004—2005 年蒸散量的季節(jié)變化[6];Nobuhiro 等通過能量平衡波文比方法估算了常綠闊葉林蒸散發(fā)[1];Zhao 等基于多年渦度相關(guān)和小氣候梯度系統(tǒng)觀測數(shù)據(jù)庫,使用了土壤水量平衡法、波文比法、Penman-Monteith(PM)等6 種方法估算并比較綠洲農(nóng)田蒸散量,發(fā)現(xiàn)Penman-Monteith(PM)結(jié)果最符合綠洲實(shí)際[7]。由于受不同地區(qū)氣象和地形、地貌時空異質(zhì)性的影響,不同參考作物蒸散量計算公式的適用性各不相同。Penman-Monteith(PM)公式作為FAO 專家組唯一推薦使用的參考作物蒸散量計算公式,至今多種參考作物蒸散量計算方法的適用性評價已成為當(dāng)今的熱點(diǎn)問題。然而,參考作物蒸散量計算方法的普適性在極端干旱區(qū)卻鮮有研究。本文依據(jù)阿克蘇地區(qū)2006—2015 年日蒸散量數(shù)據(jù)與氣象資料,對Penman-Monteith(PM)公式進(jìn)行進(jìn)一步的優(yōu)化與適用性分析,以期推薦一個更加精確的參考作物蒸散量計算方法,這對于了解極端干旱區(qū)棉田等作物種植以及可持續(xù)發(fā)展有長遠(yuǎn)的意義。
此外,由于氣象數(shù)據(jù)具備周期性強(qiáng)、時空性、多維多尺度、各屬性相互影響等特征,僅用傳統(tǒng)方法對氣象數(shù)據(jù)進(jìn)行分析和處理會遇到諸多困難[8]。目前,由于遙感衛(wèi)星成本低,基于遙感技術(shù)和模型估算蒸散發(fā)逐漸成為一種經(jīng)濟(jì)實(shí)用的手段[9-10]。另外,神經(jīng)網(wǎng)絡(luò)作為一種人工智能算法,有別于傳統(tǒng)方法,特別是應(yīng)用在處理非線性問題上有著良好效果。此前,也有專家利用神經(jīng)網(wǎng)絡(luò)模型模擬膜下滴灌玉米逐日蒸散量[11]。本研究利用了反向傳播神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network,下文統(tǒng)一稱為BP 神經(jīng)網(wǎng)絡(luò))、廣義回歸神經(jīng)網(wǎng)絡(luò)(General Regression Neural Network,下文統(tǒng)一稱為GRNN 神經(jīng)網(wǎng)絡(luò))兩種神經(jīng)網(wǎng)絡(luò)對日蒸散量數(shù)據(jù)進(jìn)行擬合,希望通過此尋找出一種較為準(zhǔn)確的日蒸散量估算方法。
阿克蘇地區(qū)位于新疆中部地區(qū)、天山山脈中段南麓、塔里木盆地的北緣,78°03′~78°39′E,39°30′~42°41′N,面積約為1325×104hm2。綜合觀測場位于阿克蘇站區(qū)內(nèi),地理坐標(biāo):80°45′E、40°37′N,海拔1028m,2006 年建立,長方形,大小150m×90m,可以滿足100a 尺度的采樣要求。
本研究使用了阿克蘇站中綜合觀測場農(nóng)田生態(tài)系統(tǒng)2006—2015 年有測量記錄的日蒸散量數(shù)據(jù)(100 個樣本,水量平衡法,單位mm·d-1,來自國家生態(tài)科學(xué)數(shù)據(jù)中心資源共享服務(wù)平臺(http://www.cnern.org.cn/),在本研究中用于日蒸散量估算值的對比與驗(yàn)證。另外,使用了相匹配日期的阿克蘇站的氣象資料,包括日平均氣溫、日最高氣溫、最低氣溫、日照時數(shù)、平均相對濕度、平均水汽壓、平均風(fēng)速等氣候要素觀測數(shù)據(jù)和經(jīng)緯度、海拔高度等地理數(shù)據(jù)。由于國家生態(tài)科學(xué)數(shù)據(jù)中心資源共享服務(wù)平臺中沒有阿克蘇站以上需求的日尺度氣象資料,所以,本研究需要的氣象資料引用了美國國家海洋和大氣管理局(NOAA)國家環(huán)境信息中心(NCEI)相應(yīng)的日尺度數(shù)據(jù)。
對于Penman-Monteith(PM)公式和GRNN 神經(jīng)網(wǎng)絡(luò)、BP 神經(jīng)網(wǎng)絡(luò),為方便對估算方法的評估,本研究采用同樣的樣本進(jìn)行對比。其中,Penman-Monteith(PM)公式包括了所有樣本的計算,GRNN 神經(jīng)網(wǎng)絡(luò)、BP神經(jīng)網(wǎng)絡(luò)驗(yàn)證集中的30 個樣本在總樣本中隨機(jī)選出。
1.3.1 Penman-Monteith(PM)公式
在蒸散量計算中,彭曼法(Penman-Monteith)基于能量平衡和水汽擴(kuò)散理論,不受作物種類、土壤類型和水汽條件等因素的限制,僅考慮氣候要素的影響,其計算得出的潛在蒸散量與實(shí)測值最為接近,因此被廣泛應(yīng)用到區(qū)域干濕狀況的評價研究中[12]。表達(dá)式如下:
式中,PE 為潛在蒸散量,Δ 表示空氣氣溫為T時的飽和水氣壓斜率,計算方式如(2),本次研究中T 取日平均氣溫,Tmean表示日平均溫度(℃),es表示飽和水氣壓(kPa),ea表示實(shí)際水氣壓(kPa);Rn為地表凈輻射,等于收入短波輻射Rns 和支出的凈長波輻射Rnl 之差;G 為土壤熱通量,一天至十天的時間尺度,其參考草地的土壤熱容量相當(dāng)小,可以忽略不計。γ 為干濕表常數(shù),計算方式如(4),其中P 為大氣壓;u2為2m 高風(fēng)速,uz表示10m 高處風(fēng)速,z 表示高度,取10m。
1.3.2 方法校準(zhǔn)
在日蒸散量計算中,主要對地表凈輻射項(xiàng)的參數(shù)做出調(diào)整。目前對于地表凈輻射有諸多經(jīng)驗(yàn)方法已被廣泛用于估計世界各地的凈輻射,然而,這些經(jīng)驗(yàn)方法需要特定地點(diǎn)的參數(shù)校準(zhǔn)。Xiao 等[13]量化了地表反照率的時空變化以更好地估計中國地區(qū)的凈短波輻射,并基于原位觀測重新校了FAO-56 PM方法的參數(shù)以更好地估計凈長波輻射。此方法也可用于彭曼法(Penman-Monteith)對日蒸散量的計算。地表凈輻射等于收入短波輻射Rns 和支出的凈長波輻射Rnl 之差。對于短波輻射有:
其中,RS為太陽輻射,對于阿克蘇地區(qū)(40°37′N),校準(zhǔn)后有:
其中α′隨月份變化如表1 所示
表1 阿克蘇地區(qū)地表反照率隨月份變化
此外,對于凈長波輻射Rnl 有
其中,σ=4.903×10-9為斯蒂芬-玻爾茲曼常數(shù)(MK·K-4·m-2·d-1)。分別為最高和最低絕對氣溫(K=℃+273.16);ea為實(shí)際蒸汽壓;RS為太陽輻射,RS0為晴空輻射;a、b 為經(jīng)驗(yàn)回歸系數(shù)(無量綱)。
對于阿克蘇地區(qū)a=0.50-0.002×lat=0.419,b=-0.25+0.002×lat=-0.169。所以對于修正后的地表凈輻射項(xiàng)可列為:
1.3.3 神經(jīng)網(wǎng)絡(luò)
(1)GRNN 神經(jīng)網(wǎng)絡(luò)
GRNN 具備很強(qiáng)的非線性映射能力、柔性結(jié)構(gòu)以及較好的容錯性,適用于解決非線性問題。GRNN在逼近能力和學(xué)習(xí)速度上也有很強(qiáng)的優(yōu)勢,網(wǎng)絡(luò)最后收斂于樣本量積聚較多的優(yōu)化回歸面,另外在樣本數(shù)據(jù)較少時,也有一個較好的預(yù)測效果。
GRNN 神經(jīng)網(wǎng)絡(luò)由四層構(gòu)成[14]。如圖1 所示,分別為輸入層、模式層、求和層和輸出層。假設(shè)樣本特征集為:{trx1,trx2,…,trxm},其中trxi=[x1,x2,…xn]。標(biāo)簽集為:{try1,try2,…,trym},其中tryi=[y1,y2…,yk]。
輸入測試樣本,節(jié)點(diǎn)個數(shù)等于樣本的特征維度。模式層中節(jié)點(diǎn)個數(shù)等于訓(xùn)練樣本的個數(shù),第i 個測試樣本trxi與第j 個測試樣本trxj之間的Gauss 函數(shù)取值為:
求和層節(jié)點(diǎn)個數(shù)等于輸出樣本維度加1×(k+1),求和層的輸出為兩部分,第一個節(jié)點(diǎn)輸出模式層輸出的算術(shù)和,其余k 個節(jié)點(diǎn)的輸出為模式輸出的加權(quán)和。假設(shè)對于測試樣本tex,模式層的輸出為{ɡ1,ɡ2,…ɡm(xù)}。
求和層第一個節(jié)點(diǎn)的輸出為:
其余k 個節(jié)點(diǎn)的輸出為:
其中加權(quán)系數(shù)yij為第j 個模式層節(jié)點(diǎn)對應(yīng)的訓(xùn)練樣本的標(biāo)簽的第j 個元素。
輸出層節(jié)點(diǎn)個數(shù)等于標(biāo)簽向量的維度,每個節(jié)點(diǎn)的輸出等于對應(yīng)的求和層輸出與求和層第一個節(jié)點(diǎn)輸出相除。
(2)BP 神經(jīng)網(wǎng)絡(luò)
本次研究還采用了BP 神經(jīng)網(wǎng)絡(luò)(如圖2),其含有輸入層、隱含層和輸出層三個部分。BP 神經(jīng)網(wǎng)絡(luò)使用梯度下降算法[15]。假設(shè)輸入層神經(jīng)元為P=[p1,p2,…,pi],隱含層神經(jīng)元為S=[s1,s2,…,sk],輸出層神經(jīng)元為Y=[y1,y2,…,yj]。另外,表示輸入層第i 個神經(jīng)元連接隱含層第k 個神經(jīng)元的權(quán)值,表示隱含層第k 個神經(jīng)元連接輸出層第j 個神經(jīng)元的權(quán)值。隱含層的激發(fā)函數(shù)為f1,輸出層的激發(fā)函數(shù)為f2,表示隱含層神經(jīng)元閾值,表示輸出層神經(jīng)元閾值,其中,∈(-1,1)。
輸入層各神經(jīng)元與隱含層各神經(jīng)由相應(yīng)的權(quán)值連接,隱含層的第一個神經(jīng)元x1,加權(quán)求和從輸入層每一個神經(jīng)元處得到輸出值,加上閾值,通過激發(fā)函數(shù)f1,得到該神經(jīng)元的輸出值:
然后,輸出層第一個神經(jīng)元y1 接收隱含層每一個神經(jīng)元輸出值,并加權(quán)求和得,加上閾值,通過激發(fā)函數(shù)f2,得到輸出層該神經(jīng)元的輸出值:
(3)評估方法
擬合優(yōu)度指標(biāo)通常用于評價改進(jìn)方法的性能,通常對于此類研究采用Nash-Sutcliffe 系數(shù)(NSE)、平均偏差誤差(MBE)和均方根誤差(RMSE)。表達(dá)式如下[13]:
式中n 為觀測次數(shù);Re為估計數(shù)據(jù);R0為觀測數(shù)據(jù);Rave為觀測數(shù)據(jù)的平均值。Nash-Sutcliffe 系數(shù)取值范圍為-∞~1,其值越接近1,均方根誤差值越小,模型性能越好。平均偏差誤差為正值表示高估了結(jié)果,其為負(fù)值則表示低估了結(jié)果。
表2 為日蒸散量與日最高溫度、日最低溫度、露點(diǎn)溫度、風(fēng)速、日照時長、降雨量等六個氣象要素相關(guān)系數(shù)的統(tǒng)計。其中,p 值表示原假設(shè)為真時得到的樣本觀察結(jié)果或者更極端結(jié)果出現(xiàn)的概率。* 表示有統(tǒng)計學(xué)差異(p<0.05),** 表示差異顯著(p<0.01),顯著性差異。它是統(tǒng)計學(xué)上對數(shù)據(jù)差異性的評價。通常情況下,實(shí)驗(yàn)結(jié)果達(dá)到0.05 水平或0.01 水平,才可以說數(shù)據(jù)間具有差異顯著或是極顯著。
從表2 中可以看出,日蒸散量與其他六個氣象要素量均呈正相關(guān),與日最高溫度、日最低溫度和日平均露點(diǎn)溫度相關(guān)系數(shù)分別為0.3142、0.4338、0.4624,且均達(dá)到0.01 顯著性水平。神經(jīng)網(wǎng)絡(luò)對結(jié)果的預(yù)測如果是建立在具有高度相互影響的因素上,其預(yù)測模型和結(jié)果會相對可靠,綜合彭曼公式和相關(guān)系數(shù)考慮,本研究利用日最高溫度、日最低溫度、日平均露點(diǎn)溫度、風(fēng)速、日照時長、緯度、海拔、日序作為自變量,日蒸散量作為因變量,建立神經(jīng)網(wǎng)絡(luò)模型。
表2 自相關(guān)性分析
如圖3 所示,修正過后彭曼公式對于日蒸散量的估算比修正前要小(MBE 值由8.4428 減小到5.6030),且更接近于真實(shí)測量值。從擬合效果來看,Nash-Sutcliffe 系數(shù)修正前與修正后分別為0.0328與0.0132,能說明結(jié)果接近觀測值的平均值水平,總體結(jié)果可信。同時,修正前后的均方根誤差分別為11.7830 和8.7981。所以總的來說,修正后彭曼公式效果優(yōu)于修正前,對阿克蘇地區(qū)日蒸散量計算的適用性和準(zhǔn)確性相比修正前有所增加。
此次研究使用了一百個樣本,分成70 個訓(xùn)練集與30 個測試集,使用了日最高溫度、日最低溫度、露點(diǎn)溫度、風(fēng)速、日照時長、緯度、海拔、日序等八個變量作為輸入值,日蒸散量作為輸出值。將GRNN 神經(jīng)網(wǎng)絡(luò)擬合結(jié)果與實(shí)際測量值進(jìn)行評估,其Nash-Sutcliffe 系數(shù)為-0.4410,均方根誤差為3.3431,說明結(jié)果接近觀測值的平均值水平,總體結(jié)果可信。另外,測試集中仍有少部分預(yù)測值(4 個)與測量值相比有較大誤差。這涉及到神經(jīng)網(wǎng)絡(luò)的泛化性問題,此次研究的訓(xùn)練樣本數(shù)量較少,導(dǎo)致有少量較大誤差的預(yù)測值產(chǎn)生。
對于BP 神經(jīng)網(wǎng)絡(luò),為取消樣本數(shù)量對擬合效果的誤差,同樣分成70 個訓(xùn)練集與30 個測試集,使用了日最高溫度、日最低溫度、露點(diǎn)溫度、風(fēng)速、日照時長、緯度、海拔、日序等八個變量作為輸入值,日蒸散量作為輸出值。估算結(jié)果與實(shí)際值的Nash-Sutcliffe 系數(shù)為-0.0883,均方根誤差為3.2659,總體結(jié)果可信。其中仍有少量的預(yù)測值與測量值相比有較大誤差。另外可以看出,BP 神經(jīng)網(wǎng)絡(luò)較GRNN 神經(jīng)網(wǎng)絡(luò)對日蒸散量估算有更好的效果。
經(jīng)過對比,BP 神經(jīng)網(wǎng)絡(luò)對于日蒸散量的估算效果優(yōu)于GRNN 神經(jīng)網(wǎng)絡(luò)。所以對于BP 神經(jīng)網(wǎng)絡(luò),本研究做了進(jìn)一步的評估。圖4 顯示神經(jīng)網(wǎng)絡(luò)輸出對訓(xùn)練、驗(yàn)證和測試集的目標(biāo)回歸圖。四幅圖的y=x 線表示目標(biāo)輸出,不同顏色的實(shí)線表示神經(jīng)網(wǎng)絡(luò)輸出。為了完美的配合,數(shù)據(jù)應(yīng)該沿著45 度的線下降??梢钥闯鲇?xùn)練集與驗(yàn)證集輸出值貼近目標(biāo)值,且回歸系數(shù)分別達(dá)到0.94244 和0.94606。同時,測試集回歸系數(shù)為0.6113,效果不如訓(xùn)練集與驗(yàn)證集,本研究認(rèn)為是由數(shù)據(jù)量偏少造成。另外,總體的輸出值與目標(biāo)值也貼近且回歸系數(shù)達(dá)到了0.90871,證明BP 神經(jīng)網(wǎng)絡(luò)對于日蒸散量的估算問題上,有一個很好的擬合效果。
本次研究對彭曼公式中地表凈輻射項(xiàng)做了一個修正,使其更好的服務(wù)于阿克蘇地區(qū),此外對于日蒸散量的計算方法本身,采用了GRNN 和BP 兩種機(jī)器學(xué)習(xí)方法進(jìn)行了擬合計算,發(fā)現(xiàn)BP 神經(jīng)網(wǎng)絡(luò)在解決此類問題上有較高的準(zhǔn)確性。這一研究對阿克蘇地區(qū)的日蒸散量估算、了解極端干旱區(qū)的棉田等作物種植有長遠(yuǎn)的意義。
此外,神經(jīng)網(wǎng)絡(luò)自身擬合準(zhǔn)確性還與數(shù)據(jù)量有關(guān),阿克蘇站觀測數(shù)據(jù)量偏少是本研究一大局限性,所以后續(xù)仍需有大量的觀測數(shù)據(jù)投入到神經(jīng)網(wǎng)絡(luò)模型中。
致謝:本文數(shù)據(jù)來源于國家生態(tài)科學(xué)數(shù)據(jù)中心資源共享服務(wù)平臺(http://www.cnern.org.cn/),感謝此網(wǎng)站提供的阿克蘇站日蒸散量觀測數(shù)據(jù)。