王 慧,李靖瑄,劉小妮,沈麗娟,吳曉文,魯素芬
(1.山東省水文中心,山東 濟南 250000;2.昆明理工大學(xué)津橋?qū)W院建筑工程學(xué)院,云南 昆明 650106;3.河海大學(xué)水文水資源與水利工程科學(xué)國家重點實驗室,江蘇 南京 210098)
土壤含水量是農(nóng)業(yè)和畜牧業(yè)等領(lǐng)域衡量土壤干旱水平的重要指標(biāo)[1],對作物生長與區(qū)域生態(tài)建設(shè)具有重要的影響。由于土壤水的特殊性,在實際應(yīng)用中土壤水分測定需要投入大量的人力物力,而且土壤水時空變化的復(fù)雜性使得監(jiān)測難度加大,因此,對土壤水含量進行合理有效的數(shù)值模擬及預(yù)報有著重要的理論及實際意義[2- 3]。目前,關(guān)于土壤水含水量的模擬模型種類繁多,遵循原理各異,主要分為物理性模型和隨機性模型[4- 5]。郝振純等[6]研究了2003—2012年山西省土壤含水量的時空變化規(guī)律,僅探討了降水和氣溫2個氣象因子對土壤含水量變化的影響;侍永樂等[7]基于多元線性回歸與BP神經(jīng)網(wǎng)絡(luò)方法建立了土壤相對濕度預(yù)測模型,發(fā)現(xiàn)降水、氣溫、日照時數(shù)、風(fēng)速、相對濕度、蒸發(fā)量等氣象因子與土壤相對濕度存在相關(guān)關(guān)系;張祥星等[8]應(yīng)用數(shù)理統(tǒng)計方法研究發(fā)現(xiàn)氣象因子與不同深度的土壤含水量相關(guān)系數(shù)年內(nèi)變化較大,表明不同深度的土層含水量存在一定的差異性。土壤水分的變化在不考慮人工管理(灌溉、翻耕)條件下,主要是由降水、氣溫、風(fēng)速、濕度、日照時數(shù)等氣象要素的變化引起的[9- 10]。以往研究表明,土壤水分變化與降水、氣溫等氣象因子存在強烈的耦合關(guān)系[11]。因此,對土壤含水量的模擬及預(yù)報實質(zhì)上是基于氣象因子對土壤水分變化的綜合影響進行模擬[12- 13]。
本文以山西省為研究區(qū)域,構(gòu)建基于降水、氣溫、日照時數(shù)、風(fēng)速、相對濕度等多氣象因子的多元線性回歸、BP神經(jīng)網(wǎng)絡(luò)和多元非線性回歸3種隨機性模型,對山西省10、20、40cm土壤含水量進行模擬分析。因此本文構(gòu)建的模型可以為該地區(qū)合理安排灌溉提供科學(xué)依據(jù),具有一定的實用價值。
山西總體地勢輪廓呈“兩山夾一川”形勢,東西兩側(cè)是山地和丘陵,中部自東北至西南走向為串珠式沉陷盆地和平原[14](如圖1所示)。境內(nèi)地形地貌十分復(fù)雜,山地、丘陵、高原、盆地等均有分布,大部分地區(qū)海拔在1500m以上。土壤類型主要為棕壤。全省降水受地形影響很大,山區(qū)較多,盆地較少。日照充足,熱量資源較豐富,但災(zāi)害性天氣較多,“十年九旱”[15]。
圖1 山西省土壤墑情與氣象站點分布圖
本文采用的土壤含水量資料與氣象資料來源于1970—2012年山西省7個土壤墑情監(jiān)測站及其鄰近氣象站的觀測數(shù)據(jù),各墑情站與氣象站詳細信息見表1。土壤墑情監(jiān)測站觀測期為每年的3—11月份,土壤含水量采用烘干法測定,取樣深度分別為10、20、40cm 3個層次,取樣時間為每月的1、11、21日,每層的月平均值分別取本月各測次的算術(shù)平均,各測點的土壤含水量平均值按3點取樣法計算[16]。本文模擬計算采用的土壤含水量為旬值,降水為旬和,氣溫、日照時數(shù)、風(fēng)速和相對濕度為旬平均值。
表1 山西省墑情站與氣象站信息表
本文基于降水、氣溫、日照時數(shù)、風(fēng)速、相對濕度、土壤含水量等變量,構(gòu)建了3種隨機模型:多元線性回歸模型、BP神經(jīng)網(wǎng)絡(luò)模型和多元非線性回歸模型[17]。根據(jù)模型輸入要素的不同,多元非線性回歸模型分為A、B、C 3種類型,各模型輸入輸出要素見表2,并采用相關(guān)系數(shù)和相對誤差作為3種模型評價指標(biāo)。
表2 3種隨機模型及其輸入要素表
多元線性回歸是確定2種或2種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計分析方法。由于其結(jié)構(gòu)簡單,易于操作,被廣泛應(yīng)用于社會、經(jīng)濟、技術(shù)及眾多自然科學(xué)領(lǐng)域的研究中[18],如張敬超等[19]基于多元線性回歸模型分析了內(nèi)蒙古東北部鄂溫克族自治旗1990—2017年土壤含水量的動態(tài)變化與氣候因子之間的相關(guān)關(guān)系。山西省面積較大,地形地勢多變,針對山西省不同地區(qū)不同土壤深度的土壤含水量建立基于氣象因子的多元線性回歸方程,模擬土壤含水量與氣候要素的線性關(guān)系。根據(jù)土壤墑情站與氣象站的實測資料,計算得到7個墑情站點的多元線性回歸方程,見表3。
表3 多元線性回歸模型對各層土壤含水量的模擬及評價
由表3可知,相關(guān)系數(shù)均通過了顯著性檢驗,10cm土層含水量的擬合效果較好,其次是20cm土層,40cm土層擬合效果最差,這是因為表層土壤水受氣象因素的影響大,而深層土壤水受到的影響較小。但相對誤差<20%的所占比例并不高,其中,界河鋪、義棠和柴莊站的相對誤差小于20%的比例比較低,均小于54%,3個站點分別位于山西土壤含水量較低的忻定盆地、太原盆地和臨汾盆地;油房站相對誤差小于20%的比例稍高,該站位于南部沁河流域;長子和榆社站相對誤差小于20%的比例較高,長子站位于土壤含水量整體較高的長治盆地,榆社在長治盆地北側(cè)。說明該模型在土壤含水量比較少的地區(qū)適用性較差,在土壤含水量比較多的地區(qū)擬合效果較好。汾河二壩站模型的2項評價指標(biāo)在各站中都是最差的,而其土壤含水量較高,土壤類型為沙土,其他6站為壤土,說明該模型在壤土地區(qū)的適用性要優(yōu)于沙土。
考慮到土壤墑情與氣象因素的關(guān)系復(fù)雜,并不是單純的線性關(guān)系,而BP神經(jīng)網(wǎng)絡(luò)可以通過自己學(xué)習(xí)和反復(fù)調(diào)整訓(xùn)練,使模型的輸出結(jié)果與期望輸出結(jié)果的誤差滿足一定要求[20],故選擇BP神經(jīng)網(wǎng)絡(luò)進行模擬。其具體結(jié)果見表4。
表4 BP神經(jīng)網(wǎng)絡(luò)模型對各層土壤含水量的模擬及評價
由表4可知,BP神經(jīng)網(wǎng)絡(luò)模型模擬的10cm土層含水量的擬合效果較好,這與多元線性回歸模型模擬結(jié)果一致,通過對比相關(guān)系數(shù)與相對誤差2項評價指標(biāo),可知BP神經(jīng)網(wǎng)絡(luò)模型在山西省的應(yīng)用效果略優(yōu)于多元線性回歸模型,與李柳陽等[21]研究結(jié)果基本一致,說明土壤含水量與某些氣象因子存在非線性的關(guān)系。
由前文可知,在輸入變量不引入前期土壤水的情況下,BP神經(jīng)網(wǎng)絡(luò)模型與多元線性回歸模型模擬的效果并不理想,不能很好的用于實踐,考慮到土壤含水量與某些氣象因子存在非線性的關(guān)系,所以嘗試應(yīng)用非線性回歸方法[22],同時引入前期土壤水作為自變量,對土壤含水量進行滾動預(yù)報。這種方法既可以保證入選的自變量相互獨立,又可解決自變量與因變量并非均為線性關(guān)系的問題。根據(jù)輸入變量的不同,本文把多元非線性回歸模型分為A、B、C 3類,模型要素見表2,計算得到的多元非線性回歸方程見表5(為節(jié)約篇幅只給出模型B、C公式),評價指標(biāo)見表6。
(續(xù)表)
由表6可知,模型B的精度高于模型A,其模擬的土壤水平均值效果最優(yōu),相關(guān)系數(shù)都大于0.7;均是榆社、長子和油房站的效果較好,另外4個墑情站次之。從相對誤差來看,各站土壤水平均值模擬效果最優(yōu),10cm土層模擬效果最差。多數(shù)站點40cm土層模擬效果優(yōu)于20cm土層。模型C引入10cm土層土壤水做自變量,結(jié)果發(fā)現(xiàn)評價指標(biāo)均優(yōu)于模型A、B;相關(guān)系數(shù)都大于0.88,相對誤差小于20%的比例都大于80%。20cm土層的模擬效果很好,40cm土層的模擬效果一般.
表6 多元非線性回歸模型A、B、C對各層土壤含水量的模擬評價
為進一步對比分析模型B、C對土壤含水量的模擬過程變化,本文選擇20cm土層模擬效果較好的榆社、長子和汾河二壩站,土壤含水量變化過程線如圖2所示。由圖2可知,模型C模擬值的過程線要比模型B擬合的更好。榆社站模型C過程線整體上擬合的更好,有些點幾乎和實測值重合,20cm模擬值中,有些最小值比實測值小。長子站模擬值與實測過程線幾乎重合,20cm和平均值的相關(guān)系數(shù)分別為0.882和0.924,相對誤差小于20%的比例分別為93.4%和95.9%。汾河二壩站雖然各項評價指標(biāo)都有很明顯的提升(見表6),但從對比圖看出,模型C在有些年份波動太大,擬合較模型B差,比如2000、2001和2002年。在2003、2004和2012年擬合明顯比模型B好。(為節(jié)約篇幅,只給出部分過程線圖)榆社站43年土壤含水量均值為15.3%,與鄰近氣象站的距離最近,在各個模型的應(yīng)用中,其相關(guān)系數(shù)一直是最優(yōu)的站點,相對誤差小于20%的比例僅次于長子站。長子站土壤水均值為19.1%,在7個站點中含水量最高,且各層含水量常年相對穩(wěn)定,其相對誤差最優(yōu),相關(guān)系數(shù)僅次于榆社站。汾河二壩站土壤水均值為16.9%,但從圖2(c)可知,土壤水年內(nèi)波動較大,土壤類型為沙土,不利于土壤水的保持。界河鋪站土壤水均值為11.3%,在7個站點中含水量最少。汾河二壩站用多元線性回歸模型和BP神經(jīng)網(wǎng)絡(luò)模型效果最不好,其次為界河鋪站。在引入前期土壤水后,汾河二壩的模擬效果提高,界河鋪為最不好站點。
圖2 土壤含水量變化過程線
與多元線性回歸模型和BP神經(jīng)網(wǎng)絡(luò)模型2種模型相比,同一墑情站點,多元非線性回歸模型引入前期土壤水為自變量后,模擬精度明顯提高,尤其是20cm土層和40cm土層提高幅度更明顯,且各項評價指標(biāo)優(yōu)于10cm土層。多元非線性回歸模型在長治盆地和沁河流域等土壤含水量高的地區(qū),模擬效果比較好,在忻定盆地、太原盆地和臨汾盆地等土壤水較少的地區(qū),模擬效果略差。這與前兩種模型結(jié)論基本一致。且土壤類型對模型的模擬效果也有一定影響,含水量相差不多的情況下,3種模型對土壤類型為壤土的站點模擬效果要優(yōu)于沙土站點。即汾河二壩站為沙土,土壤含水量又比較高,其他幾個均為壤土,含水量多數(shù)低于汾河二壩,但汾河二壩的模擬效果相對比較差。
通過改變各模型的輸入要素,不斷改進多元線性回歸模型、BP神經(jīng)網(wǎng)絡(luò)模型和多元非線性回歸模型,雖然模擬精度顯著提高,但仍存在一些問題。本文就氣象資料與模型本身對模擬精度的影響進行討論分析。
(1)氣象資料。站點位置的遷移對氣象要素的影響很大,鄰近氣象站降水量很大,墑情站的降水有可能比較小,甚至為0;兩類站點有可能出現(xiàn)風(fēng)向完全相反等情況。因此移用鄰近氣象站的氣象資料是模型誤差的一個很重要的原因。
(2)墑情站資料。墑情站點的具體情況缺少記載,比如觀測前是否有灌溉,如果有灌溉,且無降水時,觀測值肯定要大于模擬值;站點43年中下墊面是否有變化,植被的有無直接影響土壤含水量的變化。這些都可以導(dǎo)致相對誤差小于20%的百分比降低。
(3)輸入變量。多元線性回歸模型和BP神經(jīng)網(wǎng)絡(luò)模型輸入變量只有氣象要素,缺少前期土壤水這一重要影響因子。一定程度降低了模型應(yīng)用效果。
(4)隨機模型的局限性。隨機性模型中的參數(shù)一般沒有具體的物理意義,不能反映出土壤水與影響因素之間的物理關(guān)系,而要想得到更加準(zhǔn)確的預(yù)報,必須同時考慮其它動態(tài)影響因素的作用,這是此類模型主要的局限性,必然導(dǎo)致模擬精度不可能很高。
本文基于氣象因子構(gòu)建了多元線性回歸模型、BP神經(jīng)網(wǎng)絡(luò)模型和多元非線性回歸模型,通過構(gòu)建不同輸入要素的土壤含水量模型,以此提高多元非線性回歸模型對山西省土壤含水量的模擬能力。同一隨機性模型在山西省各個站點的應(yīng)用情況不一,不同模型的應(yīng)用效果分布規(guī)律一致。結(jié)論如下:
(1)3種模型中多元非線性回歸模型模擬精度較高,各項評價指標(biāo)明顯增加,模擬與實測值的過程線擬合的也比較好。模型引入前一旬土壤水與前一、兩旬土壤水均引入的模擬效果差異不大,且前一、兩旬土壤水均引入后略優(yōu)。BP神經(jīng)網(wǎng)絡(luò)模型的模擬效果略優(yōu)于多元線性回歸模型,兩者對10cm土層擬合較好。
(2)3種模型模擬結(jié)果均表現(xiàn)為土壤含水量高的站點模擬的效果要優(yōu)于土壤含水量偏低的站點,且土壤類型為壤土的站點模擬效果要優(yōu)于土壤類型為沙土的站點。
(3)根據(jù)歷史土壤水和氣象資料建立多元非線性回歸模型,本文以10cm土層土壤水作為因子之一,采用滾動預(yù)報對20、40cm土層的土壤水進行模擬預(yù)報,模擬結(jié)果較好,可為土壤水資料同化提供一種新的借鑒,在僅觀測地表土壤水的地區(qū)可以模擬預(yù)報下層土壤水變化。