解 雪,陳軍鋒,鄭秀清,薛 靜,翟小艷,杜鑫鈺,魏一釗
(太原理工大學(xué)水利科學(xué)與工程學(xué)院,太原 030024)
中國(guó)季節(jié)性凍土區(qū)大多屬于干旱半干旱地區(qū)[1,2],干旱少雨、蒸發(fā)強(qiáng)烈加劇了該地區(qū)的水資源短缺情勢(shì)。土壤蒸發(fā)作為土壤水分消耗的主要途徑,并沒(méi)有直接參與作物生長(zhǎng),屬無(wú)效水分損失[3,4]。隨著水資源短缺的加劇,季節(jié)性凍融地區(qū)的土壤蒸發(fā)已引起人們的重視,研究季節(jié)性凍融地區(qū)的土壤蒸發(fā)及其影響因素,準(zhǔn)確估算凍融土壤蒸發(fā)量對(duì)提高干旱半干旱地區(qū)水分利用效率具有重要意義。
Feng等[5]采用自制微型蒸發(fā)器,通過(guò)凍融期大田實(shí)測(cè)數(shù)據(jù)研究了不同粒徑砂層覆蓋下的土壤蒸發(fā)規(guī)律,揭示了地表覆砂對(duì)土壤蒸發(fā)的影響。由于凍融期土壤蒸發(fā)量相對(duì)較小,且土壤蒸發(fā)量的測(cè)定易受暴風(fēng)、低溫寒冷等惡劣天氣干擾,蒸發(fā)量的連續(xù)測(cè)定較為困難[6],所以學(xué)者們多采用模擬研究的方法對(duì)凍融期的土壤蒸發(fā)進(jìn)行研究。李瑞平[7]等基于SHAW模型研究了秋澆定額、秋澆時(shí)間對(duì)凍融期土壤累積蒸發(fā)量的影響;雷志棟[8]等基于SHAW模型模擬分析了地下水位埋深、負(fù)積溫對(duì)凍結(jié)期潛水蒸發(fā)量的影響;陳軍鋒[9]等基于SHAW模型模擬了不同潛水位埋深下的土壤蒸發(fā)規(guī)律,揭示了不同潛水位埋深和土壤質(zhì)地對(duì)土壤蒸發(fā)的影響。目前對(duì)凍融土壤蒸發(fā)的機(jī)理進(jìn)行了大量研究,揭示了影響凍融土壤蒸發(fā)的因素,然而較為準(zhǔn)確的預(yù)報(bào)凍融土壤蒸發(fā)量仍有一定的困難。
近年來(lái),人工智能方法快速發(fā)展,具有能很好地解決小樣本、非線性,高緯度和局部最小值問(wèn)題[10]特點(diǎn)的支持向量機(jī)被廣泛應(yīng)用于水文預(yù)報(bào)[11-13],地下水水質(zhì)監(jiān)測(cè)[14,15],地下水水位預(yù)報(bào)[16],土壤水力學(xué)參數(shù)預(yù)測(cè)[17]。但支持向量機(jī)的預(yù)測(cè)性能依賴于懲罰參數(shù)和核參數(shù)的選取,而粒子群算法是一種運(yùn)算速度快,局部搜索能力強(qiáng),求解精度高[18,19]的尋優(yōu)算法,適合于支持向量機(jī)模型的參數(shù)優(yōu)化。在季節(jié)性凍融期,影響土壤蒸發(fā)的因素復(fù)雜,耦合性強(qiáng),會(huì)使得預(yù)測(cè)凍融土壤蒸發(fā)量的支持向量機(jī)模型過(guò)于復(fù)雜,降低預(yù)測(cè)準(zhǔn)確率。此外,主成分分析能有效地提取數(shù)據(jù)的非線性特征信息,簡(jiǎn)化數(shù)據(jù)量,并保證原始數(shù)據(jù)的完整性。因此,本文采用主成分分析提取凍融土壤蒸發(fā)量影響因素的主成分,采用凍融期大田土壤蒸發(fā)實(shí)測(cè)數(shù)據(jù)和氣象站監(jiān)測(cè)資料,建立基于粒子群算法優(yōu)化支持向量機(jī)的模型,進(jìn)行凍融土壤蒸發(fā)預(yù)報(bào)。
1.1.1 研究區(qū)概況
研究區(qū)位于山西省水文水資源勘測(cè)局太谷均衡試驗(yàn)站。該試驗(yàn)站位于山西中部,晉中盆地南部,地理位置為112°30′E、37°26′N。試驗(yàn)區(qū)海拔高度777 m。屬暖溫帶大陸性干旱與半干旱氣候,春季風(fēng)大雨少,冬季寒冷少雪。多年平均氣溫9.9 ℃,多年平均降水量415.2 mm,且主要集中在6-9月份。歷史上最大凍土深度92 cm。多年平均相對(duì)濕度74%。多年平均風(fēng)速為0.9 m/s[20]。
1.1.2 測(cè)定項(xiàng)目
田間試驗(yàn)于2017年11月至2018年3月在山西省太谷均衡試驗(yàn)站進(jìn)行。凍融土壤蒸發(fā)量采用微型蒸發(fā)器測(cè)定,地表土壤含水率采用烘干稱重的方法測(cè)定。地表土壤溫度采用預(yù)埋式熱敏電阻進(jìn)行監(jiān)測(cè),監(jiān)測(cè)時(shí)間與地表土壤含水率,土壤蒸發(fā)量同步,均為7 d/次(8∶00-9∶00 am),凍融期間共監(jiān)測(cè)17次。氣溫、相對(duì)濕度、風(fēng)速。氣壓均由地面氣象觀測(cè)站自動(dòng)監(jiān)測(cè),監(jiān)測(cè)時(shí)間為每天8∶00,14∶00和20∶00。
1.1.3 樣本數(shù)據(jù)集的構(gòu)建
根據(jù)2017年11月至2018年3月監(jiān)測(cè)的太陽(yáng)輻射(x1),日平均氣溫(x2),地表土壤溫度(x3),地表土壤含水率(x4),風(fēng)速(x5),氣壓(x6),相對(duì)濕度(x7),降水量(x8),水面蒸發(fā)量(x9)和實(shí)測(cè)的凍融土壤蒸發(fā)量構(gòu)成本文的樣本數(shù)據(jù)集。由于土壤蒸發(fā)量,地表土壤溫度和地表土壤含水率的樣本數(shù)據(jù)以周為單位監(jiān)測(cè),樣本數(shù)量較少,因此采用線性內(nèi)插法生成123組以日為單位的樣本數(shù)據(jù),見(jiàn)表1。
由于季節(jié)性凍融期土壤水分的相變及其與溫度的強(qiáng)烈耦合作用,使得其影響因素頗為復(fù)雜。結(jié)合實(shí)測(cè)資料,本文分析的凍融土壤蒸發(fā)影響因素主要包括太陽(yáng)輻射(x1),日平均氣溫(x2),地表土壤溫度(x3),地表土壤含水率(x4),風(fēng)速(x5),氣壓(x6),相對(duì)濕度(x7),降水量(x8),水面蒸發(fā)量(x9)等。若使用多個(gè)影響因素作為輸入變量進(jìn)行粒子群算法優(yōu)化后的支持向量機(jī)建模,會(huì)提高模型的復(fù)雜度,從而使得計(jì)算量多且冗余的信息也較多。而主成分之間是相互獨(dú)立的,由主成分組成的輸入空間不存在自相關(guān)性[21],因而有效地簡(jiǎn)化了建模時(shí)的復(fù)雜度,提高了模擬精度。
表1 凍融土壤蒸發(fā)樣本數(shù)據(jù)Tab.1 Sample data of freeze-thaw soil evaporation
1.2.1 主成分分析
主成分分析(Principle Component Analysis)PCA是將多個(gè)指標(biāo)化為少數(shù)幾個(gè)綜合指標(biāo)的統(tǒng)計(jì)分析方法,旨在利用降維的思想,將多個(gè)具有相關(guān)性的原始變量進(jìn)行線性組合成互不相關(guān)的綜合因子即主成分[21],簡(jiǎn)化數(shù)據(jù)量的同時(shí)并保證原始數(shù)據(jù)的完整性。
主成分分析的基本操作步驟如下:設(shè)數(shù)據(jù)集有n個(gè)樣本,m個(gè)變量。
(1)為消除量綱及數(shù)量級(jí)對(duì)分析結(jié)果的影響,首先將原始變量數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理:
(1)
(2)
(3)
(4)計(jì)算主成分值Fj:Fj=Puj。
通過(guò)主成分分析,選取累積貢獻(xiàn)率大于85%前k個(gè)主成分,并將前k個(gè)主成分代替原始數(shù)據(jù)進(jìn)行分析和建模。
1.2.2 粒子群優(yōu)化算法
粒子群算法(Particle Swarm Optimization) PSO是一種基于群體智能與適應(yīng)度的全局優(yōu)化算法,其基本特點(diǎn)是一種針對(duì)種群的并行搜索策略[22,23]。此算法中初始狀態(tài)為一群粒子,每一個(gè)粒子向量代表一個(gè)SVM模型,該模型對(duì)應(yīng)不同的C和g,即每一個(gè)粒子代表一個(gè)潛在最優(yōu)解。粒子的特性包括位置,速度和適應(yīng)值。粒子在尋優(yōu)解的運(yùn)動(dòng)時(shí),通過(guò)跟蹤個(gè)體極值和群體極值更新自己的位置,相應(yīng)的適應(yīng)度值也隨粒子的位置更新而更新。粒子的速度和位置更新公式為:
(4)
(5)
1.2.3 支持向量機(jī)
支持向量機(jī)SVM是由Vapnik V等人根據(jù)統(tǒng)計(jì)學(xué)理論提出的一種新的通用的學(xué)習(xí)方法,并且起初SVM是為了研究線性可分的問(wèn)題提出的[24-26]。隨著回歸預(yù)測(cè)問(wèn)題的引入,Vapnik等人在SVM分類的基礎(chǔ)上引入了不敏感的損失函數(shù),從而得到了具有較好性能和效果的回歸型支持向量機(jī)[27],根據(jù)有限的樣本可以進(jìn)行有效的回歸預(yù)測(cè)。設(shè)給定訓(xùn)練樣本集:{(xi,yi)|i=1,2,…,n},n表示數(shù)據(jù)樣本的個(gè)數(shù)。其中xi為輸入變量的值:xi=xi1,xi2,…,xim;yi為對(duì)應(yīng)的輸出變量。
SVM的回歸預(yù)測(cè)模型數(shù)學(xué)表達(dá)函數(shù)為:
(6)
exp(-g‖xi-xj‖2)g>0
(7)
式中:g為核參數(shù)。
(8)
式中:C為懲罰參數(shù)。
1.2.4 基于主成分分析和粒子群優(yōu)化的支持向量機(jī)模型的構(gòu)建
季節(jié)性凍融期,太陽(yáng)輻射、日平均氣溫和地表土壤溫度是影響土壤凍融過(guò)程的主要因素,也是凍融土壤蒸發(fā)所需的重要熱量來(lái)源。土壤凍結(jié)期,隨著太陽(yáng)輻射的逐漸降低,氣溫和地溫隨之下降,表層土壤形成凍層,地表土壤含水率降低,蒸發(fā)速率降低,蒸發(fā)量隨之減少。水面蒸發(fā)量是表征凍融土壤蒸發(fā)外界條件的主要因素,水面蒸發(fā)量越大,表明當(dāng)前的氣象條件越利于蒸發(fā)。相對(duì)濕度是影響凍融土壤蒸發(fā)的另一重要因素,土壤凍結(jié)穩(wěn)定階段,密實(shí)的土壤凍層阻礙了地表土壤水分和深層土壤水的聯(lián)系,氣溫較低且僅有少量的液態(tài)水分,地表土壤蒸發(fā)只能以水汽的形式進(jìn)行[28]。在這種情況下,如果相對(duì)濕度越高,大氣中的水汽含量越多,水汽就越接近飽和,從而增大空氣中氣壓。地表附近相對(duì)濕度梯度和氣壓梯度越大,土壤蒸發(fā)便會(huì)越大。而風(fēng)速能夠加快地表土壤附近的空氣流動(dòng),風(fēng)速越大,空氣交換越頻繁,地表附近的飽和空氣狀況被削弱,從而促進(jìn)土壤蒸發(fā)。降水量是增加凍融土壤蒸發(fā)的重要因素之一,降水量增加了土壤蒸發(fā)的水分來(lái)源,從而增大了土壤蒸發(fā)。
選擇影響凍融土壤蒸發(fā)的9個(gè)主要因素,包括太陽(yáng)輻射(x1),日平均氣溫(x2),地表土壤溫度(x3),地表土壤含水率(x4),風(fēng)速(x5),氣壓(x6),相對(duì)濕度(x7),降水量(x8)和水面蒸發(fā)量(x9)代入 (1) 式進(jìn)行數(shù)據(jù)的歸一化處理,并將歸一化處理后的結(jié)果輸入SPSS軟件進(jìn)行主成分分析。
利用SPSS軟件分析得到主成分對(duì)凍融土壤蒸發(fā)量影響因素的樣本數(shù)據(jù)解釋的特征值和累積方差貢獻(xiàn)率(圖1)。由圖1可知,前3個(gè)主成分(F1, F2, F3)的累積貢獻(xiàn)率高達(dá)86.27%,表明前3個(gè)主成分可以概括原始數(shù)據(jù)中9個(gè)變量的絕大部分信息。
圖1 主成分分析結(jié)果Fig.1 Results of analysis by PCA
各影響因素與對(duì)主成分之間的關(guān)系見(jiàn)表2,主成分得分系數(shù)矩陣表示了各影響因素與提取前3 個(gè)主成分的線性關(guān)系[21],由表2可見(jiàn),太陽(yáng)輻射(x1),日平均氣溫(x2),地表土壤溫度(x3),水面蒸發(fā)量(x9),氣壓(x6)對(duì)F1主成分較其他因素所占的比重較大,因此F1可解釋為是由太陽(yáng)輻射(x1),日平均氣溫(x2),地表土壤溫度(x3),水面蒸發(fā)量(x9),氣壓(x6)構(gòu)成的綜合因子;F2可看成是由相對(duì)濕度(x7)和地表土壤含水率(x4)構(gòu)成的綜合因子;主成分F3為降水量(x8)和風(fēng)速(x5)組成的綜合因子。將提取的前3個(gè)主成分作為粒子群算法優(yōu)化支持向量機(jī)模型的輸入變量,以預(yù)測(cè)凍融土壤蒸發(fā)量。
表2 主成分得分系數(shù)矩陣Tab.2 Score coefficient weight matrix of principle component
本文選取樣本數(shù)據(jù)中的100組數(shù)據(jù)進(jìn)行模型的訓(xùn)練,其余23組作為模型的驗(yàn)證。粒子群算法的參數(shù)設(shè)定為粒子種群大小為20,最大迭代次數(shù)為200,粒子適應(yīng)度函數(shù)為mse函數(shù)。經(jīng)粒子群算法優(yōu)化后,得到SVM模型的最佳參數(shù)值(C=66.870 7,g=2.397 9)。利用LIBSVM工具箱作為SVM建模的基礎(chǔ),基于MATLABR2017a進(jìn)行編程訓(xùn)練,從而建立的SVM訓(xùn)練模型結(jié)構(gòu)如式(7)所示:
Model = svmtrain (P,T,option)
(7)
式中:Model為本文建立的SVM訓(xùn)練模型;svmtrain為L(zhǎng)IBSVM中的SVM訓(xùn)練函數(shù);P為樣本輸入值;T為樣本期望輸出值;option為SVM模型的參數(shù)及其取值,包括s,t,p,C,g。s表示SVM的類型。本文s為3,采用的是SVM回歸模型;t表示核函數(shù)的類型,本文t為2,選用RBF函數(shù);p為SVM的損失函數(shù),本文取0.01;C為懲罰因子,g為核函數(shù)的參數(shù)。
將主成分提取的前3個(gè)主成分作為自變量,凍融期土壤蒸發(fā)量作為因變量,代入上述訓(xùn)練好的主成分分析-粒子群優(yōu)化的支持向量機(jī)模型(PCA-PSO-SVM)網(wǎng)絡(luò),對(duì)凍融期土壤蒸發(fā)量變化進(jìn)行預(yù)測(cè),得到的訓(xùn)練集和驗(yàn)證集結(jié)果見(jiàn)圖2。
圖2 凍融土壤蒸發(fā)量預(yù)測(cè)值和實(shí)測(cè)值對(duì)比Fig.2 Comparison of forecast and measured values of freeze-soil evaporation
從圖2可以看出,在訓(xùn)練模型結(jié)果中,模型的模擬值與實(shí)測(cè)值基本一致,平均相對(duì)誤差達(dá)到12.355 6%,決定系數(shù)R2為0.949 8(表3)說(shuō)明模型的訓(xùn)練精度高,樣本數(shù)據(jù)集的訓(xùn)練效果較好。在檢驗(yàn)?zāi)P推陂g,模型的預(yù)測(cè)值和實(shí)測(cè)值的平均相對(duì)誤差達(dá)到9.870 4%,達(dá)到誤差精度要求[29],決定系數(shù)R2為0. 951 3,說(shuō)明模型的泛化性能效果較好,預(yù)測(cè)可信度較高,結(jié)果誤差分析見(jiàn)表3。
由以上模型的訓(xùn)練效果及檢驗(yàn)效果可知,采用主成分分析-粒子群算法優(yōu)化后的支持向量機(jī)模型模擬預(yù)報(bào)的凍融土壤蒸發(fā)量,得到的模擬值、預(yù)測(cè)值與實(shí)際值的平均相對(duì)誤差均小于20%,說(shuō)明了模型具有較高的模擬精度,泛化能力較好,可用于凍土蒸發(fā)量的預(yù)報(bào)。
本文將主成分分析法和粒子群算法引入到支持向量機(jī)模型的參數(shù)優(yōu)化,研究成果為凍融土壤蒸發(fā)量的預(yù)測(cè)提供了新的思路和技術(shù)依據(jù)。
(1)應(yīng)用主成分分析法對(duì)凍融期日平均氣溫、太陽(yáng)輻射、相對(duì)濕度、降水量、風(fēng)速、水面蒸發(fā)、水氣壓以及地表土壤溫度和地表土壤含水率等9個(gè)影響凍融土壤蒸發(fā)量的因素進(jìn)行了降維分析,消除了各影響因素間的冗余與相關(guān)性,提取了更具有針對(duì)性的3個(gè)主成分,3個(gè)成分的累積貢獻(xiàn)率達(dá)到86.27%。
表3 結(jié)果誤差分析表Tab.3 The results error analysis of PCA-PSO-SVM model
(2)建立的主成分分析-粒子群算法優(yōu)化支持向量機(jī)的預(yù)報(bào)模型能準(zhǔn)確地進(jìn)行凍融土壤蒸發(fā)量預(yù)報(bào),模型訓(xùn)練集中模擬值和實(shí)測(cè)值的平均相對(duì)誤差為12.355 6%,決定系數(shù)R2為0.949 8;驗(yàn)證集中預(yù)測(cè)值和實(shí)測(cè)值的平均相對(duì)誤差為9.870 4%,決定系數(shù)R2為0.951 3。平均相對(duì)誤差均小于20%,決定系數(shù)均大于0.9,證明了所建模型的可行性。文中的研究成果為凍融土壤蒸發(fā)量的獲取提供了新的思路與技術(shù)支撐。