關(guān)鍵詞:引水沖淤;沖淤需水量;支持向量機(jī);自適應(yīng)粒子群優(yōu)化;敏感性分析
中圖分類號:TV92 文獻(xiàn)標(biāo)識碼:A 文章編號:1001-9235(2024)12-0114-08
江蘇沿海地區(qū)海岸線長達(dá)954 km,濱海河網(wǎng)地勢低平,入海通道水流運動復(fù)雜[1]。為了防止海水入侵,保障南水北調(diào)東線水資源能夠高效灌溉農(nóng)田和維持保護(hù)生態(tài)環(huán)境,里下河地區(qū)已建成多座中、大型擋潮調(diào)節(jié)閘[2](圖1為里下河地區(qū)沿海五大港平面圖)。然而擋潮閘的設(shè)置截斷了潮汐沿河道向內(nèi)陸的自然漲落過程,加重了閘下港道的淤積進(jìn)程,大多數(shù)閘口的淤積都比較嚴(yán)重[3],亟待調(diào)度補(bǔ)水沖淤保港。
近年來,入海港道的沖淤保港研究受到了廣泛關(guān)注。朱建英等[4]通過收集歷史數(shù)據(jù)和進(jìn)行沖淤實驗,著重剖析了里下河地區(qū)主要入海通道在工情發(fā)生變化后的沖淤特點;朱思諭等[5]采用實測資料結(jié)合數(shù)學(xué)模型,定量評估鹽城濱海港規(guī)劃對周邊水流及泥沙分布的影響;隨著計算機(jī)模型的進(jìn)步,鞠彬等[6]通過MIKE11模型構(gòu)建水動力-泥沙耦合模型,模擬計算了新洋港的沖淤保港需水量;匡翠萍等[7]使用MIKE21模型,研究了潮流、波浪與泥沙的交互作用及其對河口區(qū)域演變的影響。盡管當(dāng)前的研究已取得了顯著成果,但在實際引水調(diào)度層面上仍顯不足。一方面,在對工情、水情變化的響應(yīng)上,現(xiàn)有研究往往局限于特定情景,缺乏適應(yīng)性強(qiáng)、普適性高的分析模型。另一方面,傳統(tǒng)數(shù)學(xué)模擬與物理模型在準(zhǔn)確性方面取得了一定成績,但處理大數(shù)據(jù)的效率較低,缺乏快速建模的能力,不能充分滿足高效預(yù)測與即時決策的要求。
機(jī)器學(xué)習(xí)算法已成為解決水資源領(lǐng)域復(fù)雜問題的新趨勢,特別是支持向量機(jī)(Support Vector Machine, SVM)因其在非線性建模以及處理高維數(shù)據(jù)上的高效性,已被廣泛應(yīng)用于水文預(yù)測、水質(zhì)評價等水資源管理任務(wù)[8]。與傳統(tǒng)方法相比,機(jī)器學(xué)習(xí)算法無需復(fù)雜的物理機(jī)制設(shè)定,能夠直接從數(shù)據(jù)中學(xué)習(xí)規(guī)律,并預(yù)測未來的變化趨勢。為了進(jìn)一步提高算法精確度和泛化能力,本文引入了自適應(yīng)粒子群優(yōu)化算法(Adaptive Particle Swarm Optimization, APSO),作為參數(shù)尋優(yōu)工具,以期在優(yōu)化SVM參數(shù)配置的同時提升預(yù)測性能。APSO算法在多個優(yōu)化問題中已顯示出其優(yōu)越的搜索能力,尤其在尋找全局最優(yōu)解方面表現(xiàn)卓越。它通過群體協(xié)作逼近最優(yōu)解,有效避免了局部極小值的干擾,顯著提高了SVM模型在復(fù)雜問題上的應(yīng)用效率。
斗龍港自1991年經(jīng)歷重大洪水事件后的改道工程,其閘下航道的實際長度有所縮減。近年來受上游沖淤水源減少和河口圍墾等因素影響,斗龍港閘下逐步淤積,給該地區(qū)的水資源管理和港口安全帶來了巨大壓力,并且該地區(qū)引水沖淤的水資源利用水平較低[9]。據(jù)此,本文選擇里下河地區(qū)的斗龍港作為研究對象,針對該地區(qū)統(tǒng)一調(diào)度運行的沖淤規(guī)律重新界定了動態(tài)沖淤需水量的概念,提出一種自適應(yīng)粒子群算法與支持向量機(jī)模型相結(jié)合的預(yù)測方法,該模型憑借其數(shù)據(jù)驅(qū)動的特點,能夠克服傳統(tǒng)模型在處理此類復(fù)雜問題時的局限性,提供更為準(zhǔn)確,快速的需水量預(yù)測。此外,本文通過運用Sobol敏感性分析法,對影響沖淤需水量預(yù)測的關(guān)鍵輸入?yún)?shù)進(jìn)行了研究,旨在明確主要影響因素,為后續(xù)的水資源管理和決策提供科學(xué)依據(jù)。
1原理與方法
1. 1 SVM算法原理
SVM 方法是基于統(tǒng)計學(xué)理論的機(jī)器學(xué)習(xí)方法[10],能高效處理非線性的分類和回歸問題。該方法最早應(yīng)用于模式識別領(lǐng)域,后來擴(kuò)展到函數(shù)擬合、非線性回歸分析和概率密度估計等方面。該方法的主要思想是通過非線性函數(shù)將樣本映射到高維特征空間,通過損失函數(shù)與懲罰因子尋找最優(yōu)回歸超平面,進(jìn)而尋求全局最優(yōu)解。該最優(yōu)回歸超平面的表達(dá)式為[11]:
2案例應(yīng)用研究
2. 1斗龍港預(yù)測模型建立
里下河地區(qū)的港道在汛期與非汛期之間,呈現(xiàn)出顯著不同的沖淤特性[18],見圖2、3(圖中P值是用來判斷模型的統(tǒng)計顯著性的指標(biāo),通常認(rèn)為Pgt;0. 05表示線性關(guān)系不顯著)。在非汛期,水量與沖淤量之間呈現(xiàn)出明顯的線性關(guān)系。然而,在汛期因降雨帶來的自然徑流增加以及人為引水沖淤調(diào)度措施,港道內(nèi)水動力條件擾動劇烈,使得水量與泥沙變化量之間的關(guān)系難以用簡單的線性模型描述,因此,本文采用了支持向量機(jī)(SVM)模型來處理這一復(fù)雜關(guān)系。
從汛期與非汛期沖淤量的數(shù)據(jù)可以看出,港道在汛期通常表現(xiàn)為沖刷,而在非汛期則以淤積為主。傳統(tǒng)的沖淤需水量概念側(cè)重于維持泥沙平衡狀態(tài),但里下河地區(qū)的沖淤特性使得港道泥沙狀況難以保持均衡,導(dǎo)致該概念在實際應(yīng)用中意義不大。鑒于此,本文對“沖淤需水量”概念進(jìn)行了重新界定,將其定義為基于每一具體沖淤階段實際監(jiān)測到的泥沙凈變化量所計算出的相應(yīng)沖淤水量需求。新的定量評價體系不僅涵蓋了減輕淤積或增強(qiáng)沖刷所需的水量調(diào)控,還充分考慮了年內(nèi)泥沙運動動態(tài)特征的必要調(diào)整措施,從而為實現(xiàn)更加精準(zhǔn)有效的水資源調(diào)度和港道維護(hù)提供了理論基礎(chǔ)。
本文模型輸入的數(shù)據(jù)選自2001—2018年間斗龍港歷年的沖淤成果表以及閘上降雨監(jiān)測和開閘調(diào)度資料。斗龍港閘下斷面淤積的最長監(jiān)測距離為6 000 m,累計沖淤變化量與閘下距離呈現(xiàn)出較好的線性關(guān)系,故為了減少偶然誤差的影響,選擇0~6 000 m范圍總變化量以確保研究結(jié)果的準(zhǔn)確性和可靠性。除少數(shù)特殊實驗期外,河道淤積監(jiān)測在每年汛期前后各進(jìn)行一次。同時,降雨監(jiān)測和開閘調(diào)度數(shù)據(jù)由斗龍港閘上監(jiān)測站月度收集,沖淤需水量數(shù)據(jù)使用港閘測站監(jiān)測排水量。本文模型樣本數(shù)據(jù)共38組,包含了汛期與非汛期的數(shù)據(jù)。由于汛期與非汛期的最大區(qū)別在于水量,將其放在同一個模型中進(jìn)行預(yù)測,可以在確保模型合理性的同時,增加樣本數(shù)目,提升模型魯棒性。
為準(zhǔn)確地描述沖淤演變過程,本文選取了5個關(guān)鍵變量作為支持向量機(jī)(SVM)模型的輸入?yún)?shù)。
a)初始河床容積。該參數(shù)為在沖淤階段之初,指定河道長度范圍內(nèi)所對應(yīng)的總體積,為沖淤變化提供了一個起始的基準(zhǔn)。河床容積的大小會直接影響水流對泥沙物質(zhì)的承載潛能和輸運能力以及水流流態(tài)。此外,河道容積的大小與水流沖刷強(qiáng)度和河床對泥沙的接納與沉積能力之間相關(guān)性強(qiáng)。
b)沖淤量。該參數(shù)是基于沖淤階段前后河床容積的差值來進(jìn)行計算,是沖淤研究的核心,直接描述了河床在一定時間內(nèi)是呈現(xiàn)沉積淤積狀態(tài)還是侵蝕沖刷狀態(tài)。沖淤時間段長度:在一個給定的時間段中,河床容積的變化能以淤積量來表達(dá)。這一變化與時間段長度呈正相關(guān)。
c)降雨量。該參數(shù)會直接影響港道的徑流情況,是河道輸沙量變化的關(guān)鍵驅(qū)動因素之一。較大的降雨事件會對河床形態(tài)產(chǎn)生顯著的重塑作用。普通的降雨也會改變港道入海的流量。
d)開閘次數(shù)。該參數(shù)體現(xiàn)了人類活動對河床沖淤影響。開閘會造成水流速度和方向的短時間內(nèi)變化,影響到河道上下游泥沙分布和輸移。開閘次數(shù)多與少均會影響水流的沖淤效率。
本文所選取的變量能夠直接反映水流動力學(xué)、河床形態(tài)變化以及泥沙輸移等的基本情形。盡管潮汐、風(fēng)力作用等外在環(huán)境要素在局部時段內(nèi)會現(xiàn)出顯著的波動,但在整體研究框架中,尤其針對長期的觀測期間,這些周期性的作用反映出一種穩(wěn)定的條件效應(yīng)。在宏觀時空尺度下,潮汐和風(fēng)力等因素對泥沙運輸?shù)淖饔秒m然持續(xù)存在,但相較于短期的劇烈波動,這些影響在統(tǒng)計意義上表現(xiàn)為一種持續(xù)的基線條件,為沉積物動態(tài)提供了一個穩(wěn)定但非決定性的影響基礎(chǔ)。在本研究的機(jī)器學(xué)習(xí)模型中忽略這些因素并不會削弱模型的預(yù)測能力,相反,這種做法有助于聚焦在預(yù)測期內(nèi)影響更為明顯、變化趨勢更為穩(wěn)定的關(guān)鍵驅(qū)動變量。
2. 2模型計算結(jié)果
本文數(shù)據(jù)樣本總量為38個,選取前31個作為訓(xùn)練集,后7個作為測試集。在模型中粒子群數(shù)量m為40,最大迭代次數(shù)T 為200,最大權(quán)重Wmax=0. 9,最小權(quán)重Wmin=0. 4,正則化參數(shù)C和核參數(shù)σ的范圍均為[2-8,28];為了便于比較APSO-SVM 模型與Matlab自帶的SVM工具包之間的準(zhǔn)確性,進(jìn)行了相應(yīng)實驗,結(jié)果見表1。
SVM和APSO-SVM模型的學(xué)習(xí)和預(yù)測數(shù)據(jù)見圖4、5,SVM確定參數(shù)為C=6.0629,σ=0.5000;經(jīng)過APSO優(yōu)化所得到的參數(shù)為C=0.7891,σ=1.1057。APSO-SVM模型訓(xùn)練集的均方根誤差(Root Mean Square Error,RMSE)為0.3251,相關(guān)系數(shù)(R2)為0.9824,測試集的RMSE為0.5253,R2為0.9561,而SVM預(yù)測時,訓(xùn)練集的RMSE為0.8441,R2為0.8811,測試集的RMSE為1.041,R2為0.8272。對比結(jié)果表明APSO-SVM模型在測試集和訓(xùn)練集上均優(yōu)于SVM模型預(yù)測結(jié)果。
2.3Sobol敏感性分析
本文所構(gòu)建的APSO-SVM模型盡管在訓(xùn)練集和測試集上展現(xiàn)出高準(zhǔn)確度,但其內(nèi)部機(jī)制的“黑箱”學(xué)習(xí)原理使得如何從數(shù)據(jù)中學(xué)習(xí)并做出準(zhǔn)確預(yù)測的具體過程相當(dāng)模糊,要充分理解模型的預(yù)測機(jī)制需要對模型透明度和可解釋性做進(jìn)一步考量。因此,為了揭示數(shù)據(jù)中的潛在關(guān)聯(lián)性以及預(yù)測模型背后的重要驅(qū)動力,本研究展開對模型輸入變量敏感性分析的討論,通過識別關(guān)鍵變量,闡述模型內(nèi)部的動態(tài)過程,在保留模型高準(zhǔn)確度的同時,增加沖淤概念模型的可解釋性和透明度。
為了深入揭示模型中各個輸入變量的重要性及其對預(yù)測結(jié)果的具體影響程度,本文采用了Sobol敏感性分析,利用自適應(yīng)粒子群優(yōu)化策略和支持向量機(jī)(APSO-SVM)的預(yù)測模型作為代理模型[19],以對斗龍港沖淤需水量進(jìn)行分析。表2中計算了各輸入?yún)?shù)的一階影響指數(shù)(S)和總效應(yīng)指數(shù)(ST),一階效應(yīng)指數(shù)表示當(dāng)其他輸入?yún)?shù)保持不變時,單個輸入?yún)?shù)對輸出的直接影響。而總效應(yīng)指數(shù)則綜合了參數(shù)自身的一階效應(yīng)以及它與其他參數(shù)交互作用的全方位影響,揭示了輸入變量之間的依賴關(guān)系和交互效應(yīng)[20]。
基于Sobol敏感性分析所得的結(jié)果,沖淤量的敏感性最高(S=0.3401,ST=0.3711),表明沖淤量在沖淤需水量預(yù)測輸出中起決定作用。一階影響指數(shù)體現(xiàn)沖淤量自身對預(yù)測結(jié)果的直接影響,而ST與S之間較小的差異值體現(xiàn)了沖淤量與其他影響因子的交互作用對預(yù)測結(jié)果的影響相對次要。因此,在實施沖淤調(diào)度計劃前,必須精確測定與調(diào)控沖淤活動的規(guī)模。
初始河床容積(S=0.2506,ST=0.2973)以及開閘次數(shù)(S=0.2096,ST=0.2481)敏感性也較為顯著。其中開閘次數(shù)對沖淤效果的調(diào)節(jié)作用至關(guān)重要,水利管理人員在編制開閘操作方案時,需細(xì)致考慮開閘時機(jī)和頻率,合理引導(dǎo)水流動力,促進(jìn)泥沙有效輸送,從而達(dá)到優(yōu)化水量分配與沉積物平衡的目標(biāo)。
降雨量(S=0.0753,ST=0.1237)和時間段長度(S=0.0376,ST=0.0772),雖然敏感性相對較低,但它們與其他因素的交互作用可能引起較大程度的預(yù)測結(jié)果變動。降雨量的總效應(yīng)指數(shù)為ST=0.1237,意味著降雨與其他環(huán)境變量間存在顯著的交互效應(yīng),在遭遇極端降雨事件時,降雨量對沖淤狀態(tài)變化的影響可能呈現(xiàn)出更為復(fù)雜且難以預(yù)見的特征。因此,在實際的沖淤管理與預(yù)測工作中,須結(jié)合長期降雨預(yù)報信息以及突發(fā)性暴雨事件,適時調(diào)整沖淤策略。
3結(jié)論
本文針對里下河地區(qū)斗龍港閘下港道沖淤需水量動態(tài)預(yù)測問題,提出了結(jié)合自適應(yīng)粒子群優(yōu)化算法(APSO)與支持向量機(jī)(SVM)的新型預(yù)測模型。研究結(jié)果表明,與標(biāo)準(zhǔn)SVM模型相比,APSO-SVM模型的預(yù)測性能顯著提升,并通過Sobol敏感性分析,明確了沖淤管理中的關(guān)鍵變量,彌補(bǔ)了機(jī)器學(xué)習(xí)內(nèi)部機(jī)制模糊的缺點,提高動態(tài)沖淤需水量管理的可操作性。
a)本文重新定義了“沖淤需水量”,將其界定為基于特定沖淤階段觀測到的泥沙凈變化量所需的沖淤水量。此定量評價系統(tǒng)不僅豐富了沖淤需水量的基礎(chǔ)認(rèn)識,也為實際中的水資源調(diào)度和港道維護(hù)工作提供了更精確和實用的指導(dǎo)原則?;诖烁拍?,本文建立了結(jié)合APSO與SVM的預(yù)測模型,并驗證了其在訓(xùn)練集和測試集上的優(yōu)異預(yù)測性能。研究表明,改進(jìn)的APSO-SVM模型在運算效率和準(zhǔn)確度上均有顯著提升,選取的5個關(guān)鍵變量能較好預(yù)測斗龍港的動態(tài)需水量變化過程,預(yù)測模型能夠為斗龍港高效調(diào)度沖淤水量提供決策依據(jù)。
b)針對APSO-SVM模型的黑箱計算短板,本文使用Sobol敏感性分析揭示了沖淤量、初始河床容積以及開閘次數(shù)在沖淤需水量預(yù)測中的關(guān)鍵作用,提高了機(jī)器學(xué)習(xí)與物理變量之間關(guān)聯(lián)的可辨識度,為沖淤管理策略的精準(zhǔn)制定提供了聚焦點。研究考慮了降雨量與其他環(huán)境變量間的潛在交互效應(yīng),提出了在實際沖淤管理中應(yīng)結(jié)合長期和短期降雨預(yù)報信息,及時調(diào)整沖淤策略并預(yù)測補(bǔ)水量,為沿海通海河流水資源高效管理和港道安全維護(hù)決策提供了強(qiáng)有力的數(shù)據(jù)支持和科學(xué)依據(jù)。