羅成明,盧文喜,潘紫東,王梓博,徐亞寧,白玉堃
基于替代模型和流向算法的地下水污染源反演識別
羅成明,盧文喜*,潘紫東,王梓博,徐亞寧,白玉堃
(吉林大學(xué)新能源與環(huán)境學(xué)院,地下水與資源環(huán)境教育部重點實驗室,吉林 長春 130012)
應(yīng)用模擬-優(yōu)化的理論和方法,對地下水污染源的相關(guān)信息、模擬模型的滲透系數(shù)以及抽水井的抽水量進行同步識別.首先,根據(jù)假想例子構(gòu)建地下水污染數(shù)值模擬模型.然后,分別運用BP神經(jīng)網(wǎng)絡(luò)(BPNN)方法和核極限學(xué)習(xí)機(KELM)方法構(gòu)建模擬模型的替代模型,優(yōu)選出擬合精度更高的替代模型嵌入到后續(xù)的優(yōu)化模型中,以此減少計算負荷并提升替代模型對模擬模型的逼近精度.最后,采用流向算法(FDA)對優(yōu)化模型進行求解,得到反演結(jié)果,同時,將其分別與麻雀搜索算法(SSA)和粒子群優(yōu)化算法(PSO)得到的反演結(jié)果進行對比.結(jié)果表明:相比于KELM替代模型,BPNN替代模型的擬合精度較高,確定性系數(shù)、平均相對誤差和均方根誤差分別為0.9999、0.1723%和0.5625;與PSO和SSA相比,FDA的收斂速度更快,對優(yōu)化模型的求解精度更高,其識別結(jié)果的平均相對誤差小于7%,提升了地下水污染源反演識別的精度和效率,能夠為地下水污染修復(fù)、風(fēng)險評定和責(zé)任認定提供可靠的依據(jù).
同步識別;模擬-優(yōu)化方法;替代模型;流向算法;BP神經(jīng)網(wǎng)絡(luò)
同地表水污染相比,地下水污染發(fā)生的更為隱蔽,這給地下水污染修復(fù)、地下水污染風(fēng)險評定和污染責(zé)任認定帶來了一定的挑戰(zhàn)[1-2].地下水污染源反演識別可以通過有限的觀測數(shù)據(jù)(監(jiān)測井的水頭值或污染物濃度值)和場地踏勘調(diào)查的輔助信息,反演獲得污染源和模擬模型的相關(guān)信息[3],借助識別的信息可以為地下水污染修復(fù)、風(fēng)險評定和責(zé)任認定提供可靠的依據(jù).
目前地下水污染源反演識別的方法有很多,模擬-優(yōu)化方法因其具有完備的數(shù)學(xué)理論[4],且能同時識別多種變量,已被廣泛應(yīng)用于地下水污染源反演識別中.在運用模擬-優(yōu)化法進行地下水污染源反演時,首先需要建立地下水污染源反演識別的優(yōu)化模型,并將模擬模型作為等式條件嵌入到優(yōu)化模型中,然后使用優(yōu)化算法進行求解[2].本領(lǐng)域大量學(xué)者已使用多種優(yōu)化算法求解優(yōu)化模型,如模擬退火法[5]、麻雀搜索算法(SSA)[6-7]、和聲搜索算法[8]和灰狼優(yōu)化算法[9]等.但是隨著地下水污染源反演問題維度和復(fù)雜程度的增加,許多類型的優(yōu)化算法難以迅速且高效的搜尋到全局最優(yōu)值.因此,亟需探尋搜尋效率更高、全局尋優(yōu)能力更強的優(yōu)化算法來解決地下水污染源反演識別問題.流向算法(FDA)[10]是一種基于物理的智能搜索算法,該算法具有搜索速度快,全局尋優(yōu)能力強等優(yōu)點,但是FDA尚未應(yīng)用于地下水污染溯源辨識領(lǐng)域.
使用優(yōu)化算法求解優(yōu)化模型需要反復(fù)多次調(diào)用模擬模型進行正演計算,上千次的調(diào)用會帶來極其龐大的計算負荷和時間.因此,為了提升反演任務(wù)的效率,通常選擇使用機器學(xué)習(xí)方法建立地下水污染模擬模型的替代模型.本文考慮使用其中的BP神經(jīng)網(wǎng)絡(luò)(BPNN)方法[11]和核極限學(xué)習(xí)機(KELM)方法[12]建立模擬模型的替代模型,并對比這兩種方法對模擬模型的擬合精度,優(yōu)選出精度更高的替代模型代替模擬模型嵌入到優(yōu)化模型中.
圖1 技術(shù)路線
在開展反演任務(wù)前,一般會通過場地踏勘確定一些可以得到的水文地質(zhì)信息(如研究區(qū)的降雨量、蒸發(fā)量、地下水的水位、地下水的流向和區(qū)域的地質(zhì)條件等),并將這些信息作為背景變量輸入到模擬模型中,而難以通過場地踏勘獲得的信息就需要通過反演獲取.污染源的相關(guān)信息和模型的一些參數(shù)較難直接獲取,因此常常成為反演的對象.如Li等[13]先是構(gòu)建集成替代模型,然后利用改進的0-1混合整數(shù)非線性規(guī)劃優(yōu)化模型反演識別污染源的相關(guān)信息;Bai等[14]使用自適應(yīng)變異差分進化馬爾可夫鏈(AM-DEMC)算法,同時識別污染源的相關(guān)信息以及模擬模型的滲透系數(shù).然而,對于某些研究區(qū),除了污染源信息和模型滲透系數(shù)難以獲取外,抽水井的流量也有可能是未知的.污染源相關(guān)信息、模擬模型滲透系數(shù)和抽水井流量都是地下水污染模擬模型的重要組成部分,這三者任何一部分不準確都會影響整體的反演精度,所以有必要對這三者進行同步識別.
綜上,本文應(yīng)用模擬-優(yōu)化的理論和方法,對污染源的相關(guān)信息、模型的滲透系數(shù)以及抽水井的抽水量進行同步識別.首先,根據(jù)假想例子構(gòu)建地下水污染數(shù)值模擬模型,然后運用BPNN方法和KELM方法構(gòu)建模擬模型的替代模型,優(yōu)選出擬合精度更高的替代模型嵌入到后續(xù)的優(yōu)化模型中.最后采用FDA對優(yōu)化模型求解,得到反演結(jié)果,同時與SSA和粒子群優(yōu)化算法(PSO)得到的反演結(jié)果進行對比,結(jié)果表明,FDA提高了優(yōu)化模型的求解效率和精度.本次研究為地下水污染修復(fù)、風(fēng)險評定和責(zé)任認定提供可靠的依據(jù).
本文首先構(gòu)建假想案例的地下水水流模型和溶質(zhì)運移模型,然后利用不同的機器學(xué)習(xí)方法構(gòu)建模擬模型的替代模型,挑選出擬合精度更高的替代模型嵌入到優(yōu)化模型中,最后使用優(yōu)化方法對優(yōu)化模型進行求解,進而得到反演結(jié)果.
模擬-優(yōu)化方法多將地下水?dāng)?shù)值模擬模型和優(yōu)化模型結(jié)合,通過多次迭代,利用優(yōu)化算法求解出令目標函數(shù)最優(yōu)的參數(shù)組合[15],以此作為反演結(jié)果.考慮到反復(fù)調(diào)用地下水模擬模型會帶來龐大的計算負荷,往往會使用機器學(xué)習(xí)方法構(gòu)建地下水模擬模型的替代模型,代替模擬模型作為等式條件嵌入到優(yōu)化模型中,以此減少計算負荷.
1.2.1 FDA FDA是一種基于物理的新型智能優(yōu)化算法,該算法模擬了流向排水池中具有最低高度的出口點的水流方向[10,16].首先會在問題搜索空間中形成初始的徑流群,然后每條徑流會向流域內(nèi)海拔比較低的位置流動,而這些徑流流動到的位置涵蓋了優(yōu)化問題的局部最優(yōu)解和全局最優(yōu)解.該算法的運行基于如下的幾點假設(shè):(1)每條徑流向都有一個位置和高度.(2)每條徑流都有領(lǐng)域位置,且每個位置都有一個高度或目標函數(shù).(3)水流運動速度和坡度直接相關(guān).(4)水流的速度為,流向海拔最低的位置.(5)流域出口點是具有最優(yōu)目標函數(shù)的水流位置.
FDA的具體原理如下:
首先確定初始參數(shù).該算法的初始參數(shù)主要有3個:領(lǐng)域半徑D,領(lǐng)域數(shù)量以及種群數(shù)量.徑流初始位置和初始種群矩陣由如下的公式生成:
式中:_()表示第條徑流的位置;ub和lb表示決策變量的上下限;代表單條徑流的數(shù)據(jù)維度;rand表示0和1之間均勻分布的隨機數(shù).
假設(shè)每條徑流周圍都存在領(lǐng)域,其位置由下式產(chǎn)生:
式中:_()表示第個領(lǐng)域的位置;randn表示標準正態(tài)分布的隨機數(shù).D的取值需要達到一種平衡,過大雖然會帶來較大的搜索范圍但是同時也會得到大量的局部最優(yōu)值,過小會使得搜索范圍太小.一般而言,會先給定一個較大領(lǐng)域半徑,當(dāng)解逐漸逼近全局最優(yōu)值時,縮小領(lǐng)域半徑,目的是得到更加精確的全局最優(yōu)值.下式代表D的變化趨勢:
式中: Xrand是由式(1)生成的隨機位置;是隨機數(shù)在0到無窮間的非線性權(quán)重;表示第條徑流的位置逼近隨機位置;表示通過迭代,_()接近Best_,且二者的歐幾里得距離減小為0,此時局部搜索停止.的計算如下:
考慮到徑流以的速度向目標函數(shù)最小的領(lǐng)域移動且流向領(lǐng)域的流速與坡度直接相關(guān),用如下的關(guān)系式確定流速矢量:
式中:0表示當(dāng)前位置和相鄰位置流點之間的斜率向量;隨機數(shù)randn生成各種解決方案并增強全局搜索能力.第條徑流對于第個領(lǐng)域間的斜率向量由下式?jīng)Q定:
式中:_fit()和_fit()分別為第條徑流和第個領(lǐng)域的適應(yīng)度值;代表問題的維度.下式用來確定徑流的新位置:
式中:_newX()表示徑流的新位置.
為了尋找到全局最優(yōu)值,該算法會隨機的選擇另一條徑流,若該徑流的目標函數(shù)小于當(dāng)前徑流的目標函數(shù),則該徑流將沿著隨機徑流方向流動,否則,該徑流沿主導(dǎo)坡度方向移動.
1.2.2 SSA SSA是受到麻雀的反捕食和覓食行為所啟發(fā).其中麻雀共有3種類型:發(fā)現(xiàn)者、加入者和警戒者[17].發(fā)現(xiàn)者負責(zé)尋找食物,為種群盡量尋求食物充足的區(qū)域,并將相關(guān)信息傳遞給加入者.加入者主要作用就是利用發(fā)現(xiàn)者探索的食物源信息尋找食物.這個過程屬于自然過程,麻雀之間會相互監(jiān)視,若發(fā)現(xiàn)其他充足的食物源,加入者會存在爭搶同伴食物源的情況.但同時,如果出現(xiàn)天敵,警戒者會選擇放棄當(dāng)前食物源,離開危險區(qū)域.這里的發(fā)現(xiàn)者和加入者的身份并非一成不變的,只要能發(fā)現(xiàn)優(yōu)質(zhì)的食物源那么發(fā)現(xiàn)者就可以成為加入者,但是加入者和發(fā)現(xiàn)者的整體比例不會發(fā)生變化.發(fā)現(xiàn)者的位置更新公式如下:
式中:為迭代次數(shù);itermax為最大迭代次數(shù);X為第只麻雀在第維的位置信息;為0~1的隨機數(shù);2?(0,1)和ST?[0.5,1]為預(yù)警值和安全值;為服從正態(tài)分布的隨機數(shù);表示一個1′的矩陣.如下是加入者的位置更新公式:
式中:X為目前發(fā)現(xiàn)者的最優(yōu)位置;worst為目前最差位置.+=T(T)-1;為于同維的矩陣,每個元素隨機賦值為1或-1.
1.2.3 PSO PSO受到鳥群捕食的啟發(fā),將優(yōu)化問題看作是捕食的鳥群,解空間看作是鳥群的飛行空間,空間中的位置即是PSO在空間中的一個粒子,也就是待優(yōu)化問題的一個解.該算法的核心是利用群體中個體間的信息共享,從而使整個群體的運動在問題的求解空間中產(chǎn)生從無序到有序的演化過程,以此獲得全局最優(yōu)解[18].各粒子通過如下公式來迭代更新位置與速度:
式中:X(+1)和V(+1)分別是粒子經(jīng)過次更新后的位置和速度;1和2為加速度系數(shù);和2為[0,1]間的隨機數(shù);為慣性權(quán)重;pbi()為粒子在代中出現(xiàn)的最佳位置;gb()為整個群體在代中出現(xiàn)的最佳位置.
1.3.1 BPNN方法 BPNN是一種基于誤差反向傳播算法進行訓(xùn)練的前饋神經(jīng)網(wǎng)絡(luò).該方法的核心是根據(jù)每次訓(xùn)練得到的結(jié)果與預(yù)想結(jié)果進行誤差分析,然后調(diào)整閾值和權(quán)重,通過反復(fù)多次的訓(xùn)練,最終得到跟模擬模型輸出一致的結(jié)果.
BPNN通常由三層組成:輸入層、隱含層和輸出層;計算過程分為兩個階段:正向傳播與誤差反向傳播過程[19].
(1)正向傳播過程:
傳遞函數(shù)為非線性變換的Sigmoid函數(shù),表達式如下:
正向傳輸?shù)妮敵鰧佑嬎愎饺缦?
式中:O代表神經(jīng)元的輸出;是偏置;w為神經(jīng)元與神經(jīng)元連接的權(quán)重.
(2)逆向傳播過程:從輸出層出發(fā),對正向反饋中的權(quán)重進行隨機分配,在此過程中,需要根據(jù)輸出層的輸出值和類的不同,來調(diào)整整個網(wǎng)絡(luò)的權(quán)值,從而實現(xiàn)目標最優(yōu).
對于輸出層:
式中:E表示第個節(jié)點的誤差值;O表示第個節(jié)點的輸出值;T記錄輸出值.
中間隱層通過下層節(jié)點總誤差按權(quán)重累加:
式中:E為下一層節(jié)點的誤差率;W為當(dāng)層節(jié)點到下層節(jié)點的權(quán)重值.
計算誤差后可利用誤差率對權(quán)重進行更新:
式中:h為學(xué)習(xí)速率.圖2是本文BPNN的結(jié)構(gòu). 圖中“18”表示輸入層包含18個神經(jīng)元(3個分區(qū)的滲透系數(shù),5口抽水井的抽水量以及2個污染源前5a的釋放強度);“30”表示隱含層包含30個神經(jīng)元;“50”表示輸出層包含50個神經(jīng)元(5口監(jiān)測井每年各監(jiān)測一次污染物濃度值,共監(jiān)測10a).
1.3.2 KELM方法 KELM基于極限學(xué)習(xí)機(ELM),結(jié)合核函數(shù)所提出的算法,既保留ELM的優(yōu)點,還提升模型的預(yù)測能力[20].KELM的基本原理如下:
經(jīng)過一系列的優(yōu)化,KELM輸出函數(shù)的表達公式如下:
圖3 研究區(qū)概況
表1 含水層參數(shù)的基礎(chǔ)值及范圍
本文采用的是一個假想案例,該案例的研究區(qū)東西長2500m,南北寬1400m,地勢西高東低,地下水自西北向東南流動.將研究區(qū)概化為非均質(zhì)各向同性含水層,研究的主要對象為一層潛水含水層,厚約10m,水流為二維穩(wěn)定流,根據(jù)滲透性的差異將研究區(qū)分為3個區(qū)域.研究區(qū)的示意圖見圖3.研究區(qū)的BC邊界和DA邊界為透水性很弱的巖層,因此將其概化為零通量邊界,AB邊界和CD邊界為兩條河流,概化為定水頭邊界.在地下水溶質(zhì)運移模型中,將邊界AB和CD概化為已知濃度邊界,將邊界BC和DA概化為零通量的水動力彌散邊界,污染物的環(huán)境基底值為零.表1給出了該研究區(qū)含水層參數(shù)的基礎(chǔ)值及范圍.
在該案例中,共有5口監(jiān)測井,每年監(jiān)測一次地下水污染物的濃度值,同時監(jiān)測井也充當(dāng)抽水井的角色.共有兩個污染源,分別為1和2.待識別變量包括3大類:5口井的抽水量1,2,3,4和5,研究區(qū)各部分的滲透系數(shù)1,2和3,以及兩個污染源在釋放周期內(nèi)的污染物釋放強度:=ST,= 1,2,= 1,2,3,4,5. ST表示污染源在年的釋放強度.(該案例的研究周期共10a,兩個污染源均在前5a釋放污染物,后5a不釋放).表2給出了污染源在釋放周期內(nèi)的釋放強度取值區(qū)間.
表2 污染源釋放強度的取值范圍
2.2.1 地下水水流模型
2.2.2 地下水溶質(zhì)運移模型
式中:t為時間變量;c為地下水中溶質(zhì)濃度;grandc為溶質(zhì)的濃度梯度;Dx,Dy是x、y方向上的水動力彌散系數(shù);ux,uy分別為實際平均流速向量在x、y軸方向上的分量;n為孔隙度;b為含水層厚度;I為源匯項;Rd為滯留因子;D為水動力彌散系數(shù);S為研究區(qū);AB,CD邊界為已知濃度邊界;BC,DA為已知水動力彌散通量邊界;為已知函數(shù).
2.2.3 模型求解與預(yù)報 使用GMS軟件求解模擬場地的地下水水流模型和地下水溶質(zhì)運移模型,并預(yù)報10a后流場以及5a和10a后污染物濃度的空間分布情況,如圖4和圖5所示.考慮到此次研究所設(shè)定的是假想例子,因此需要將一組確定的含水層參數(shù)和污染源釋放強度值輸入到地下水污染模擬模型中進行正演計算,得到監(jiān)測井處的污染物濃度值作為觀測數(shù)據(jù),如表3所示.而這一組確定的含水層參數(shù)和污染源釋放強度值便被當(dāng)作待識別變量的參考值,如表4所示.
圖5 5a及10a后污染物運移分布狀況
表3 5口監(jiān)測井污染物濃度監(jiān)測數(shù)據(jù)
表4 待識別參數(shù)參考值
續(xù)表4
該案例的待識別變量包括3類:污染源釋放歷史、滲透系數(shù)和抽水井流量,共18維.采用拉丁超立方抽樣方法,在待識別變量的可行域內(nèi)進行抽樣,該抽樣過程通過MATLAB實現(xiàn),其中污染源釋放歷史和抽水井流量按正態(tài)分布抽樣,滲透系數(shù)按對數(shù)正態(tài)分布抽樣,參數(shù)的抽樣區(qū)間如表1所示.上述參數(shù)共抽取110組形成輸入數(shù)據(jù)集,然后將這110組參數(shù)輸入到模擬模型中得到110組監(jiān)測井處的污染物濃度值為輸出數(shù)據(jù)集,組合形成輸入-輸出樣本數(shù)據(jù)集.其中每組輸出數(shù)據(jù)包括5口監(jiān)測井10a的監(jiān)測數(shù)據(jù),共50維.
分別使用BPNN方法和KELM方法建立地下水污染模擬模型的替代模型.其中輸入-輸出樣本數(shù)據(jù)集的前100組用來建立替代模型,后10組檢驗對比替代模型的精度.采用確定性系數(shù)(2)、平均相對百分比誤差(MAPE)和均方根誤差(RMSE)這3個指標評價對比這兩種替代模型的性能.
如表5所示,使用KELM方法所建立的替代模型,其2為0.9996,MAPE為0.7689%,RMSE為2.9562;使用BPNN方法所建立的替代模型,其2為0.9999,MAPE為0.1723%,RMSE為0.5625. BPNN方法的3個指標都優(yōu)于KELM方法.此外,繪制了兩種方法所建立的替代模型對模擬模型污染物濃度輸出值的擬合圖,如圖6所示,BPNN替代模型的擬合程度更高.綜上所述,BPNN方法所建立的替代模型優(yōu)于KELM方法,因此選用BPNN替代模型進行后續(xù)的反演問題研究.
表5 替代模型擬合精度
此研究應(yīng)用模擬-優(yōu)化法進行地下水污染溯源辨識.該方法共有兩個部分,前者是地下水污染質(zhì)運移模擬模型,后者是以模擬模型計算值與真值之差的最小平方和為目標函數(shù)的優(yōu)化模型.為了減少反復(fù)調(diào)用模擬模型所帶來的龐大的計算負荷,使用替代模型來代替模擬模型.優(yōu)化模型由3個部分組成:目標函數(shù)、決策變量和約束條件.本文研究案例的決策變量為:抽水井流量、場地的滲透系數(shù)和污染源的釋放歷史(主要指污染物在各個時段內(nèi)污染物的釋放強度和釋放時長等).表達形式如下:
使用FDA、麻雀搜索算法(SSA)和粒子群優(yōu)化算法(PSO)對優(yōu)化模型進行求解,通過多次迭代計算,求解出令目標函數(shù)最優(yōu)的參數(shù)組合,以此作為反演結(jié)果.其中,FDA中徑流的數(shù)量設(shè)置為500,最大迭代次數(shù)為1000次,領(lǐng)域個數(shù)為1;SSA和PSO的種群數(shù)量為500,最大迭代次數(shù)為1000次.
圖7 3種優(yōu)化算法的收斂曲線
將優(yōu)選出的BPNN替代模型嵌入到優(yōu)化模型中,使用優(yōu)化算法求解,以此得到目標函數(shù)值最小時的參數(shù)組合.如圖7ss所示,使用PSO求解,在達到最大迭代次數(shù)后,仍然不能夠收斂;FDA在迭代了80次后收斂;SSA迭代了1000次后趨于收斂.表6是3種算法的識別結(jié)果,表7是3種算法識別結(jié)果的平均相對誤差.由表6和表7可知,FDA的識別結(jié)果中單個待識別變量的最大相對誤差為14.22%,整體的平均相對誤差為3.38%;SSA的識別結(jié)果中單個待識別變量的最大相對誤差為35.43%,整體的平均相對誤差為12.26%;PSO的識別結(jié)果中單個待識別變量的最大相對誤差為43.93%,整體的平均相對誤差為17.44%.其中FDA對模擬模型的滲透系數(shù)和抽水井流量的識別精度較高,多數(shù)參數(shù)的識別精度都高于98%,對污染源釋放歷史的識別結(jié)果整體也較好.對比而言,SSA和PSO對于上述3類待識別變量的識別精度都較低,SSA中對1、2和5以及PSO中對1、2、4和5識別結(jié)果的相對誤差均高于20%,除此之外,對于污染源釋放歷史的識別精度也較低,少有待識別變量的識別精度高于95%.
表6 3種優(yōu)化算法的識別結(jié)果
考慮到僅選取一組確定的含水層參數(shù)和污染源釋放強度值作為參考值,以此評估三種優(yōu)化方法的反演識別精度,會存在一定的偏差,因此本文又選取2組一共3組參考值,以此評價3種優(yōu)化方法的反演識別精度.3組參考值的反演識別精度如表8所示.由表8可知,3組參考值識別精度最高的優(yōu)化算法都是FDA,3組參考值識別結(jié)果的平均相對誤差為6.64%,優(yōu)于SSA的11.97%和PSO的15.99%.綜上, FDA最快達到收斂,而且識別精度優(yōu)于SSA和PSO,可以快速的獲得全局最優(yōu)值,能較好的提升地下水污染反演識別任務(wù)的精度和效率.整體而言,FDA的識別精度較高,平均相對誤差小于7%,可以為地下水污染修復(fù)、風(fēng)險評定和責(zé)任認定提供可靠的依據(jù).
此外,值得注意的是,若是調(diào)用模擬模型進行迭代計算,1000次迭代需要約50h,但是調(diào)用替代模型計算僅需6.88s,大幅降低了計算耗時.
相比于SSA和PSO,FDA擁有更少的控制參數(shù),且有著更快的收斂速度.為了尋找到全局最優(yōu)值,該算法首先會隨機選擇一條徑流,然后對比不同徑流的目標函數(shù),選取目標函數(shù)更小的徑流并沿該徑流方向移動.當(dāng)面對地下水污染問題時,能較快的收斂于全局最優(yōu)值.PSO較難尋找到全局最優(yōu)值,易陷入局部最優(yōu),而SSA的收斂效果和速度都比較慢,這些在一定程度上會影響反演識別的結(jié)果.
表7 3種算法識別結(jié)果的平均相對誤差
表8 3種算法多組識別結(jié)果精度對比
3.1 本文分別建立BPNN替代模型和KELM替代模型,對比發(fā)現(xiàn),BPNN替代模型的2、MAPE和RMSE分別為0.9999,0.1723%和0.5625,均優(yōu)于KELM替代模型的0.9996,0.7689%和2.9562,因此后續(xù)將BPNN替代模型嵌入到優(yōu)化模型中,供優(yōu)化模型迭代計算,能大幅降低計算耗時.
3.2 本次研究應(yīng)用FDA對優(yōu)化模型進行求解,并將其求解結(jié)果分別同PSO和SSA進行對比.結(jié)果表明,FDA能快速收斂并得到全局最優(yōu)值,與PSO和SSA相比,FDA的收斂速度和識別精度更高,識別的平均相對誤差小于7%,能為地下水污染修復(fù)、風(fēng)險評定和責(zé)任認定提供可靠的依據(jù).
[1] Li J, Lu W, Luo J. Groundwater contamination sources identification based on the Long-Short Term Memory network [J]. Journal of Hydrology, 2021,601:126670.
[2] Wang Z, Lu W, Chang Z, et al. Simultaneous identification of groundwater contaminant source and simulation model parameters based on an ensemble Kalman filter - Adaptive step length ant colony optimization algorithm [J]. Journal of Hydrology, 2022,605:127352.
[3] 葛淵博,盧文喜,白玉堃,等.基于SSA-BP與SSA的地下水污染源反演識別 [J]. 中國環(huán)境科學(xué), 2022,42(11):5179-5187. Ge Y B, Lu W X, Bai Y K, et al. Inversion and identification of groundwater pollution sources based on SSA-BP and SSA [J]. China Environmental Science, 2022,42(11):5179-5187.
[4] Atmadja J, Bagtzoglou A C. State of the art report on mathematical methods for groundwater pollution source identification [J]. Environmental Forensics, 2001,2(3):205-214.
[5] 潘紫東,盧文喜,范 越,等.基于模擬-優(yōu)化方法的地下水污染源溯源辨識 [J]. 中國環(huán)境科學(xué), 2020,40(4):1698-1705. Pan Z D, Lu W X, Fan Y, et al. Inverse identification of groundwater pollution source based on simulation-optimization approach [J]. China Environmental Science, 2020,40(4):1698-1705.
[6] Ge Y, Lu W, Pan Z. Groundwater contamination source identification based on Sobol sequences-based sparrow search algorithm with a BiLSTM surrogate model [J]. Environmental Science and Pollution Research, 2023,30(18):53191-53203.
[7] Pan Z, Lu W, Wang H, et al. Recognition of a linear source contamination based on a mixed-integer stacked chaos gate recurrent unit neural network-hybrid sparrow search algorithm [J]. Environmental Science and Pollution Research, 2022,29(22):33528-33543.
[8] 江思珉,蔡 奕,王 敏,等.基于和聲搜索算法的地下水污染源與未知含水層參數(shù)的同步反演研究 [J]. 水利學(xué)報, 2012,43(12):1470-1477. Jiang S M, Cai Y, Wang M, et al. Simultaneous identification of groundwater contaminant source and aquifer parameters by harmony search algorithm [J].Journal of Hydraulic Engineering, 2012,43(12): 1470-1477.
[9] 李久輝.地下水LNAPLs污染溯源辨析 [D]. 長春:吉林大學(xué), 2021. Li J H. Inverse identification of LNAPLs contamination source in groundwater [D]. Jilin: Jilin University, 2021.
[10] Karami H, Anaraki M V, Farzin S, et al. Flow direction algorithm (FDA): a novel optimization approach for solving optimization problems [J]. Computers & Industrial Engineering, 2021,156:107224.
[11] Wang Y, Cui Y, Shao J, et al. Study on optimal allocation of water resources based on surrogate model of groundwater numerical simulation [J]. Water, 2019,11(4):831.
[12] 韓 玉.渾河流域地表水地下水水質(zhì)耦合模擬及不確定性分析 [D]. 長春:吉林大學(xué), 2020. Han Y. Fully coupled simulation and uncertainty analysis of surface water and groundwater on quality in Hunhe river basin [D]. Jilin: Jilin University, 2020.
[13] Li J, Wu Z, Lu W, et al. Simultaneous identification of the number, location and release intensity of groundwater contamination sources based on simulation optimization and ensemble surrogate model [J]. Water Supply, 2022,22(10):7671-7689.
[14] Bai Y, Lu W, Li J, et al. Groundwater contamination source identification using improved differential evolution Markov chain algorithm [J]. Environmental Science and Pollution Research, 2022, 29(13):19679-19692.
[15] Vrugt J A, Stauffer P H, Woehling T, et al. Inverse modeling of subsurface flow and transport properties: A review with new developments [J]. Vadose Zone Journal, 2008,7(2):843-864.
[16] 陳國龍.基于老化參數(shù)的IGBT健康狀態(tài)評估及剩余壽命預(yù)測 [D]. 天津:河北工業(yè)大學(xué), 2022. Chen G L. IGBT health status assessment and remaining life prediction based on aging parameters [D]. Tianjin: Hebei University of Technology, 2022.
[17] 陳 鑫,肖明清,文斌成,等.基于變分模態(tài)分解和混沌麻雀搜索算法優(yōu)化支持向量機的滾動軸承故障診斷 [J]. 計算機應(yīng)用, 2021, 41(S2):118-123. Chen X, Xiao M Q, Wen B C, et al. Rolling bearing fault diagnosis based on variational mode decomposition, chaotic sparrow search algorithm and support vector machine [J]. Journal of Computer Applications, 2021,41(S2):118-123.
[18] 楊 維,李歧強.粒子群優(yōu)化算法綜述 [J]. 中國工程科學(xué), 2004, (5):87-94. Yang W, Li Q Q. Survey on particle swarm optimization algorithm [J]. Strategic Study of CAE, 2004,(5):87-94.
[19] 李 東,周可法,孫衛(wèi)東,等.BP神經(jīng)網(wǎng)絡(luò)和SVM在礦山環(huán)境評價中的應(yīng)用分析 [J]. 干旱區(qū)地理, 2015,38(1):128-134. Li D, Zhou K F, Sun W D, et al. Application of BP neural network and SVM in mine environmental assessment [J]. Arid Land Geography, 2015,38(1):128-134.
[20] 吳宋偉,田 杰,張?zhí)旌?等.變循環(huán)發(fā)動機外涵道氣流摻混特性建模研究 [J]. 推進技術(shù), 2022,43(12):148-156. Wu S W, Tian J, Zhang H T, et al. Modeling research on bypass flow mixing characteristics of variable cycle engine [J]. Journal of Propulsion Technology, 2022,43(12):148-156.
Inversion and identification of groundwater pollution sources based on surrogate model and flow direction algorithm.
LUO Cheng-ming, LU Wen-xi*, PAN Zi-dong, WANG Zi-bo, XU Ya-ning, BAI Yu-kun
(Key Laboratory of Groundwater Resources and Environmental Ministry of Education, College of New Energy and Environment, Jilin University, Changchun 130012, China)., 2023,43(11):5823~5832
In this paper, the theory and method of simulation-optimization was applied to identify the relevant information of groundwater pollution sources, the hydraulic conductivities of the simulation model, and the pumping capacity of pumping wells simultaneously. First, a numerical simulation model of groundwater contamination was constructed based on a hypothetical example. Then, the BP neural network (BPNN) and kernel extreme learning machine (KELM) methods were applied to construct surrogate models of the simulation model, and the surrogate model with better fitting accuracy was selected and embedded in the subsequent optimization model to reduce the computational load and improve the approximation accuracy of the surrogate model to the simulation model. Finally, the inversion results were obtained by solving the optimized model with flow direction algorithm (FDA) and comparing them with those obtained by sparrow search algorithm (SSA) and particle swarm optimization (PSO) respectively. The results showed that compared with the KELM surrogate model, the BPNN surrogate model had higher fitting accuracy, with the coefficient of determination, the average relative error and the root mean square error of 0.9999, 0.1723% and 0.5625, respectively; compared with PSO and SSA, FDA had faster convergence speed and higher accuracy in solving optimization model. The average relative error of its identification results was less than 7%, which improved the accuracy and efficiency of groundwater pollution source inversion identification and provided a reliable basis for groundwater pollution remediation, risk assessment and liability determination.
simultaneous identification;simulation-optimization method;surrogate model;flow direction algorithm;BP neural network
X523
A
1000-6923(2023)11-5823-10
羅成明(2000-),男,四川南充人,吉林大學(xué)碩士研究生,主要從事地下水?dāng)?shù)值模擬及污染溯源辨識方面研究.發(fā)表論文1篇. luocm@163.com.
羅成明,盧文喜,潘紫東,等.基于替代模型和流向算法的地下水污染源反演識別 [J]. 中國環(huán)境科學(xué), 2023,43(11):5823-5832.
Luo C M, Lu W X, Pan Z D, et al. Inversion and identification of groundwater pollution sources based on surrogate model and flow direction algorithm [J]. China Environment Science, 2023,43(11):5823-5832.
2023-04-06
國家自然科學(xué)基金資助項目(42272283,41972252);吉林大學(xué)研究生創(chuàng)新基金資助項目(2022186)
* 責(zé)任作者, 教授, luwenxi@jlu.edu.cn