魏建飛,馬 雷,趙衛(wèi)東,錢家忠
(合肥工業(yè)大學 資源與環(huán)境工程學院,安徽 合肥 230009)
地下水潛力分析(groundwater potential analysis,GWPA)是通過分析一定區(qū)域內多個影響地下水存在的因素,為確定地下水開發(fā)的最佳區(qū)域而進行的研究[1]。通常用于確定地下水最佳開發(fā)區(qū)域的傳統(tǒng)方法,如現(xiàn)場調查、鉆井、地球物理方法等,存在周期長、投資大且復雜的缺點,而地理信息系統(tǒng)(geographic information system,GIS)具有處理大型空間數(shù)據(jù)集的能力,可以應用于環(huán)境和地質領域[2-4]。近10年來,隨著GIS技術的發(fā)展,結合空間統(tǒng)計模型和GIS技術的GWPA成為研究熱點。文獻[5]利用122個水井數(shù)據(jù)庫,通過基于GIS的多變量和雙變量模型對伊朗北部Shahroud平原進行地下水潛力繪圖;文獻[6]利用基于GIS的邏輯回歸和功能樹模型對陜西檸條塔地區(qū)進行GWPA。然而由于區(qū)域地質環(huán)境、氣候因素、區(qū)域尺度的不同,各種模型具體應用效果存在一定的差異。此外,對于模型評價因子的選取相關研究較少。文獻[7-9]利用模型進行GWPA,發(fā)現(xiàn)證據(jù)權(weights-of-evidence,WoE)模型具有很好的客觀性,并易于實現(xiàn),因此,結合評價因子分析的WoE模型值得研究。
本文以安徽省明光市為研究區(qū),在對明光市地下水井點詳查和分析的基礎上,選取多種相關評價因子,進行多重共線性篩選,結合WoE模型,采用ArcGIS10.2軟件對該區(qū)域地下水潛力進行分析區(qū)劃,以利于開展區(qū)域水文地質調查工作。
明光市位于安徽省北部,地處嘉山盆地西側,屬于中緯度內陸地區(qū),位于東經117°48′10″~118°27′40″,北緯32°26′40″~33°14′10″,最高海拔為423 m,總面積為1 127.1 km2。研究區(qū)地處華北板塊和揚子板塊交界處,區(qū)內主要斷裂為郯廬斷裂,地質構造復雜。
研究區(qū)地貌上屬丘陵地區(qū),全區(qū)地形南高北低,呈狹長形,東西窄,南北長,低山、丘陵、平原兼有。東南及南部為低山,為江淮分水嶺;中西部為丘陵地區(qū),丘陵廣布;北部為平原??傮w地形走向由西南向東北延伸。該地區(qū)為亞熱帶濕潤季風氣候,冬季寒冷,夏季炎熱,降水主要集中在六月至九月,多年平均降雨量為941.1 mm,多年平均蒸發(fā)量為909 mm。
本研究包括以下4個階段。
(1) 準備建模數(shù)據(jù)集。通過廣泛野外地質調查,共確定112個井點,井點被隨機分為2組。其中78個井點(70%)用于訓練數(shù)據(jù)集,其余34個井點(30%)用于驗證數(shù)據(jù)集。訓練和驗證井點的位置如圖1所示。其余材料包括:研究區(qū)地形圖,比例尺為1∶50 000;研究區(qū)地質圖,比例尺為1∶200 000;數(shù)字高程模型(digital elevation model,DEM)空間分辨率為30 m×30 m。研究區(qū)地下水數(shù)據(jù)庫數(shù)據(jù)類型見表1所列。
圖1 明光市海拔高度及井點分布圖
表1 研究區(qū)地下水數(shù)據(jù)庫數(shù)據(jù)類型
(2) 結合研究區(qū)地質條件選擇11個地下水評價因子,包括高程、坡度、坡向、平面曲率、剖面曲率、地形濕度指數(shù)(topographic wetness index,TWI)I、河網密度、公路緩沖區(qū)、斷裂緩沖區(qū)、水系緩沖區(qū)和巖性,對因子進行多重共線性篩選。
(3) 采用WoE模型進行區(qū)域GWPA。
(4) 使用模型的接受者工作特征(receiver operating characteristic,ROC)曲線來評估模型性能。
正確理解地下水出露的評價因子與其潛力之間的關系對GWPA非常重要[10],區(qū)域內地下水的出現(xiàn)與若干環(huán)境參數(shù)有關。GWPA試圖量化環(huán)境參數(shù)的影響,并得出其與地下水井點有關的函數(shù)關系。選擇地下水評價因子沒有通用的指導原則[11]。本研究選取11個評價因子,各評價因子分級結果如圖2所示。
圖2 各評價因子分級結果
(1) 高程。高程作為影響地下水潛力的一個重要因素,經常被用于潛力預測。不同高程的氣候條件差別很大,導致了土壤和植被的差異。本文根據(jù)自然斷點法將高程(單位為m)分為10類:[0,13)、[13,26)、[26,40)、[40,55)、[55,72)、[72,91)、[91,116)、[116,152)、[152,209)、[209,+∞)。
(2) 坡度。坡度對于預測地下水的潛力也至關重要,與坡向不同,它控制斜坡的傾斜度。本文根據(jù)自然斷點法將坡度(單位為(°))分為7類:[0,1.72)、[1.72,3.47)、[3.47,5.78)、[5.78,9.14)、[9.14,14.15)、[14.15,23.52)、[23.52,+∞)。
(3) 坡向。坡向表示斜坡的方向并控制了斜坡的形成,影響降雨、風和陽光的作用。與陰坡相比,陽坡的日照時間更長,氣溫更高,蒸發(fā)作用更強烈。這種水熱條件的差異會影響當?shù)赝寥?、水文、植被、地形等自然地理要素的分異。本文將坡向分?類:平面、北、東北、東、東南、南、西南、西、西北。
(4) 平面曲率。平面曲率被描述為輪廓線的曲率,其通過水平面與表面相交而形成,這種形態(tài)特征會影響地表徑流的收斂和發(fā)散[12]。
本文根據(jù)自然斷點法將平面曲率分為5類:[-∞,-0.29)、[-0.29,0.06)、[-0.06,0.06)、[0.06,0.29)、[0.29,+∞)。
(5) 剖面曲率。剖面曲率多用于表示坡度梯度在最大坡度方向上變化的速率。與平面曲率一樣,剖面曲率也被分類為5類:[-∞,-0.49)、[-0.49,-0.13)、[-0.13,0)、[0,0.27)、[0.27,+∞)。
(6) TWI。TWI與土壤條件有關,多用于描述地形對位置的影響,因此,它是分析研究地下水潛力的地形因素。TWI計算公式為:
其中:α為上坡面積,即流經地表某點的單位等高線長度上的匯流面積,反映徑流在流域中任一點的累積趨勢;β為該點的坡度,反映徑流沿坡面移動的趨勢。將該因子分為6類:[0, 3.45)、[3.45, 6.33)、[6.33, 9.21)、[9.21, 12.09)、[12.09, 13.70)、[13.70,+∞)。
(7) 公路緩沖區(qū)。道路因素距離在地下水的預測中起著重要作用,一旦在該地區(qū)修建道路,將改變地形,并且將影響斜坡的結構。本文從地形圖和Google衛(wèi)星圖中提取路網,設置500 m間隔的緩沖區(qū),分為6類(單位為m):[0, 500)、[500,1 000)、[1 000,1 500)、[1 500, 2 000)、[2 000,3 000)、[3 000,+∞)。
(8) 水系緩沖區(qū)。河流是地下水補給的重要來源,研究區(qū)內水系密布,正確計算從井到最近的河流距離對于本研究有重要影響。結合研究區(qū)水文條件,將水系兩側緩沖區(qū)分為6類(單位為m):[0,100)、[100,200)、[200,300)、[300,400)、[400,500)、[500,+∞)。
(9) 河網密度。河網密度代表著地表徑流的距離接近程度和數(shù)量之間的聯(lián)系,河網密度大會導致地表水的滲透量降低,對地下水資源產生負面影響。流域河網密度可用平均河長和平均相鄰面積之比表示。
若面積為A的流域河流或河段總長度為L,則河網密度D為:
使用ArcGIS10.2中的線密度函數(shù)模塊,將河網密度(單位為km/km2)劃分為5類:[0,0.17)、[0.17,0.47)、[0.47,0.76)、[0.76,1.11)、[1.11,+∞)。
(10) 斷裂緩沖區(qū)。斷層可能是潛在的導水或阻水通道,對地下水潛力分析有一定影響。本文從1∶200 000的地質圖中矢量化斷層信息,在ArcGIS10.2中利用柵格到斷層線的歐氏距離將斷裂緩沖區(qū)分為6類(單位為m):[0,500)、[500,1 000)、[1 000,1 500)、[1 500,2 000)、[2 000,3 000)、[3 000,+∞)。
(11) 巖性。巖性決定了含水層的孔隙度和滲透率。本文從研究區(qū)域地質圖中提取巖性類別,將巖性單元按地層分組重新分類為12類,其巖性特征見表2所列。
表2 研究區(qū)巖性特征
因子存在多重共線性會降低線性模型的預測精度。統(tǒng)計學中,多重共線性分析能檢驗多元回歸模型中每個變量的獨立性,對確?;貧w模型預測的準確性非常重要。在GWPA中還沒有接近完美的線性組合因子。方差膨脹因子(variance inflation factor,VIF)和公差(tolerance,TOL)經常用于確認各因子之間的多重共線性,而TOL小于0.2或VIF大于5表示因子具有多重共線性問題。
WoE模型最初是為礦產潛力評估而開發(fā)的。作為貝葉斯概率模型的一種,該方法的核心是提取與所發(fā)生事件相關一組誘發(fā)因子的“易發(fā)生”與“不易發(fā)生”的二值化數(shù)值,構成預測模型,定量化地分析每個因子的影響權重,并預測未來事件可能發(fā)生的概率大小[13-14]。本文結合因變量(井位置)和自變量(地下水評價因子)之間的空間關系,計算每類因子的權重W,其表達式為:
(1)
C=Wi+-Wi-
(2)
(3)
(4)
(5)
(6)
(7)
該方法首先計算每類因子的柵格數(shù)和水井數(shù),然后通過(1)~(7)式計算每類因子的權重W,基于其總和W總得到基于WoE的地下水潛力圖,即
W總=W海拔高度+W坡度+W坡向+W平面曲率+
W剖面曲率+W地形濕度指數(shù)+W河網密度+
W公路緩沖區(qū)+W斷裂緩沖區(qū)+W水系緩沖區(qū)+W巖性
(8)
多重共線性診斷結果見表3所列,VIF的最高值為4.137,TOL的最低值為0.259,表明本研究中11個評價因子之間沒有多重共線性。
表3 多重共線性診斷值
計算單元大小對于評價模型的精度有重要影響,本文選取柵格大小為30 m×30 m,使用ArcGIS10.2獲取各評價因子圖層,轉換為柵格數(shù)據(jù)。根據(jù)(1)~(7)式進行計算,得到評價因子的證據(jù)權重W。
根據(jù)(8)式進行疊加分析,獲得評價單元的綜合權重W總,最大值為26.22,最小值為-4.62,數(shù)值越大,反映該因子對地下水存在潛力的貢獻越大,地下水存在的可能性越大。為了將累積的權重轉換成有意義的圖,對綜合權重進行重分類,最后得到基于W總的地下水潛力區(qū)劃。
本文將研究區(qū)地下水潛力等級劃分為低、中、較高、高4類。
WoE模型評價結果如圖3所示。
圖3 WoE模型評價結果
各評價因子分類及證據(jù)權重見表4所列。
表4 各評價因子分類及證據(jù)權重
續(xù)表
高程在[91,116)區(qū)間內,W有最大值1.810,表明高程在該區(qū)間對研究區(qū)地下水潛力有最積極的影響,W值通常與研究區(qū)域的高程成正比關系。坡度中,只有第1類[0,1.72)和第2類[1.72,3.47)和地下水的存在有關系,其余類則起到相反的作用,該結果表明隨著坡度增加,滲透量減少,徑流量增加。坡向的9類中,僅南(W=2.437)、西南(W=1.460)和西(W=0.474)3類對地下水存在有積極的影響,可以根據(jù)優(yōu)勢徑流方向來解釋。平面曲率在[-0.29,0.06)、[0.06,0.29)類W為正,表明平坦區(qū)域更有利于地下水的出露。
剖面曲率W值表明[-0.13,0)類對地下水存在具有最積極的影響。TWI表示保水的形態(tài)趨勢,隨著TWI增大,對地下水出露的積極影響總體上是增加的。河網密度方面,各類W值隨著河網密度增加而減少。水系緩沖區(qū)方面,只有[500,+∞)類對地下水的發(fā)生具有積極影響,其他類具有消極影響,這可能是由研究區(qū)內地下水補給地表徑流導致的。對于公路緩沖區(qū), [0, 500)、[2 000,3 000)、[3 000,+∞)3類對地下水的出露具有積極影響。斷裂緩沖區(qū)中除[500,1 000)、[1 500,2 000)2類外其余4類W均為正值,這表明斷裂破碎帶很可能是區(qū)域導水通道,對研究區(qū)地下水的發(fā)生有積極影響。巖性中第四系粉砂巖、桂五組氣孔狀玄武巖、張橋組砂巖的W較大,可以解釋為不同巖性水力傳導率不同。
評價模型準確性受很多因素控制,如評價因子的權重和數(shù)據(jù)質量的好壞等。通過比較分類結果與實際結果之間的“匹配”度可以判斷一個模型預測質量的有效性。本研究用ROC曲線來判斷評價結果的有效性,其ROC曲線下面積(area under the curve,AUC)可用來判斷模型評價結果的精度。AUC指標越接近1,表明評價效果越好。ROC曲線如圖4所示,WoE模型的AUC值為0.783 5,具有較好的精度。
圖4 ROC曲線
此外,將訓練點形成的區(qū)劃結果與驗證點分布情況進行疊加分析,統(tǒng)計結果見表5所列。區(qū)內地下水高潛力區(qū)和較高潛力區(qū)的面積分別為554.9、839.5 km2,分別占總面積的22.98%、34.76%;驗證點數(shù)量分別為10、13個,占總驗證點比例分別為29.41%、38.24%。中潛力區(qū)和低潛力區(qū)驗證點分布較少。上述結果表明,驗證數(shù)據(jù)集的分布和模型評價結果具有較好的相關性,地下水潛力區(qū)劃能夠客觀地反映區(qū)內地下水的可能分布情況。
表5 地下水潛力區(qū)劃統(tǒng)計結果
(1) 在GWPA中,基于空間統(tǒng)計方法的WoE模型具有較高的精度,WoE模型通過對各因子圖層與井點分布圖層的疊加分析,獲得評價指標權重值,較客觀地反映各評價因子影響大小。本文選取高程、坡度、坡向、平面曲率、剖面曲率、TWI、河網密度、公路緩沖區(qū)、斷裂帶緩沖區(qū)、水系緩沖區(qū)和巖性11類因子作為GWPA評價因子,采用WoE模型和多重共線性分析對明光市地下水潛力進行評價和分區(qū)。結果顯示,WoE模型的ROC檢驗AUC值為78.35%,表明該模型能較客觀地評價明光市地下水潛力。
(2) WoE模型得出的明光市地下水低、中、較高、高潛力區(qū)分別占研究區(qū)面積的13.08%、29.18%、34.76%和22.98%。驗證結果顯示,地下水井點集中分布在中、高潛力區(qū)內,占總驗證井數(shù)的91.18%。
(3) WoE模型結合地下水井數(shù)據(jù)庫和專題圖層信息可以較好地避免權重賦值時的主觀性,生成較為可靠的GWPA圖,簡單易操作,具有更好的時間和成本效益。