羅紫元,田 健,丁鍶湲,王 寧,2,曾 堅
(1.天津大學 建筑學院,天津 300072; 2.廈門市城市規(guī)劃設(shè)計研究院,福建 廈門 361012)
降雨產(chǎn)生的洪澇災(zāi)害是城市環(huán)境中最常見、最具破壞性的自然災(zāi)害之一,對居民生活和財產(chǎn)構(gòu)成多方面威脅。有效繪制災(zāi)害風險圖,能夠為精準施策、減輕災(zāi)害風險提供依據(jù)[1]。
參考聯(lián)合國國際減災(zāi)戰(zhàn)略(UNISDR)的災(zāi)害風險評價模型[2-4](式1)對城市雨洪災(zāi)害風險進行評估。
Risk=H×V×E。
(1)
式中:H、V、E分別指代風險評估的三個維度,H代表災(zāi)害危險性[5],即在誘發(fā)因素作用下產(chǎn)生雨洪災(zāi)害的可能性;V代表城市系統(tǒng)的應(yīng)災(zāi)脆弱性[6],即城市物質(zhì)環(huán)境和社會經(jīng)濟面對雨洪災(zāi)害影響的固有敏感性;E表示風險暴露度[6],即系統(tǒng)暴露在雨洪災(zāi)害下引發(fā)生命財產(chǎn)損失的程度。
以往研究多采用多準則評價的方法對雨洪災(zāi)害風險的各維度影響因子進行賦權(quán),進而通過GIS疊加計算研究區(qū)的整體災(zāi)害風險[7-8]。應(yīng)災(zāi)脆弱性和風險暴露度的影響因子選取多集中在風險源空間分布、救援疏散能力和人口經(jīng)濟分布等方面。但災(zāi)害危險性涉及的影響因子復(fù)雜,較難確定各項因子的實際貢獻,很大程度上影響著災(zāi)害危險性的評價準確性。此外,雨洪災(zāi)害危險性的評價與雨洪淹沒數(shù)據(jù)最直接相關(guān),而所用雨洪災(zāi)害數(shù)據(jù)的全面性和準確性仍有待提升,以上兩方面都意味著災(zāi)害危險性的評價精度仍有進一步提升的空間。近年來,邏輯回歸[1]、隨機森林[9]、粒子群和支持向量機[10]等機器學習方法在城市暴雨洪澇災(zāi)害危險性和易感性等評價中得到大量應(yīng)用,其通過直接建立影響因子與洪澇發(fā)生可能性之間的關(guān)系,避免主觀因素的影響,提高模擬評價的準確性。
因此,本研究在以往多準則評價的基礎(chǔ)上,采用了一種機器學習與GIS多準則決策相結(jié)合的雨洪風險評估方法,以熵權(quán)TOPSIS模型評估廈門市的雨洪應(yīng)災(zāi)脆弱性和風險暴露度,以神經(jīng)網(wǎng)絡(luò)模型模擬評價災(zāi)害危險性,最終實現(xiàn)對廈門市雨洪災(zāi)害風險的評估。其中主要對雨洪淹沒數(shù)據(jù)的獲取和雨洪災(zāi)害危險性影響因子的篩選進行了創(chuàng)新。
廈門市位于福建省東南沿海,是廈漳泉閩三角城市群的中心城市,市轄思明區(qū)、湖里區(qū)、海滄區(qū)、集美區(qū)、同安區(qū)和翔安區(qū)6個城區(qū)(圖1)。2000年以來,廈門市社會經(jīng)濟活動高速發(fā)展、城鎮(zhèn)建設(shè)及人口高密度聚集,截至2020年全市排水管道長度已達到4 427.7 km,基本實現(xiàn)全覆蓋。但面對越來越難以預(yù)測的雨洪災(zāi)害,城市仍存在排水系統(tǒng)壓力過載等沿海地區(qū)典型的城市問題,部分城區(qū)受到風暴潮、洪水、內(nèi)澇積水的嚴重威脅。
圖1 研究區(qū)所在區(qū)位示意圖(該圖基于中國標準地圖(GS(2021)6026號)和福建省標準地圖(GS(2017)1268號)繪制,底圖無修改,下同)
1.2.1 雨洪淹沒數(shù)據(jù)
雨洪災(zāi)害風險評估的準確性很大程度上受到雨洪淹沒數(shù)據(jù)的影響。以往研究中常采用歷史洪澇信息[11]、無源淹沒算法[12]、水文水力計算[13]或遙感影像解譯[14]的方式獲取雨洪淹沒信息,開展災(zāi)害危險性模擬評價,而這些方法一定程度上受到數(shù)據(jù)的影響和限制。在實際雨洪過程中,淹沒往往以面的形式存在,但歷史洪澇信息僅以坐標點的形式記錄各雨洪淹沒面的質(zhì)心[11]。此外,受觀測點和數(shù)據(jù)完整性等方面影響,較難確定其他地點是否存在雨洪淹沒,也就意味著歷史洪澇信息中存在大量被省略和未統(tǒng)計的淹沒點,較難完整全面地表達實際災(zāi)情。無源淹沒算法僅考慮降雨導致的水位上漲,而不考慮地表徑流的流動情況和城市排水系統(tǒng)的作用,計算得到的淹沒范圍往往與實際存在一定差距。同時,無源淹沒算法的輸入數(shù)據(jù)與DEM、坡度、坡向等常用的影響因子存在較高的同源性,較難反映真實的雨洪淹沒情況。水文水力計算的結(jié)果通常具有較高的準確率,但其對水文和管線數(shù)據(jù)要求較高[10]。這些數(shù)據(jù)的獲取存在一定難度,因此較少能夠在研究中普遍運用。遙感影像解譯為獲取實際雨洪淹沒范圍提供了經(jīng)濟、便捷的方式,其誤差主要來源于水體識別過程中水體懸浮物、植被、山體陰影等產(chǎn)生的干擾。此外,未排除河流湖泊等永久性水體也會導致模型擬合度異常增高。
綜上,研究以衛(wèi)星遙感影像獲取廈門市多年期(2010—2020年)的雨季(4—9月,包括梅雨季和臺風雨季)遙感影像[15],經(jīng)過解譯并剔除常水位的永久性水體后,鑲嵌形成廈門市雨洪淹沒范圍。研究一方面選取解譯準確度較高的影像結(jié)果,另一方面從鑲嵌的雨洪淹沒范圍中剔除淹沒頻次小于3次的斑塊,以減少遙感解譯誤差可能帶來的影響。這雖然可能帶來一定淹沒范圍的損失,但同時也能夠排除其他因素導致的偶然性淹沒。研究以淹沒頻次作為災(zāi)害危險性的劃分標準,淹沒頻次越高意味著發(fā)生雨洪災(zāi)害的可能性越高,雨洪災(zāi)害的危險性相應(yīng)增加。將淹沒頻次3次以上的斑塊,以自然間斷點分級法分為從Ⅰ級偶發(fā)到Ⅴ級頻發(fā)的5類。統(tǒng)計結(jié)果表明,Ⅰ級偶發(fā)型淹沒是廈門市雨洪災(zāi)害淹沒范圍的主體,占比65.9%,而Ⅲ、Ⅳ、Ⅴ級較多發(fā)區(qū)域占比14.5%。對非淹沒區(qū)和Ⅰ~Ⅴ級雨洪淹沒區(qū)隨機采取300個采樣點用于機器學習模型訓練模擬,其中隨機選取70%的采樣點作為訓練集,用于模型訓練驗證,另30%作為測試集,用于模型測試。
1.2.2 雨洪災(zāi)害風險評價指標體系
根據(jù)公式(1),選取評價脆弱性、暴露度和危險性的指標因子(表1)。表1中匯總整理了既有研究中涉及的雨洪災(zāi)害危險性指標因子,但指標因子種類繁多,因子自相關(guān)等潛在問題對機器學習準確模擬雨洪災(zāi)害危險性存在較大影響。較少有研究在機器學習模擬前開展因子篩選[16],減輕模型的冗余和過擬合等問題[17-18]。因此研究在機器學習模擬雨洪災(zāi)害危險性前,通過統(tǒng)計學和隨機森林算法等篩選適合研究區(qū)的雨洪災(zāi)害危險性指標因子。
脆弱性是承災(zāi)體的內(nèi)在屬性,由影響人類社會面對災(zāi)害敏感性的自然生態(tài)和社會經(jīng)濟兩個方面要素決定(圖2)。自然生態(tài)系統(tǒng)中,城市受雨洪災(zāi)害的影響與水系河網(wǎng)的分布密切相關(guān),河網(wǎng)密度越高,與水體間的距離越小,用地受到雨洪災(zāi)害影響的可能性越大。社會經(jīng)濟系統(tǒng)中,城市的應(yīng)災(zāi)脆弱性與城市應(yīng)災(zāi)疏散能力的強弱有關(guān),道路密度高、距離道路距離近的地區(qū)具有更好的應(yīng)災(zāi)疏散能力,面對雨洪災(zāi)害的脆弱性相對更小。
雨洪災(zāi)害風險的暴露度與承災(zāi)體的人員、資源、生計、環(huán)境服務(wù)以及經(jīng)濟、社會和文化資產(chǎn)的狀況有關(guān)。自然生態(tài)系統(tǒng)的價值損失可以表征為生態(tài)系統(tǒng)提供生態(tài)服務(wù)價值的降低。結(jié)合暴雨洪澇災(zāi)害的影響特征,研究選取生態(tài)系統(tǒng)服務(wù)價值中的氣候調(diào)節(jié)、水文調(diào)節(jié)、土壤保持和生物多樣性作為暴露度評價的指標因子。社會經(jīng)濟系統(tǒng)產(chǎn)生的災(zāi)損與人口集聚、開發(fā)建設(shè)密度、經(jīng)濟發(fā)展水平等密切相關(guān),研究選取人口密度、經(jīng)濟水平(GDP)、夜間燈光指數(shù)、農(nóng)業(yè)生產(chǎn)價值、美學景觀價值作為反映城市社會經(jīng)濟狀況的指標(圖3)。
表1 廈門市雨洪災(zāi)害風險評價指標體系
圖2 廈門市雨洪災(zāi)害應(yīng)災(zāi)脆弱性評價指標因子
圖3 廈門市雨洪災(zāi)害風險暴露度評價指標因子
本研究整合多準則決策分析中的熵權(quán)法和TOPSIS法對城市雨洪災(zāi)害的脆弱性和暴露度進行評估。熵權(quán)法根據(jù)指標自身的數(shù)據(jù)離散程度確定權(quán)重,是一種相對客觀的賦權(quán)方法[21],數(shù)據(jù)離散程度大的指標能夠提供相對較多的信息,從而影響綜合評價結(jié)果,因而被賦予更大的權(quán)重。TOPSIS法從一系列方案中選取解決方案,使所選方案與正理想解的距離最小,與負理想解的距離最大[22]。以熵權(quán)法確定各因子權(quán)重,繼而將指標因子與權(quán)重的乘積作為新的數(shù)據(jù),通過TOPSIS模型度量新數(shù)據(jù)中各指標值與最優(yōu)解間的距離,從而按距離進行綜合排序,其相較于傳統(tǒng)TOPSIS法更為客觀[22]。研究通過以下步驟實現(xiàn)熵權(quán)TOPSIS方法:
(1)數(shù)據(jù)標準化。根據(jù)測度對象涵蓋的m個類別和n項指標因子建立評價系統(tǒng)的原始數(shù)據(jù)矩陣(式2)。通過極差標準化法對數(shù)據(jù)進行標準化處理(式3)。
(2)
(3)
(2)熵權(quán)法確定指標因子權(quán)重。根據(jù)數(shù)據(jù)標準化結(jié)果,采用式(4)計算第i個類別中第j項指標的比重Yij,按式(5)至式(7)計算第j項指標的信息熵Ej和信息冗余度dj,從而計算指標權(quán)重ωj(式8)。
(4)
(5)
(6)
dj=1-Ej;
(7)
(8)
(9)
(10)
(11)
(12)
(13)
(14)
研究首先通過多重共線性分析、地理探測器和隨機森林算法篩選雨洪災(zāi)害危險性指標因子,隨后采用3種常用的機器學習方法進行模型訓練,從中選取效果最優(yōu)的機器學習方法模擬雨洪災(zāi)害危險性。
2.2.1 基于多重共線性分析篩選指標因子
多重共線性是一種統(tǒng)計學指標,意味著模型中的某些解釋變量以線性形式高度相關(guān),從而可能導致模型估計失真[10]。通過方差膨脹因子 (VIF)和容忍值(TOL)分析多重共線性強度,剔除存在強自相關(guān)的因子能夠提高模型的計算能力。理論上,當VIF>10或TOL<0.1表示因子中存在多重共線性問題[23]。表2中顯示了剔除高度自相關(guān)因子后的多重共線性分析結(jié)果。
表2 剔除高自相關(guān)因子后的多重共線性分析結(jié)果
表3 雨洪災(zāi)害危險性與所選因子間相對重要性的q、p值
2.2.2 基于地理探測器和隨機森林算法篩選指標因子
地理探測器不需要線性假設(shè)即可度量變量間的統(tǒng)計關(guān)系[24],但分析結(jié)果易受到因子多樣性、數(shù)據(jù)離散化等因素影響。隨機森林能夠處理多因子的高維數(shù)據(jù)并維持較好的準確性。綜合2種方法篩選因子以提高后續(xù)機器學習模擬的運算能力。
采用地理探測器分析雨洪災(zāi)害危險性Y與表2中各指標因子X間的相對重要性,其相對解釋程度以q值(式15)表示。其中,N表示模型單元數(shù),σ2表示Y值的方差,A表示X分層數(shù),q取值在0~1之間,q值越大表示因子對Y的影響越大。
(15)
采用正則化隨機森林(Regularized Random Forest,RRF)算法對雨洪災(zāi)害危險性的評價指標因子重要性進行排序。隨機森林算法能夠通過多決策分類樹判別輸入變量的重要性,而正則化能夠降低過擬合,其效果優(yōu)于單一分類器[25]。
綜合地理探測器和隨機森林算法的分析結(jié)果,研究選取了表3所示的13項指標因子,其隨機森林模型擬合優(yōu)度為74.3%,效果較好。
盡管土地覆蓋、降雨量等因子被證明和以往研究一樣是影響雨洪災(zāi)害危險性的相對重要因素,但并非以往研究中采用的所有評價因子都對廈門市雨洪災(zāi)害危險性具有較強的影響,如:沉積物輸送指數(shù)、平面曲率等。此外,本研究根據(jù)研究區(qū)特點補充的沿海壓力和以道路系統(tǒng)代替的排水系統(tǒng)相關(guān)指標因子也表現(xiàn)出較高的重要性。
2.2.3 機器學習模型的選擇和開發(fā)
在MATLAB中構(gòu)建了包括支持向量機、提升決策樹和神經(jīng)網(wǎng)絡(luò)的多種機器學習模型進行雨洪災(zāi)害危險性評估,比較其模擬效果。
(1)支持向量機。支持向量機是一種基于結(jié)構(gòu)誤差最小化原理的機器學習算法[26],具有出色的非線性分區(qū)能力,是在雨洪災(zāi)害風險評估中得到大量運用的機器學習模型之一[17]。該算法的目的是確定一個最佳的分割超平面,對數(shù)據(jù)進行按維度分類,以減少泛化誤差并最大化不同類別數(shù)據(jù)之間的差異。
(2)提升決策樹。提升決策樹通過融合決策樹算法和提升方法,以決策樹為基礎(chǔ)分類器,將弱分類器組合成強分類器[27]。該算法在每次迭代中每一棵回歸樹以之前回歸樹的結(jié)論和殘差進行訓練,擬合形成當前的殘差回歸樹,已經(jīng)被證明是一種具有高效率和低偏差的強大分類模型[22,28]。
(3)神經(jīng)網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)模型是模擬真實神經(jīng)系統(tǒng)的簡單建模,廣泛用于解決各種科學問題。其能夠在不同尺度上執(zhí)行運算,解決高復(fù)雜性非線性問題,而不需要特定的統(tǒng)計分布優(yōu)勢,已被應(yīng)用于自然災(zāi)害風險評估[12,15]。本研究根據(jù)數(shù)據(jù)特征選擇了由1個輸入層、1個隱含層和1個輸出層組成的神經(jīng)網(wǎng)絡(luò)。
3.1 廈門市雨洪應(yīng)災(zāi)脆弱性
通過熵權(quán)TOPSIS法評價應(yīng)災(zāi)脆弱性,根據(jù)理想解相對貼近度繪制廈門市雨洪災(zāi)害應(yīng)災(zāi)脆弱性圖,并按照自然間斷點分級法分為從極低到極高的5類(圖4)。結(jié)果表明有29.1%的用地雨洪脆弱性較高或極高,主要分布在河網(wǎng)水系附近且距離救援疏散道路較遠的地區(qū)。在建成區(qū)范圍內(nèi),海滄區(qū)貞岱、浦邊等村莊、集美區(qū)大東山附近以及翔安區(qū)馬巷鎮(zhèn)表現(xiàn)出較高的應(yīng)災(zāi)脆弱性,廈門島的雨洪脆弱性較低。
圖4 廈門市雨洪災(zāi)害應(yīng)災(zāi)脆弱性圖
同理繪制廈門市雨洪災(zāi)害風險暴露度圖,并按自然間斷點分為從極低到極高的5類(圖5),廈門市雨洪暴露度的高值區(qū)占比38.9%,主要集中在市域東部的同安區(qū)和翔安區(qū)。
圖5 廈門市雨洪災(zāi)害風險暴露度圖
以擬合優(yōu)度R2作為判別機器學習績效的指標,R2越接近1表示模型擬合效果越好。支持向量機、提升決策樹和神經(jīng)網(wǎng)絡(luò)模型的R2依次為0.63,0.68和0.71。結(jié)果表明:神經(jīng)網(wǎng)絡(luò)模型在模擬預(yù)測廈門市雨洪災(zāi)害危險性上具有較好的表現(xiàn)。
根據(jù)經(jīng)驗公式和實際模擬效果,采用神經(jīng)網(wǎng)絡(luò)工具箱構(gòu)建指標輸入層節(jié)點數(shù)為13,隱含層節(jié)點數(shù)為17,評價輸出層節(jié)點數(shù)為6的單隱含層神經(jīng)網(wǎng)絡(luò),設(shè)置最大迭代次數(shù)為1 000,采用Sigmoid激活函數(shù)和貝葉斯正則化算法對模型進行訓練和測試。訓練和測試集準確率分別為0.906,0.825,模型總準確率達到0.885,表明該模型能夠捕獲指標因子與災(zāi)害危險性之間的關(guān)聯(lián),網(wǎng)絡(luò)辨識精度較高。
根據(jù)訓練的神經(jīng)網(wǎng)絡(luò)模型,計算廈門市當前雨洪災(zāi)害危險性作為模型的輸出。繪制廈門市雨洪災(zāi)害危險性圖,采用自然間斷點分級法將危險性分為圖6所示的5類。廈門市雨洪災(zāi)害危險性較高區(qū)域主要分布在河流及海岸沿線,如海滄區(qū)嵩嶼街道、集美區(qū)集美街道、同安區(qū)大同鎮(zhèn)、西柯街道、翔安區(qū)前浯村、新店鎮(zhèn)等,其中,同安區(qū)及翔安區(qū)的雨洪災(zāi)害危險性明顯高于其他城區(qū)。對于廈門島內(nèi)地區(qū),思明區(qū)湖濱南片區(qū)、廈港街道、沙坡尾和湖里區(qū)五緣灣片區(qū)、金山街道發(fā)生雨洪淹沒的可能性較高,與實際的城市洪澇情況較一致。這些區(qū)域不僅距離水體等風險源較近,且地形相對平坦、建筑物密集、地表不透水率較高,導致排水能力較弱。極低易感地區(qū)主要分布在海拔較高、地表透水性較好的林草地和耕地處。此外,馬鑾灣、杏林灣等水體濕地也表現(xiàn)出較低的雨洪災(zāi)害危險性,并且隨著水體向岸線逐漸過渡,受降雨匯流等導致水深增加等影響,雨洪淹沒的危險性增加。結(jié)果表明:本研究中以淹沒頻次劃分的雨洪淹沒數(shù)據(jù)能夠保證較高的模型擬合優(yōu)度,并在避免將既有水體錯誤識別為高危險區(qū)的基礎(chǔ)上,較準確的將水體附近的易淹沒區(qū)劃分為風險區(qū)域,從而取得較貼合實際的災(zāi)害危險性評價結(jié)果。
圖6 廈門市雨洪災(zāi)害危險性圖
根據(jù)式(1)中的風險評價模型進行廈門市的雨洪災(zāi)害風險評價制圖(圖7)。結(jié)果表明,廈門市大部分地區(qū)雨洪災(zāi)害風險較低,占比56.7%,雨洪災(zāi)害風險較高的區(qū)域占比5.9%,主要分布在同安區(qū)和翔安區(qū),少量分布在集美區(qū)和思明區(qū),其中有1.8%的地區(qū)雨洪災(zāi)害風險極高,分布在同安區(qū)祥平街道、西柯街道及翔安區(qū)馬巷鎮(zhèn)和新店鎮(zhèn)。
圖7 廈門市雨洪災(zāi)害風險圖
研究采用熵權(quán)TOPSIS與神經(jīng)網(wǎng)絡(luò)構(gòu)建的復(fù)合模型評估廈門市雨洪災(zāi)害風險,其中以熵權(quán)TOPSIS法評估廈門市面對雨洪災(zāi)害的應(yīng)災(zāi)脆弱性和風險暴露度,以神經(jīng)網(wǎng)絡(luò)模型模擬評價災(zāi)害危險性。
(1)通過多重共線性檢驗、地理探測器和正則化隨機森林算法可以篩選具有研究區(qū)針對性的危險性指標因子,除土地覆被和降雨量等因子外,本研究采用的沿海壓力和排水系統(tǒng)相關(guān)指標因子也表現(xiàn)出較高的重要性。沿海城市有必要考慮將沿海壓力納入雨洪災(zāi)害風險評價指標體系,排水管網(wǎng)高度普及的城市可以根據(jù)指標實際情況,將道路系統(tǒng)作為排水系統(tǒng)的數(shù)據(jù)替代。
(2)神經(jīng)網(wǎng)絡(luò)模型在本研究的災(zāi)害危險性評價中表現(xiàn)出最優(yōu)的訓練精度(0.885),基于多年期雨季淹沒頻次的雨洪淹沒圖在取得符合實際的評價結(jié)果同時能夠保證較高的擬合優(yōu)度。
(3)河道附近和遠離道路的用地應(yīng)災(zāi)脆弱性較高,占全市用地的29.1%。同安區(qū)和翔安區(qū)的用地風險暴露度較高,占比38.9%。廈門市56.7%的區(qū)域處于低雨洪風險,5.9%的區(qū)域雨洪風險較高,其中1.8%的用地面臨極高風險,分布在同安區(qū)祥平街道、西柯街道及翔安區(qū)馬巷鎮(zhèn)和新店鎮(zhèn)。
本研究對雨洪災(zāi)害風險的評價可以作為雨洪災(zāi)害管理的第一步,為高風險區(qū)的識別與施策提供支持。
(1)本研究在整理常用的雨洪災(zāi)害危險性評價因子的基礎(chǔ)上,結(jié)合研究區(qū)特點加入沿海壓力因子,并通過多重共線性檢驗、地理探測器和正則化隨機森林算法開展指標篩選,相比以往研究中根據(jù)經(jīng)驗選取評價因子一定程度上提高了科學性。
(2)本研究根據(jù)解譯的多年期雨季遙感影像獲取雨洪淹沒數(shù)據(jù),并按淹沒頻次制作了雨洪淹沒圖,在一定程度上規(guī)避了歷史洪澇信息、無源淹沒算法和水文水力計算中存在的數(shù)據(jù)局限,但本研究的雨洪淹沒圖也存在自身不足。一方面,受衛(wèi)星重訪周期限制,研究所獲遙感影像的時期并不一定是處于最大淹沒范圍的時期,解譯也只能取得淹沒面積,而無法獲取淹沒時長信息。另一方面,雨洪淹沒范圍隨時間推移和城市雨洪管理也呈現(xiàn)一定變化,而多年期遙感影像疊加獲取的淹沒范圍弱化了這種動態(tài)性。
(3)由于目前對應(yīng)災(zāi)脆弱性和風險暴露度評價結(jié)果尚沒有公認的檢驗方法,本研究僅能夠?qū)τ旰闉?zāi)害危險性采用機器學習方法進行模擬和檢驗,仍沿用多準則評價的方式評價應(yīng)災(zāi)脆弱性和風險暴露度。