喻謙花,馮 峰,羅福生,霍繼超,馮躍華,張鵬飛
(1.開封市氣象防災減災重點實驗室,河南 開封 475004; 2.黃河水利職業(yè)技術學院,河南 開封 475004;3.河南省黃河中下游水資源節(jié)約集約利用工程技術中心,河南 開封 475004;4.河南省豫東水利工程管理局,河南 開封 475004)
2021 年7 月20 日,河南省遭遇極端強降雨。 7 月18 日8 時至20 日15 時30 分,鄭州滎陽、鞏義的7 個雨量站降雨量超600 mm,最大點雨量718.5 mm[1]。極端強降雨引起河南多地出現嚴重城市內澇,防汛形勢十分嚴峻[2]。 城市內澇威脅城市居民生命財產和出行安全,造成了巨大經濟損失[3-4]。 近年來聚焦于城市內澇的研究主要集中在內澇引發(fā)的災害、形成的原因、治理的措施等方面[5-9]。 對于城市內澇模擬和預報研究,欒震宇等[10]基于MIKE FLOOD 平臺將MIKE URBAN 和MIKE 21 模型耦合,建立城市內澇模型,對湖南省新化縣典型區(qū)域的排澇情景進行模擬,表明該模型適用于城市內澇風險評估管理;曾照洋等[11]將SWMM 一維管網模型及LISFLOOD-FP 二維水動力模型進行耦合,對東莞市典型區(qū)域進行暴雨內澇模擬,實現了研究區(qū)暴雨內澇淹沒范圍與淹沒水深的模擬;陸敏博等[12]以蘇州市相城區(qū)為例,采用Mike 模型建立排水防澇系統(tǒng)耦合模型,同時考慮平原河網地區(qū)城市排水防澇特征,將恒定均勻流推理公式法、水量平衡法與數學模型法相結合,評估多種情景下的雨水系統(tǒng)排水能力和內澇風險。 雖然取得了較多成果,但大部分研究是在水動力模型基礎上模擬運行的,沒有建立契合區(qū)域特點的數學模型進行模擬預報[13-15]。ARIMA(Auto-Regressive Integrated Moving Average)模型全稱為自回歸積分滑動平均模型,其基本思路是將預測對象隨時間推移而形成的數據序列視為一個隨機序列,用一定的數學模型來近似描述這個序列。 ARIMAX 模型能更好地表達系統(tǒng)中多元時間序列的變化規(guī)律,建立了除其自身的變化規(guī)律外,含有多個輸入變量的很多時間序列模型[16]。 左其亭等[17]以塔里木河流域為典型實例,將ARIMAX 運用到了水資源動態(tài)承載力預測中,通過構建徑流與氣溫、降水等氣象因子的ARIMAX 動態(tài)回歸預測模型,分析計算RCP8.5、RCP 4.5和RCP2.6 三種氣候情景下塔里木河流域未來不同水平年水資源動態(tài)承載力。 將ARIMAX 應用到城市內澇預報中,一方面城市內澇除有其自身的變化規(guī)律外,還會受到其他多個時間序列的影響,比如降水時間序列,適用于ARIMAX 模型的構建條件;另一方面,通過樣本數量積累和動態(tài)更新訓練,可建立更加精準的ARIMAX 計量模型。 相對其他方法,ARIMAX 模型能夠更快實現內澇預報準確率的提高,從而有效增強城市管理和防洪避災能力。
暴雨產生的城市內澇積水,除了積水深度是時間序列外,還受到降水時間序列的影響,因此將降水過程也作為城市內澇積水的研究范圍。 應用多元時間序列ARIMAX 模型,建立較為完整的預報內澇積水深度計量模型,更好地描述降水量與積水深度之間的關系,從而有效預測城市內澇積水深度及其變化過程[18]。
ARIMAX 模型的構造思路:假設響應序列(因變量序列)yt和輸入變量序列(即自變量序列)x1t、x2t、 …、xkt均為平穩(wěn)序列,先構建響應序列和輸入變量序列的回歸模型,如式(1)所示。
式中:Ψi(B)為殘差序列自回歸系數多項式;Yi(B)為殘差序列移動平均系數多項式;at為零均值白噪聲序列。
動態(tài)回歸模型的建立是基于響應序列與自變量序列存在長期均衡關系的假設而實現的,并不是所有的序列都可以建立動態(tài)回歸模型,只有存在長期均衡關系的序列才適合建立動態(tài)回歸模型。
第1 步:對響應序列yt和輸入變量序列x1t、x2t、…、xkt進行平穩(wěn)性檢驗。
第2 步:對經過適當變換及差分后平穩(wěn)的輸入序列x1t、x2t、…、xkt運用ARIMA 模型,產生白噪聲序列,如式(4)所示。
第3 步:對經過適當變換及差分后平穩(wěn)的響應序列yt運用ARIMA 模型, 產生殘差白噪聲序列,如式(5)所示。
開封市位于黃河下游,河南省中東部,東經113°51′51″—115°15′42″,北緯34°11′43″—35°11′43″,總面積6 444 km2,主城區(qū)面積546 km2[21]。 境內河流眾多,分屬黃河和淮河兩大水系。 屬暖溫帶大陸性季風氣候區(qū),年均氣溫為15.2 ℃,年均降水量為627.5 mm,降水集中在夏季7—8 月。 區(qū)域內地勢平坦,土壤多為黏土、壤土和沙土,發(fā)生降雨時不能將雨水有效就地下滲利用,遇到暴雨,市內易形成多個內澇積水點,嚴重影響城市的防洪安全和居民出行。 因此,開展城市暴雨內澇預報研究顯得非常迫切和必要。
開封市主城區(qū)內共有7 個氣象站,分布于主城區(qū)4 個區(qū)內。 其中:龍亭區(qū)面積最大,有3 個氣象站;順河區(qū)有2 個,鼓樓區(qū)和禹王臺區(qū)各有1 個。 將7 個氣象站編號為A~G,其中A 站為國家氣象站,B ~G 站為區(qū)域加密氣象站。 國家氣象站數據2021 年綜合傳輸質量為99.88%,區(qū)域站為99.22%,各站數據可用率均為100%。
根據開封氣象站監(jiān)測數據,2021 年7 月20 日0時至22 日8 時7 個氣象站逐小時降水過程如圖1 所示。 最大降水強度出現在7 月20 日22 時,A 站達到103.4 mm/h;最大3 h 累計降水量也出現在A 站,為157.0 mm;最大48 h 累計降水量仍出現在A 站,為354.7 mm,該值已達到開封年平均降水量627.5 mm 的56.5%。 7 個站的平均56 h 累計降水量為345.1 mm。根據7 個氣象站覆蓋的范圍和泰森多邊形構造原理,將開封主城區(qū)研究區(qū)域剖分為7 個多邊形,每個多邊形中包含1 個氣象站和1~4 個內澇監(jiān)測站,每個內澇積水點到相應氣象站的距離最近。 其中G 站距離內澇監(jiān)測站較遠,無最近關聯站,因此未參與模型確定。
圖1 開封市“7·20”特大暴雨降水過程(56 h)
根據開封市城區(qū)內易發(fā)生內澇積水的位置,選擇了12 個內澇自動監(jiān)測站作為研究對象,在城市的東、西、南、北4 個方向均選擇不少于2 個監(jiān)測站,并在編號中數字后進行方位標注,與氣象站的對應關系見表1。
表1 開封市內澇自動監(jiān)測站位置
使用2018—2020 年汛期(5—9 月)開封市主城區(qū)氣象站逐小時降雨量數據和內澇監(jiān)測站積水深度數據,對市區(qū)出現的積水個例與同期降水強度進行相關統(tǒng)計分析,對數據進行收集和整理。
為去除數據中的異常值且保證道路積水是由降雨導致的,通過滑動窗口法對積水數據做以下預處理:
(1)若當前時段t沒有降雨,t-1 時段沒有積水,而當前時段有積水的,將積水數據計為0。
(2)當前時段t沒有降雨,積水深度為a,t-1 時段沒有降雨,積水深度為b,若b>a,則令b=a。
(3)若t-1 時段沒有降雨,積水深度<3 cm,t時段沒有降雨,積水深度<3 cm,則令t時段積水深度為0。
城市內澇積水深度預報是一個多元時間序列分析問題,采用ARIMAX 模型實現積水點位的積水深度預報。 ARIMAX 模型只適用于平穩(wěn)型數據序列,需要對預處理的數據序列進行時間平穩(wěn)性檢驗以及白噪聲檢驗。 在一個自回歸過程中,如果滯后項系數為1,就稱為單位根。 當單位根存在時,自變量和因變量之間的關系具有欺騙性,因為殘差序列的任何誤差都不會隨著樣本量增大而衰減,也就是說模型中的殘差影響是永久的。 這種回歸又稱作偽回歸。 如果單位根存在,那么這個過程就是一個隨機漫步(Random Walk)[18]。
時間序列模型平穩(wěn)性檢驗常用的方法是ADF 檢驗(Augmented Dickey-Fuller test),也稱單位根檢驗。ADF 檢驗就是判斷序列是否存在單位根:如果序列平穩(wěn),就不存在單位根;否則,就會存在單位根。 ADF 檢驗的H0假設就是存在單位根,如果得到的顯著性檢驗統(tǒng)計量小于3 個置信度(10%,5%,1%),則對應90%、95、99%的把握拒絕原假設。 對選擇的開封市主城區(qū)A、B、…、F 氣象站降水時間序列和12 個內澇監(jiān)測站的積水時間序列進行ADF 檢驗,結果都滿足平穩(wěn)性要求,見表2。
表2 降水及內澇積水時間序列ADF 檢測結果
通過對降水和內澇時間序列進行白噪聲檢驗,計算的P值均遠小于α(0.05),即拒絕原假設,序列為非白噪聲。
繪制開封12 個內澇點的積水深度與對應降水量的自相關系數和偏自相關系數圖(見表3)。 可以看出,所有內澇點二者皆拖尾,對時間序列進行差分操作后,初步選用模型為ARIMAX(p,0,q)。 下一步需確定模型參數p和q的值,通常使用貝葉斯信息準則(BIC)確定模型階數。 設定p值范圍為0、1、2、3,q值范圍為0、1、2、3、4、5,對其進行組合,分別計算其BIC。選擇BIC 最小的p和q為模型的階數,為12 個內澇點ARIMAX 模型的最終形式,見表3。 對模型預測的結果進行白噪聲檢驗以確認建模效果,設定滯后階數為1、6、12 的白噪聲檢驗結果表明,該模型在3 種情況下的P值均遠小于0.05,說明預測模型擬合效果較好。確定ARIMAX(p,d,q)中的參數后,利用Python 中Pyflux 軟件包,輸入時間序列以及p、d、q參數值后即可自動生成模型。
表3 開封市12 個內澇點的ARIMAX 模型參數
續(xù)表3
為了檢驗模型的精度,將基于12 個內澇點建立的ARIMAX 模型進行內澇預測,并計算預測值與實際內澇積水過程的MAE(平均絕對誤差)、MSE(均方誤差)、RSME(機器學習誤差)。MAE又叫平均絕對離差,是所有單個觀測值與算術平均值的偏差的絕對值的平均值;MSE是反映估計量與被估計量之間差異程度的一種度量,其可避免誤差相互抵消的問題,能準確反映實際預測誤差的大??;RMSE為均方根誤差,能夠衡量觀測值與真實值之間的偏差,常作為衡量機器學習模型預測結果的標準[19]。 利用2018—2020 年開封主城區(qū)暴雨數據對模型進行訓練,12 個內澇點預測的3 種誤差值見表4。 其中選擇了4 個典型點的降水及內澇實測過程與模型預測過程進行對比,如圖2 所示。
表4 12 個內澇點ARIMXA 模型內澇模擬誤差
圖2 降水及內澇點積水深度實測過程與模型預測結果對比
將開封“7·20”特大暴雨的降水過程自7 月20日20:00 開始至7 月21 日20:00 結束共計24 h,作為時間序列輸入到12 個內澇監(jiān)測站的ARIMAX 模型進行預報,并對比12 個內澇監(jiān)測站的實測數據(見表5)。
表5 12 個站內澇積水深度實測值與預測值比較 cm
根據表5 的對比結果,1 h 預測誤差為1 ~10 cm,平均絕對誤差4.3 cm;2 h 預測誤差為0 ~11 cm,平均絕對誤差4.8 cm;3 h 后平均絕對誤差明顯增大,超過15 cm。 積水深度在20 cm 以內時誤差較小,50 cm 以上誤差較大。 降水2 h 內12 個站內澇預報效果較好;隨著降雨持續(xù)6 h 后,積水深度的預測值出現了一些偏差;到12 h 后,排澇泵站的啟動及其他應急預案的處理和干預,預測值與實測值的偏差較大。 總體認為短期內澇預報效果不錯,在12 個站中,7-S、9-S 兩個站的預報效果較好,這兩個站均位于老城區(qū)。
對產生誤差的原因進行分析,認為“7·20”特大暴雨形成機理極為復雜,預測難度超出目前我國在線運行的氣象模型的預測能力。 在本次預測過程中,1~2 h 降水預測以每6 min 觀測的雷達加密觀測數據為基礎,應用光流法外推技術實現短時臨近降水預測。 據評估,20 日20 時0 ~2 h 降水量級預測平均準確率為80.5%,誤差相對較小。 3~12 h 降水預測使用20 日8時氣象數值模式預測結果,暴雨預測準確率不足20%,預報誤差還會隨時間延長逐漸增大,嚴重制約了積水深度預報精度。 在積澇中后期,積水深度還受到增設排澇泵站等設備及其他人為干預影響,不能真實反映實際積澇水平。 另一方面,建模初期可用樣本數量有限,后續(xù)隨著可用樣本數量積累,動態(tài)更新訓練模型,會得到更精準的預報結果。
城市內澇積水深度預報是一個比較復雜、影響因素較多的問題,受到下墊面、排水管網、地形等眾多因素的影響,而過量降水是導致城市內澇的主要原因。為了精準地對降雨后內澇進行預報,引入了ARIMXA模型,將降水作為時間序列輸入,構建開封市12 個內澇監(jiān)測站的ARIMAX 模型。 利用2018—2020 年汛期(5—9 月)開封市自動氣象站逐小時降雨量和12 個內澇監(jiān)測站逐小時積水深度數據,將出現的積水個例與同期降水強度進行相關統(tǒng)計分析,讓模型經過學習訓練提高其精度。 以“7·20”特大暴雨過程為例,檢驗模型預報能力。 經驗證,在開封12 個內澇監(jiān)測站采用ARIMAX 模型預測積水深度的思路是可行的,預報精度2 h 內效果較好,在6 h 內也是可以接受的。 后續(xù)研究中一方面將建立基于臨界降水的暴雨積澇預警模型,利用視頻監(jiān)控數據、積澇點監(jiān)控數據對暴雨積澇預警模型進行動態(tài)智能訂正,提高城市內澇預測預報的準確性;另一方面,通過與站點環(huán)境(下墊面、排水管網、地形等)相似類比方法,建立其他區(qū)域的積水深度預測模型,為城市內澇預報提供新的思路,并為城市防洪減災、構建預警系統(tǒng)等提供新方向。