文剛,高孟平,高振宇,周仿榮,潘浩,李志棟,張濤,羅繼強,劉星星
(1.電力遙感技術聯(lián)合實驗室(云南電網有限責任公司電力科學研究院),云南 昆明 650217;2.云南電網有限責任公司,云南 昆明 650200;3.北京空間飛行器總體設計部,北京 100094;4.廣東工業(yè)大學,廣東 廣州 510006)
云南省的大部分架空輸電線路處于環(huán)境復雜的崇山峻嶺中,輸電線路遇風很容易擺動,與樹木或山體坡面頻繁接觸,引起短路放電造成山火[1]。一旦有山火發(fā)生,火勢很容易在架空線路走廊周邊蔓延,使輸電線路暫停運作,同時由于山火持續(xù)時間一般較長,導致絕大部分重合閘失敗,進而造成停電事故。當山火蔓延影響到電網區(qū)域中多條輸電線路時,很可能會造成大范圍停電事故,嚴重影響電網的安全穩(wěn)定運行[2]。為了盡可能減少山火隱患,防止電網的安全穩(wěn)定運行受到山火威脅,有必要開展山火風險評估的研究。
山火的發(fā)生受植被類型、植被狀態(tài)(含水率)、氣象因素、地形、人為因素等影響,山火風險預測系統(tǒng)是受多種誘導因子作用的復雜系統(tǒng)。目前,山火評估預測的方法主要分為傳統(tǒng)方法和模擬法。
傳統(tǒng)方法包括相關關系法、統(tǒng)計分析法、以火報火法。H.t.Gisborne在1936年提出了多因子預測火險等級的相關關系預測方法[3]。統(tǒng)計分析法是通過收集歷史火災相關氣象資料資料,統(tǒng)計分析歷史火災的天氣狀況、時間、地形、次數等氣象因子,確定火災與各個氣象因子的相關性,總結火災發(fā)生的規(guī)律。但是氣象因子對火災發(fā)生的影響機制十分復雜,同時火災發(fā)生也與人類活動有一定關系,因而統(tǒng)計分析法對火災的評估預測可靠性比較低[4]。以火報火法通過建立不同森林可燃物的點火燃燒實驗與氣象要素之間的關系來預測火災的危險性,具有代表性的是澳大利亞曾進行點火試驗800次,建立了森林火災預報模型,該系統(tǒng)由McArthur設計,不僅能預測林火的可能性,還能輸出定量的火行為參數,例如林火蔓延速度、火險強度、飛火距離等[5]。該方法預測火災的危險性較為準確,但需要進行大量的野外試驗,建立模型需要花費大量的時間。
隨著計算機技術的迅猛發(fā)展及其在火災評估中的應用,模擬法利用衛(wèi)星監(jiān)測技術和地理信息系統(tǒng)(geographic information system,GIS)技術,使山火預測更為準確。其中Logistic回歸是應用最為廣泛的模型。文獻[6]基于Logistic回歸模型對浙江省2000—2016年林火發(fā)生的主要影響因素進行分析,確定驅動因子,建立林火預測模型并劃分火險等級,模型總體預測準確率達到79.1%。文獻[7]以江西省為研究對象,利用Logistic回歸模型對高程、坡度、距道路最近距離、可燃物含水率、陸地表面溫度、歸一化植被指數、全局植被濕度指數進行訓練,接受者操作特征(receiver operating characteristic,ROC)曲線下面積(area under ROC curve,AUC)值達到0.757。文獻[8]基于衛(wèi)星火點數據和氣象數據,用Logistic回歸模型對浙江省林火變化趨勢和影響因子進行研究。文獻[9]運用加權Logistic回歸建立廣東省輸電走廊林火預警模型。另外,人工神經網絡(artificial neural network,ANN)也在該領域得到應用。文獻[10]收集歷史氣候數據,采用BP神經網絡進行預測。文獻[11]采用中分辨率成像光譜儀(moderate-resolution imaging spectroradiometer,MODIS)數據,以西班牙加利西亞為研究對象,比較ANN和Logistic回歸模型在森林火災評估中的優(yōu)劣,結果顯示二者的評估精度接近。
ANN本質是一種擬合技術,由于山火訓練數據樣本只有0和1,所以模型評估結果大多落在0和1附近,而落在0.4~0.6之間的值很少[12]。Logistic回歸模型在山火評估領域中的應用更加廣泛,因此本文基于Logistic回歸模型選取更加全面的山火評價因子對山火進行評估,并進行Person相關性分析,剔除冗余的評價因子。最后,將本文所提協(xié)同多因子山火風險評估方法與文獻[7,13-14]的方法對比,以驗證所提方法的優(yōu)越性。
云南省位于中國西南地區(qū),介于北緯21°8′~29°15′、東經97°31′~106°11′之間。地形以山地、高原為主,山地面積占全省總面積的88.64%,森林覆蓋率達到65.04%。云南氣候基本屬于亞熱帶和熱帶季風氣候,這種氣候年溫差小、日溫差大,降水在空間和時間上分布也極不均勻。云南省的森林面積分布廣泛,而且氣候很容易引起山火,導致省內山火頻繁,給電網設備等人民財產造成了重大損失。本文以云南省為研究區(qū)域,進行山火風險評估研究。
本文通過文獻調研,選取直接或間接的山火影響因子,數據集屬性見表1。
表1 數據集屬性Tab.1 Data set attributes
本文從地形、氣象、植被和人為因素4個方面選取山火影響因子,各個因子的詳細說明如下。
a)歷史火點數據來源于NASA網站MODIS傳感器偵測到的火點(https://firms.modaps.eosdis.nasa.gov/map/),根據云南省每天的歷史火點提取火點位置的17個山火評價因子,同時隨機選擇非火點,并提取非火點位置的17個山火評價因子。
b)地表溫度數據來源于3級水平MODIS地表溫度數據MOD11A1,此數據是具有1 km空間分辨率的正弦投影數據。地表溫度高的區(qū)域土壤水分少,植被干燥,容易發(fā)生山火;反之,地表溫度低的區(qū)域土壤水分相對多,不容易發(fā)生山火。
c)歸一化紅外指數(NDII7)來源于MODIS表面反射率數據系列,選取500 m空間分辨率、8 d時間分辨率的3級正弦投影數據。該數據具有7個波段,通過波段2和波段7計算得到NDII7遙感影像。NDII7小的區(qū)域植被含水率低,容易引起火災;反之,NDII7大的區(qū)域植被含水率高,不容易引起火災。文獻[15]通過實驗和科學研究發(fā)現(xiàn),NDII7較小的干燥植被比NDII7較大的新鮮植被更容易發(fā)生燃燒。因此,本文用NDII7來表征可燃物的含水率。
d)歸一化指標指數(NDVI)采用全球MODIS植被指數數據提供的時空連續(xù)的植被監(jiān)測數據[16-17]。采用正弦投影和16 d合成的500 m空間分辨率的植被數據,用于檢測植被狀態(tài)和土地覆蓋率變化情況。
e)高程數據描述一個地方的海拔高度,不同高程對山火發(fā)生的影響程度不一樣。高海拔的地方溫度比較低,空氣濕度大,發(fā)生山火的可能性比較低;反之,低海拔的地方溫度比較高,空氣濕度小,發(fā)生山火的可能性大[18]。
f)坡度描述地面的傾斜程度,受重力等因素的影響,坡度大的地方植被的保水能力小,水土流失比較嚴重,更容易發(fā)生山火。坡向描述一個地方的朝向,不同坡向決定著對陽光照射的接受程度,接受陽光多的坡向發(fā)生山火的可能性更高。根據高程,利用ARCGIS軟件的3D分析功能可得到研究區(qū)域的坡度和坡向。
g)距道路距離和距離居民的距離反映人為因素對山火的影響關系。距離道路和居民地近的地方,人類活動頻繁,容易引起山火;距離水體近的區(qū)域土壤濕度高,不容易引發(fā)山火[19]。
h)不同的土地類型對山火發(fā)生的影響程度不同,森林、灌木叢和覆蓋度高的草原更容易引發(fā)山火。
i)氣象對于山火的發(fā)生有重要的影響,選取降水量、空氣濕度、平均溫度、最小溫度、最大溫度、最大陣風風速、最大陣風風向7個氣象因子。氣象要素的精度對于山火評估有重要影響,文獻[20]使用基于ANUSPLIN的樣條插值方法對全國667個氣象站數據進行插值,利用1 667個加密站點對氣象插值結果進行準確性檢驗,并與反向距離權重法和普通克里金插值方法進行實驗對比,結果表明基于ANUSPLIN的樣條插值方法誤差最小。因此,本文選擇該方法對研究區(qū)域的125個氣象站獲得的氣象資料進行插值,得到整個研究區(qū)域的氣象數據。
本文提出的山火評估流程如圖1所示,評估模型為Logistic回歸模型,系統(tǒng)性能指標為AUC。
圖1 山火評估流程Fig.1 Wildfire assessment flow chart
Logistic回歸模型是線性回歸分析模型,常用于數據分析、金融、醫(yī)學等領域。通過Logistic回歸分析可以得到自變量的權重,輸出0~1之間概率值,模型根據結果是否大于0.5分類為0或1。本文基于山火影響因子,通過Logistic回歸模型計算山火風險概率,計算公式為:
(1)
z=β0+β1x1+β2x2+…+βnxn.
(2)
式(1)、(2)中:Pz為發(fā)生山火風險概率;β0為模型中常數,表示方程的截距;n為自變量的個數,這里表示山火影響因子個數;xi(i=1,2,…,n)為山火影響因子種類,βi為模型中與xi對應的變量參數。
ROC曲線可用于揭示敏感性(真正率)與特異性(假正率)之間的相互關系。通過設置連續(xù)變量的閾值,計算出敏感性a和b,以a為縱坐標、以(1-b)為橫坐標繪制而成的曲線即為ROC曲線。AUC可以評估預測模型的質量,其值介于0.5~1:當AUC為0.5時,說明模型的預測效果很差,相當于隨機分類;當AUC接近1時,說明模型的預測效果很好。
相關性分析是研究模型自變量之間相關程度的分析,衡量2個自變量因素的相關密切程度,目的在于發(fā)掘自變量間的相關特性,是描述客觀事物相互間關系的密切程度并用適當的統(tǒng)計指標表示出來的過程。
利用統(tǒng)計產品與服務解決方案(statistical product service solutions,SPSS)軟件分析火點評價因子的Person相關性,Person系數接近1時表示有強正相關,接近-1時表示有強負相關。地表溫度與平均氣溫的相關性系數為0.607,平均氣溫與最低氣溫、最高氣溫的相關性系數分別為0.931、0.943,最低氣溫與最高氣溫的相關性系數為0.822。一般認為,相關性系數絕對值達到0.6即為高度相關[12],可利用逐步回歸剔除相關性系數高的其中一個因子。本文通過相關性分析,剔除平均氣溫、最低氣溫2個因子。
3.2.1 評價指標比較
本文提取MODIS和NPP信息中2018年和2019年所有遙感偵測到的植被大火火點的17個特征,整理得到29 442個樣本火點,同時選取相同數量的非火點樣本,最終數據集包含58 884個樣本,其中70%的樣本用于訓練集,30%的樣本用于測試集。
用高程、坡度、坡向、植被覆蓋類型、距最近道路距離,距最近水體距離、距最近居民點距離、地表溫度、可燃物含水率、歸一化植被指數、降水量、最高氣溫、平均相對濕度、最大陣風風速、最大陣風風向15個因子來評估云南省山火,與文獻[7,13-14]的山火評估方法進行實驗對比,結果見表2。
表2 幾種山火評估方法AUC的對比Tab.3 AUC comparisons of different wildfire assessment methods
文獻[13]采用高程、坡度、坡向、植被覆蓋類型、距最近道路距離、距最近水體距離、距最近居民點距離7個評價因子來評估山火。本文方法計算得到的AUC達到0.80,與文獻[13]方法相比提升了0.16,說明地表溫度、可燃物含水率、歸一化植被指數、降水量、最高氣溫、平均相對濕度、最大陣風風速、最大陣風風向等因子能夠顯著提升評估效果。
文獻[14]采用高程、坡度、坡向、植被覆蓋類型、距最近道路距離,距最近水體距離、距最近居民點距離、地表溫度、可燃物含水率、歸一化植被指數10個評價因子來評估山火。與文獻[14]方法相比,本文方法計算得到的AUC提升了0.10,說明降水量、最高氣溫、平均相對濕度、最大陣風風速、最大陣風風向是評估山火的有效指標。
對比文獻[13]和文獻[14],文獻[14]方法考慮地表溫度、植被含水率和歸一化植被指數這3個影響因子,其AUC相比文獻[13]提升了0.06,說明這3個遙感特征用于評估云南省山火并不會出現(xiàn)冗余特征的現(xiàn)象。
文獻[7]在較大的時間尺度和省級空間尺度上進行森林火災風險分區(qū)研究,基于Logistic回歸建立火災風險評估模型,實驗結果顯示火災分布與火災影響因素之間具有很好的擬合度。但是文獻[7]只采用海拔、土地利用類型、土地表面溫度、歸一化植被指數和全局植被水分指數對火災進行預測評估。本文雖然缺少全局植被水分指數數據,但是引入了歸一化紅外指數來表征植被水分狀態(tài)。與文獻[7]方法相比,本文方法計算得到的AUC提升了0.11,可見氣象要素對于云南省山火評估有著重要作用。
測試集混淆矩陣見表3。從混淆矩陣可以得到:本文方法非火點的錯誤率為0.21,火點的錯誤率為0.19;文獻[13]方法非火點的錯誤率為0.34,火點的錯誤率為0.38;文獻[14]方法非火點的錯誤率為0.28,火點的錯誤率為0.33;文獻[7]方法非火點的錯誤率為0.28,火點的錯誤率為0.34。從預測準確性來看,本文選取的評價因子更具有優(yōu)勢。
表3 測試集混淆矩陣Tab.4 Test set confusion matrix
3.2.2 風險圖比較
選取不同評價因子,制作2018年1月17日的山火風險概率圖,并將概率按等區(qū)間劃分的原則劃分為極低、低、中等、高、極高5個等級,如圖2所示。0~0.2為山火發(fā)生概率極低;0.2~0.4為山火發(fā)生概率低;0.4~0.6為山火發(fā)生概率中;0.6~0.8為山火發(fā)生概率高;0.8~1為山火發(fā)生概率極高。從圖2來看,雖然大部分火點落在高風險的紅色區(qū)域和黃色區(qū)域,但是文獻[13]、文獻[14]和文獻[7]的山火風險概率圖中,云南省大部分區(qū)域都預測為紅色和黃色的高風險區(qū)域,與實際情況不符合。根據本文選取的15個評價因子預測得到的云南省山火風險概率圖中,大部分區(qū)域為低風險區(qū)域,而且大部分火點也處于山火發(fā)生概率高和極高的高風險區(qū)域,與實際情況相符。因此,可以采用本文的15個評價因子評估云南省的山火風險狀況,結合相應的消防設施資源,做好撲救山火的準備。
圖2 選取不同評價因子時,云南省2018年1月17日的山火風險概率圖Fig.2 Wildfire risk probability in January 17, 2018 in Yunnan when selecting different evaluation factors
云南省的許多輸電線路工程需要穿越山嶺地帶,輸電線路容易受到山火的影響,引發(fā)電力事故,因此有必要進行山火風險評估的研究。為了有效進行山火風險評估,本文基于Logistic回歸模型,從地形、人為因素、遙感和氣象4個方面選取山火評價因子,選取高程、坡度、坡向、植被覆蓋類型、距最近道路距離,距最近水體距離、距最近居民點距離、地表溫度、可燃物含水率、歸一化植被指數、降水量、平均氣溫、最低氣溫、最高氣溫、平均相對濕度、最大陣風風速、最大陣風風向17個山火影響因子,并通過相關性分析剔除平均氣溫和最低氣溫2個冗余因子。實驗結果顯示,所選15個因子能全面、準確地評估云南省的山火狀況。本文選取的15個山火因子實質上是針對山火的空間規(guī)律進行評估,未來可以研究從時間序列的角度出發(fā)進行山火評估。