潘 登,郁培義,吳 強(qiáng)
(1.國家林業(yè)局 中南林業(yè)調(diào)查規(guī)劃設(shè)計(jì)院,湖南 長沙 410014;2.中南林業(yè)科技大學(xué),湖南 長沙 410004;3.河南農(nóng)業(yè)大學(xué),河南 鄭州 450002)
隨著全球范圍內(nèi)極端天氣狀況頻發(fā),森林火災(zāi)的發(fā)生頻次也隨之增大,給國家生態(tài)環(huán)境和社會(huì)經(jīng)濟(jì)造成了極大損失,直接威脅現(xiàn)代林業(yè)的可持續(xù)發(fā)展和國土安全。據(jù)統(tǒng)計(jì),全世界每年發(fā)生森林火災(zāi)22萬次,受災(zāi)面積達(dá)1 000萬hm2,僅歐洲,年均林火發(fā)生高達(dá)8.1萬次[1],1988-2006年,我國平均每年發(fā)生森林火災(zāi)7 537次,受災(zāi)面積9.7萬hm2[2-3]。由于林火廣泛的影響力[4],可對(duì)森林生態(tài)系統(tǒng)模式和進(jìn)程產(chǎn)生長期的擾動(dòng),包括植被分布、林分結(jié)構(gòu)、碳氮循環(huán)和區(qū)域氣候[5]。氣候是影響森林火災(zāi)動(dòng)態(tài)變化的重要因子之一,隨著溫度的升高,火活動(dòng)將增加,火險(xiǎn)期延長,野火發(fā)生概率升高[6-7]。因此,正確認(rèn)識(shí)林火動(dòng)態(tài)對(duì)氣象因子變化的響應(yīng),并對(duì)二者關(guān)系進(jìn)行實(shí)證分析,是開展科學(xué)林火管理的基礎(chǔ)。湖南自然條件優(yōu)越,也是我國林業(yè)發(fā)達(dá)地區(qū)之一,人工林占有較高比重,山區(qū)有經(jīng)營林業(yè)的習(xí)慣,但由于自然災(zāi)害多發(fā),火災(zāi)的頻度和強(qiáng)度較大,加之山區(qū)地形復(fù)雜多變,過火地區(qū)受災(zāi)往往嚴(yán)重[8]。近年來,已有部分學(xué)者研究了該區(qū)域的林火預(yù)測(cè)模型[9-11]。
隨機(jī)森林(random forest,RM)是算法模型中的一種,通過機(jī)器學(xué)習(xí)進(jìn)行數(shù)據(jù)挖掘,屬于一種組合式的自學(xué)習(xí)技術(shù)[12-14]。由于氣象因子與林火發(fā)生的關(guān)系復(fù)雜且非線性,并且林火的發(fā)生也往往處于離散分布,加之氣象因子在測(cè)量過程中可能因儀器故障或人為原因或出現(xiàn)缺失值,導(dǎo)致使用傳統(tǒng)方法進(jìn)行分析時(shí)不足以揭示復(fù)雜過程中的格局和關(guān)系[15]。分類和回歸樹適用于分析處于復(fù)雜關(guān)系下的生態(tài)數(shù)據(jù),隨機(jī)森林算法作為基準(zhǔn)模型,能完成隱含特征的選擇,并提供特征重要度的選擇指標(biāo),往往用來做分類、聚類、回歸和生存分析[16],幾乎不需要測(cè)算就能夠處理二分特征、分類特征、數(shù)值指標(biāo)的數(shù)據(jù),由于算法對(duì)指定使用的超參數(shù)(hyper-parameters)并不十分敏感,只需要使用大量的數(shù),模型就不會(huì)產(chǎn)生很多偏差,在異常值和噪聲方面有很高的容忍度,在計(jì)算時(shí)2個(gè)隨機(jī)性的引入算法,也使得隨機(jī)森林不易陷入過度擬合[17],當(dāng)其應(yīng)用于氣象等生態(tài)因子的預(yù)測(cè)時(shí),能克服協(xié)變量之間復(fù)雜的交互作用,具有較高的分類正確率[18-19]。近年來,有部分研究證明該算法在回歸方面可提高林火預(yù)測(cè)精度[12,20],但國內(nèi)尚未見到相關(guān)報(bào)道。本研究基于林火歷史和氣象因子,應(yīng)用R軟件,實(shí)現(xiàn)對(duì)湘中丘陵區(qū)林火發(fā)生的預(yù)測(cè),將隨機(jī)森林算法的預(yù)測(cè)結(jié)果與二項(xiàng)邏輯斯蒂回歸模型的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比,比較不同擬合樣本組合在隨機(jī)森林算法中的預(yù)測(cè)精度及其在湘中丘陵區(qū)林火預(yù)測(cè)預(yù)報(bào)中的適宜性。
研究區(qū)屬湖南醴陵市西南部水口山林場(chǎng)范圍,113°19′37″-113°31′17″E,27°26′23″-27°34′55″N,系武功山系的一條支脈,低山地貌,海拔205~867m,一般坡度30°~40°,最大坡度達(dá)45°。林場(chǎng)內(nèi)成土母質(zhì)以板頁巖為主,同時(shí)有少量的石灰?guī)r、花崗巖和砂礫巖分布,風(fēng)化發(fā)育的土壤以山地黃壤和山地紅壤為主,亦有少量的黃壤性粗骨土分布。林場(chǎng)地處中亞熱帶季風(fēng)濕潤氣候區(qū),年平均氣溫17.8℃,年平均降水量1 500 mm,無霜期292 d。場(chǎng)內(nèi)物種繁多,主要樹種有銀杏(Ginkgobiloba)、水杉(Metasequoiaglyptostroboides)、羅漢松(Podocarpusmacrophyllus)、馬尾松(Pinusmassoniana)、樟(Cinnamomumcamphora)、杉木(Cunninghamialanceolata)等。林分類型以馬尾松林、杉木林、針闊混交林和闊葉混交林為主。
林火數(shù)據(jù)來源于醴陵市森林防火辦公室1988-2014年水口山地區(qū)林火發(fā)生情況數(shù)據(jù),水口山地區(qū)共發(fā)生火災(zāi)205次,其中,水口山林場(chǎng)內(nèi)產(chǎn)生火點(diǎn)192次,其余地區(qū)產(chǎn)生火點(diǎn)13次;主要原因?yàn)樯蠅灱漓搿⑷挤疟夼?、燒垃圾、小孩玩火和電線短路,統(tǒng)計(jì)火災(zāi)類型均為森林火災(zāi)。
氣象數(shù)據(jù)來源于醴陵市水口山林場(chǎng)氣象觀測(cè)點(diǎn)1988-2014年日氣象數(shù)據(jù),包含降水量、風(fēng)速等20個(gè)氣象因子,初步篩選、剔除因設(shè)備原因而缺失值過多的因子(氣壓值、太陽總輻射、散射、直接輻射、反射輻射、凈全輻射量),選定9個(gè)因子進(jìn)入模型進(jìn)行擬合:日均氣溫(0.1℃)、日最高氣溫(0.1℃)、日最低氣溫(0.1℃)、日照時(shí)數(shù)(0.1 h)、日均相對(duì)濕度(%)、日最小相對(duì)濕度(%)、日最大風(fēng)速(m·s-1)、日均風(fēng)速、20:00-20:00時(shí)降水量(mm)。此外,通過對(duì)林分內(nèi)可燃物物理性質(zhì)的測(cè)定,基于加拿大森林火險(xiǎn)天氣指標(biāo)系統(tǒng)[22-24],計(jì)算3個(gè)反映可燃干濕程度的指標(biāo),即細(xì)小可燃物濕度碼、腐殖質(zhì)濕度碼和干旱碼;同時(shí)推算3個(gè)反映火行為的指標(biāo)值,即初始蔓延速度、累積指數(shù)和火險(xiǎn)天氣指數(shù)。細(xì)小可燃物濕度碼(fine fuel moisture content,F(xiàn)FMC)是指森林中干重為0.25 kg·m-2、厚度為1.2 m的枯枝落葉及細(xì)小可燃物的含水率,它是細(xì)小可燃物易燃程度的定量表征之一,其核心是水分交換指數(shù)模型,一般來說,可燃物濕度越大,引燃臨界值越高,易燃性越差,F(xiàn)FMC受降水量、降水頻率、相對(duì)濕度、日照條件和風(fēng)速等影響,變化范圍為0~101,其核心是簡單的水分交換的指數(shù)模型,即:
mo=147.2×(101.0-CFFMC)/(59.5-CFFMC)
(1)
式中,mo為前一天的細(xì)小燃料的含水率,CFFMC為前一天的FFMC值。
腐殖質(zhì)濕度碼(duff moisture content,DMC)是反映半分解、半腐爛的凋落可燃物濕潤程度的指標(biāo),受降水、相對(duì)濕度和溫度的影響,DMC最小值為0,最大值沒有上限,但很少超過150,計(jì)算公式為:
Mo=20.00+ln[(CDMC-244.74)/-43.43]
(2)
式中:Mo為前一天的地表可燃物的含水率,CDMC為前一天的DMC值。
干旱碼(drought code,DC)是計(jì)算長期干旱對(duì)森林可燃物影響的指數(shù),主要測(cè)量對(duì)象為深層下層落葉層和大型段木,最小值為0,最大值沒有上限,但很少超過1 000,計(jì)算公式為:
Qo=400×e-CDC/400
(3)
式中,Qo表示前一天干旱碼的濕度當(dāng)量,CDC為前一天的DC值。
累積指數(shù)(build-up index,BUI)由DMC和DC計(jì)算得到,表示可燃物的濕度等級(jí),在FWI系統(tǒng)里,相對(duì)代表了森林可燃物潛在消耗量(有效可燃物量);火險(xiǎn)天氣指數(shù)(fire weather index,F(xiàn)WI)由初始蔓延速度(initial spread index,ISI)和BUI計(jì)算得到[25],BUI和ISI的計(jì)算公式為:
BUI=(0.8×DMC×DC)/(DMC+0.4×DC)
(4)
ISI= 0.208×91.9×e-0.138.6m
(5)
式中:w為風(fēng)速。一般情況下,風(fēng)速每增加13 km·h-1,ISI值會(huì)增加1倍。
當(dāng)BUI≤80,BUI-FWI=0.1×ISI×(0.626BUI0.809+2);當(dāng)BUI>80,BUI-FWI=0.1×ISI×[1 000/(25+108.64×e-0.023×BUI)];BUI-FWI轉(zhuǎn)化為FWI的公式:
FWI=2.72×(0.4354lnB-FWI)0.647
(6)
通過對(duì)FWI指數(shù)進(jìn)行劃分,可對(duì)火險(xiǎn)等級(jí)進(jìn)行劃分,往往與FWI系統(tǒng)中其他指標(biāo)一起協(xié)同預(yù)測(cè)火災(zāi)。
使用LR(logistic regression model,二項(xiàng)邏輯斯蒂回歸模型)和RF(random forest,隨機(jī)森林算法)構(gòu)建判別模型,根據(jù)前人研究,按照1∶2的比例選取對(duì)照點(diǎn)(非火點(diǎn))。LR采用SPSS20.0軟件進(jìn)行計(jì)算,RF采用R軟件實(shí)現(xiàn)。
3.1.1 邏輯斯蒂回歸模型的基本原理 通常情況下,森林火災(zāi)極少在短時(shí)間內(nèi)完成點(diǎn)燃-燃燒-熄滅全過程,故本研究的模擬假設(shè)前提為森林可燃物被引燃后可持續(xù)保持燃燒狀態(tài)直至人為行為干預(yù)。假設(shè)林火發(fā)生的概率為P,不發(fā)生林火概率為1-P,為保證時(shí)間序列平穩(wěn)且方差恒定,對(duì)P進(jìn)行對(duì)數(shù)變換(log transformation),標(biāo)記為Logit(P),則林火發(fā)生概率(P)與進(jìn)入模擬的氣象因子(X)之間的回歸關(guān)系可描述為:
可變換為:
(7)
式中:P為林火發(fā)生的概率;n為氣象因子總數(shù);β1,β2,…βn為各個(gè)自變量的邏輯斯蒂回歸相關(guān)系數(shù);X1,X2,…Xn為影響林火發(fā)生的自變量[26-27]。
3.1.2 邏輯斯蒂回歸模型的校驗(yàn) 受試者工作特征曲線(receiver operating characteristic curve,ROC)又稱為感受性曲線(sensitivity curve),與傳統(tǒng)評(píng)價(jià)方法不同,ROC無需將試驗(yàn)結(jié)果分為兩類再進(jìn)行統(tǒng)計(jì)分析,而是依據(jù)不同判定標(biāo)準(zhǔn),對(duì)同一信號(hào)刺激各自作出反應(yīng),以假陽性率為橫坐標(biāo),真陽性率為縱坐標(biāo)繪制曲線,ROC檢驗(yàn)對(duì)閾值沒有依賴,允許有中間狀態(tài)。ROC曲線越靠近左上角,試驗(yàn)準(zhǔn)確性越高,亦可根據(jù)ROC曲線下的面積(area under the curve,AUC)進(jìn)行比較,AUC越大,試驗(yàn)準(zhǔn)確性越高。在本研究中,根據(jù)AUC值判斷試驗(yàn)效果,當(dāng)AUC=0.5時(shí),判定預(yù)測(cè)為完全隨機(jī),效果最差,在(0.5,0.7]區(qū)間,準(zhǔn)確性較低,在(0.7,0.8]區(qū)間,準(zhǔn)確性中等,在(0.8,0.9]區(qū)間,準(zhǔn)確性較好,在(0.9,1]區(qū)間,預(yù)測(cè)具有高準(zhǔn)確性。此外,根據(jù)ROC曲線可以計(jì)算約登指數(shù)(youden index),用于評(píng)價(jià)篩選試驗(yàn)真實(shí)性的方法,通過模型的敏感性值和特異性值,可以計(jì)算最佳臨界值(cut-off point),如果林火的發(fā)生(預(yù)測(cè))概率>臨界值,則可判定為有森林火災(zāi)發(fā)生,反之,則可判定為無森林火災(zāi)發(fā)生[28-29]。
(8)
式中,VI為變量重要性。
從總體樣本中隨機(jī)抽取60%的數(shù)據(jù)用于建模,余下的40%樣本數(shù)據(jù)用于檢驗(yàn)?zāi)P蚚19],為排除個(gè)例干擾,抽取重復(fù)5次,分別對(duì)5個(gè)不同的樣本組合進(jìn)行邏輯斯蒂運(yùn)算,在每個(gè)樣本組中篩選出各組的顯著變量,當(dāng)某變量在5個(gè)模型中出現(xiàn)次數(shù)不低于3次,則判定為最終變量,進(jìn)入全樣本模擬。
為了保證對(duì)比時(shí)的一致性,隨機(jī)森林和邏輯斯蒂模型的每一次運(yùn)算均采用同一套數(shù)據(jù)樣本。模擬過程通過R軟件中的varSelRF程序包實(shí)現(xiàn),同樣對(duì)5個(gè)樣本組進(jìn)行運(yùn)算,確定最終的特征變量后納入全樣本中進(jìn)行模擬。
運(yùn)用SPSS對(duì)醴陵水口山地區(qū)林火數(shù)據(jù)及對(duì)應(yīng)的氣象因子數(shù)據(jù)進(jìn)行基本統(tǒng)計(jì)(表1)。
4.1.1 多重共線性診斷 在線性回歸模型中,解釋變量之間若存在精確或高度相關(guān)關(guān)系,會(huì)使參數(shù)估計(jì)值的方差增大,容許度降低,使模型估測(cè)準(zhǔn)確率降低或失真,故在檢驗(yàn)特征變量與因變量的關(guān)系時(shí),須先進(jìn)行特征變量的多重共線性(Multicollinearity)診斷,以便將存在完全共線性或近似共線性的解釋變量(自變量)剔除。容許度是方差膨脹因子的倒數(shù)(variance inflation factor,VIF),故容許度越大,VIF越小,說明共線性越強(qiáng),本研究運(yùn)用VIF對(duì)所有氣象因子數(shù)據(jù)進(jìn)行多重共線性檢驗(yàn),剔除了VIF>5的自變量[37],其公式為:
(9)
式中:R2為自變量Xi對(duì)其余變量作回歸分析的復(fù)相關(guān)系數(shù)。經(jīng)檢驗(yàn),剔除了日均氣溫、日均相對(duì)濕度、日最高氣溫、BUI和FWI(VIF分別為79.215、5.712、7.154、157.875、38.045),最終,選定20:00-20:00降水量、日均風(fēng)速、日照時(shí)數(shù)、日最低氣溫、日最大風(fēng)速、日最小相對(duì)濕度、FFMC、DMC、DC和ISI共10個(gè)氣象因子(VIF分別為1.506、2.072、1.513、1.544、1.900、2.812、3.823、1.756、1.921、2.874)進(jìn)行模型擬合。
表1 模型變量的基本描述Table 1 Basic descriptions of model variables
注:各變量的樣本數(shù)均為205。
4.1.2 邏輯斯蒂模型的擬合 運(yùn)用邏輯斯蒂模型對(duì)水口山地區(qū)1988-2014年的林火數(shù)據(jù)和對(duì)應(yīng)的氣象因子數(shù)據(jù)進(jìn)行回歸分析,分布對(duì)5組樣本進(jìn)行運(yùn)算,篩選顯著變量后進(jìn)入全樣本進(jìn)行擬合,各樣本顯著性見表2。
全樣本數(shù)據(jù)的邏輯斯蒂模型擬合曲線R2為0.201,篩選出的解釋變量與區(qū)域內(nèi)的林火發(fā)生有顯著相關(guān)性(表3)。
4.1.3 邏輯斯蒂回歸模型的檢驗(yàn) 圖1為各樣本組邏輯斯蒂回歸模型擬合優(yōu)度的受試者工作特征曲線(ROC)圖,通過各曲線的AUC值可分別計(jì)算其敏感性和特異性值,然后判斷各模型中林火發(fā)生的臨界點(diǎn),具體參數(shù)值為表4所示。檢驗(yàn)結(jié)果表明:所有參與擬合的樣本AUC變化范圍均落在(0.8,0.9],且顯著性水平均<0.001,擬合效果較好,各樣本組預(yù)測(cè)準(zhǔn)確率為71.1%~76.4%,可用于森林火災(zāi)的監(jiān)測(cè)。
表2 邏輯斯蒂模型中變量在各樣本中的顯著性Table 2 Significances of independent variables in each sample under LR model
注:Y代表顯著,N代表不顯著。下同。
表3 邏輯斯蒂模型參數(shù)擬合Table 3 Parameters fitting of LR model
4.2.1 隨機(jī)森林算法特征變量的選擇 基于1988-2014年的林火數(shù)據(jù),結(jié)合相應(yīng)的氣象因子,運(yùn)用隨機(jī)森林算法進(jìn)行擬合分析(表5)。
圖1 模型的ROC擬合曲線Fig.1 ROC curves of logistic model
表4 邏輯斯蒂模型AUC值和臨界值Table 4 AUC and threshold values of LR model
4.2.2 隨機(jī)森林算法特征變量的重要性排序 利用隨機(jī)森林算法對(duì)5個(gè)bootstrap訓(xùn)練樣本組進(jìn)行擬合,從各組中篩選出特征變量構(gòu)成全樣本組,對(duì)5個(gè)訓(xùn)練樣本和全樣本組特征變量的平均準(zhǔn)確率降低度進(jìn)行計(jì)算排序(圖2)。從全樣本模型的排序結(jié)果來看,日最高氣溫對(duì)林火發(fā)生的影響最大,其次是DC,F(xiàn)FMC的影響最小,從所有擬合的排序結(jié)果來看,日最高氣溫和DC對(duì)林火發(fā)生的影響均>其他變量。
4.2 3 種模型算法的對(duì)比分析
4.2.3.1 最終指標(biāo)體系 通過分別使用二項(xiàng)邏輯斯蒂回歸模型和隨機(jī)森林算法對(duì)自變量的篩選(表6),選定最小相對(duì)濕度、FFMC和DC3個(gè)因子進(jìn)入最終的模擬運(yùn)算。
4.2.3.2 模型預(yù)測(cè)準(zhǔn)確率 表7比較了二項(xiàng)邏輯斯蒂回歸模型和隨機(jī)森林算法對(duì)5個(gè)樣本組的預(yù)測(cè)準(zhǔn)確率。結(jié)果顯示,隨機(jī)森林算法的預(yù)測(cè)準(zhǔn)確率要普遍高于二次邏輯斯蒂回歸模型,在所有樣本組的運(yùn)算中,隨機(jī)森林算法的預(yù)測(cè)準(zhǔn)確率要比邏輯斯蒂模型的高7%~10%。
注:X3.日均氣溫;X4.日均相對(duì)濕度;X6.日最低氣溫;X7.日最高氣溫;X8.日最大風(fēng)速;X9.日最小相對(duì)濕度;X10.FFMC;X12.DC;X13.ISI;X15.FWI。
圖2隨機(jī)森林算法對(duì)影響林火發(fā)生的自變量的重要性排序
Fig.2 Random forest affecting the occurrence of fire sort the importance of independent variables
表5 隨機(jī)森林算法中變量在各樣本組中的顯著性Table 5 Significances of independent variables in each sample group under RF algorithm
為進(jìn)一步比較2種算法的預(yù)測(cè)精度,選用全樣本進(jìn)行交互驗(yàn)證試驗(yàn),即除了使用本算法的全樣本數(shù)據(jù)進(jìn)行模擬外,再次使用另一組全樣本數(shù)據(jù)進(jìn)行模擬,將擬合結(jié)果進(jìn)行對(duì)比(表8)。結(jié)果表明,使用任意全樣本進(jìn)行模擬的隨機(jī)森林算法準(zhǔn)確率均要高于邏輯斯蒂模型的模擬結(jié)果,使用本組全樣本數(shù)據(jù)進(jìn)行擬合時(shí),二項(xiàng)邏輯斯蒂回歸模型和隨機(jī)森林算法的預(yù)測(cè)準(zhǔn)確率分別為75.3%和83.7%。
表7 邏輯斯蒂模型和隨機(jī)森林算法的預(yù)測(cè)校正率Table 7 Prediction accuracy of LR model and RF algorithm
表8 指標(biāo)體系交叉試驗(yàn)結(jié)果Table 8 Result of indicator system under crossover trial
運(yùn)用隨機(jī)森林算法對(duì)湖南水口山地區(qū)林火發(fā)生與氣象因子之間的關(guān)系進(jìn)行了研究,并將研究結(jié)果與傳統(tǒng)二項(xiàng)邏輯斯蒂回歸模型的擬合結(jié)果進(jìn)行了對(duì)比。結(jié)果表明,經(jīng)過篩選的特征變量進(jìn)入模擬時(shí),運(yùn)用隨機(jī)森林算法得到的結(jié)果預(yù)測(cè)準(zhǔn)確率始終要比二項(xiàng)邏輯斯蒂回歸模的預(yù)測(cè)準(zhǔn)確率高7%~10%,前者預(yù)測(cè)效果相對(duì)要好,在研究區(qū)域的適用性更高,可利用該區(qū)域的氣象數(shù)據(jù)(特征變量)對(duì)當(dāng)?shù)氐牧只鸢l(fā)生情況進(jìn)行預(yù)測(cè)。
通過多重共線性檢驗(yàn),剔除了方差膨脹因子VIF>5的氣象因子,篩選出顯著變量組成全樣本運(yùn)用二項(xiàng)邏輯斯蒂回歸模型擬合;在使用隨機(jī)森林算法進(jìn)行運(yùn)算時(shí),并未剔除VIF>5的氣象因子,通過對(duì)各因子的重要性進(jìn)行排序,發(fā)現(xiàn)日最高氣溫得分最高,對(duì)于潛在林火的發(fā)生貢獻(xiàn)度最大,而日均氣溫的排序相對(duì)靠后。在對(duì)解釋變量進(jìn)行多重共線性診斷后,對(duì)近似共線性的解釋變量直接采用了排除法,然后進(jìn)行回歸,當(dāng)氣象因子過多時(shí),可嘗試差分法將原模型變換為查分模型,或采用嶺回歸法(ridge regression)減小參數(shù)估計(jì)量的方差,以增加參與擬合的氣象因子數(shù)量,由此可增加樣本組數(shù),進(jìn)行多批次的擬合分析,從而更好地比較不同模型對(duì)于林火發(fā)生的預(yù)測(cè)準(zhǔn)確性。
在傳統(tǒng)的林火火險(xiǎn)分析中,往往將森林可燃物特征作為唯一變量考慮,在非氣象因子與林火發(fā)生的邏輯斯蒂模型檢驗(yàn)中,最優(yōu)模型擬合R2僅為0.15[37],說明林分特征對(duì)林火發(fā)生的解釋程度并不高,需結(jié)合氣象等因素進(jìn)行綜合分析。本研究通過多重共線性檢驗(yàn)和隨機(jī)森林的重要性排序,判定在氣象因子中,日最高氣溫、日均氣溫、日最小相對(duì)濕度、FFMC和DC是影響林火發(fā)生的主要因子。相對(duì)濕度在很大程度上可影響林內(nèi)活可燃物的蒸騰速率和枯死可燃物的含水率變化,對(duì)林火的發(fā)生影響較大[38-39],而氣溫的變化則可直接影響林內(nèi)相對(duì)濕度的變化,氣溫的升高可加速枯死可燃物內(nèi)部水分的蒸發(fā),從而降低其著火點(diǎn),此外,研究顯示細(xì)小可燃物濕度碼、干旱碼也與林火發(fā)生具有顯著相關(guān)性,這與郭福濤[40]等、Y.Chang[41]等和田曉瑞[42]等的研究結(jié)果一致。
本研究通過分析林火對(duì)氣象因子的響應(yīng)討論了隨機(jī)森林算法對(duì)火災(zāi)發(fā)生預(yù)測(cè)的應(yīng)用效果,但在野外環(huán)境中,影響森林火災(zāi)發(fā)生的因子不僅限于可燃物特征和氣象因素,還會(huì)受到人為活動(dòng)、地形、(短期)歷史災(zāi)害甚至區(qū)域政策等因素的影響[43-45],因此僅基于氣象因子進(jìn)行擬合,可能會(huì)使預(yù)測(cè)結(jié)果產(chǎn)生一定誤差,在未來的研究中,可考慮將人為活動(dòng)干擾、自然災(zāi)害、地形變化等因素納入模型模擬范圍[46-50],以進(jìn)一步完善算法的準(zhǔn)確率、精確定位模型的適宜應(yīng)用范圍。
參考文獻(xiàn):
[1] CHAS-AMIL M L,PRESTEMON J P,MCCLEAN C J,etal.Human-ignited wildfire patterns and responses to policy shifts [J].Applied Geography,2015,56:164-176.
[2] 張乃平,夏東海.自然災(zāi)害應(yīng)急管理[M].北京:中國經(jīng)濟(jì)出版社,2009:304.
[3] ZHONG M,FAN W,LIU T,etal.Statistical analysis on current status of China forest fire safety [J].Fire Safety Journal,2003,38(3):257-269.
[4] HERAWATI H,SANTOSO H.Tropical forest susceptibility to and risk of fire under changing climate:a review of fire nature,policy and institutions in Indonesia [J].Forest Policy & Economics,2011,13(4):227-233.
[5] RANDERSON J T,FLANNER M G,JIN Y,etal.Supporting material:the impact of boreal forest fire on climate warming [J].Science,2006.314(5802):1130-1132.
[6] WESTERLING A L,HIDALGO H G,CAYAN D R,etal.Warming and earlier spring increase western U.S.forest wildfire activity [J].Science,2006,313:940-943.
[7] MARLON J R,BARTLEIN P J,GAVIN D G,etal.Long-term perspective on wildfires in the western USA[J].Proceedings of the National Academy of Sciences of the United States of America,2012,109(9):3203-3204.
[8] 蘇立娟,何友均,陳紹志.1950—2010年中國森林火災(zāi)時(shí)空特征及風(fēng)險(xiǎn)分析[J].林業(yè)科學(xué),2015,51(1):88-96.
SU L J,HE Y J,CHEN S Z.Temporal and spatial characteristics and risk analysis of forest fires in China from 1950 to 2010 [J].Scientia Silvae Sinicae,2015,51(1):88-96.(in Chinese)
[9] 王明玉,舒立福,王秋華,等.中國南方冰雪災(zāi)害對(duì)森林火災(zāi)火發(fā)生短期影響分析——以湖南為例[J].林業(yè)科學(xué),2008,44(11):64-68.
WANG M Y,SHU L F,WANG Q H,etal.Forest fire occurrence in short term under the impacts of snow damage in south of China,a case study in Hunan Province [J].Scientia Silvae Sinicae,2008,44(11):64-68.(in Chinese)
[10] 儲(chǔ)昌超,張貴,孫玉榮.基于克里金方法的湖南森林火災(zāi)趨勢(shì)預(yù)測(cè)研究[J].中南林業(yè)科技大學(xué)學(xué)報(bào),2014,34(6):66-70.
CHU C C,ZHANG G,SUN Y R.Trend forecast of forest fire in Hunan Province based on Kriging interpolation model [J].Journal of Central South University of Forestry & Technology,2014,34(6):66-70.(in Chinese)
[11] 郭海峰,禹偉.湖南省森林火險(xiǎn)天氣等級(jí)預(yù)測(cè)模型研究[J].中南林業(yè)科技大學(xué)學(xué)報(bào),2016,36(12):44-47,67.
GUO H F,YU W.Study weather grade prediction model of forest-fire risk in Hunan Province[J].Journal of Central South University of Forestry & Technology,2016,36(12):44-47,67.(in Chinese)
[12] OLIVEIRA S,OEHLER F,SAN-MIGUEL-AYANZ J,etal.Modeling spatial patterns of fire occurrence in Mediterranean Europe using multiple regression and random forest[J].Forest Ecology & Management,2012,275(4):117-129.
[13] 李欣海.隨機(jī)森林模型在分類與回歸分析中的應(yīng)用[J].應(yīng)用昆蟲學(xué)報(bào),2013,50(4):1190-1197.
LI X H.Using “random forest” for classification and regression [J].Entomological Knowledge,2013,50(4):1190-1197.(in Chinese)
[14] 張雷,王琳琳,張旭東,等.隨機(jī)森林算法基本思想及其在生態(tài)學(xué)中的應(yīng)用——以云南松分布模擬為例[J].生態(tài)學(xué)報(bào),2014,34(3):650-659.
ZHANG L,WANG L L,ZHANG X D,etal.The basic principle of random forest and its applications in ecology:a case study ofPinusyunnanensis[J].Acta Ecologica Sinica,2014,34(3):650-659.(in Chinese)
[15] FABRICIUS K E.Classification and regression trees:a powerful yet simple technique for ecological data analysis[J].Ecology,2000,81(11):3178-3192.
[16] LOUISR I,ANANTHAM P,STEPHENN M,etal.Estimating potential habitat for 134 eastern US tree species under six climate scenarios[J].Forest Ecology & Management,2008,254(3):390-406.
[17] BREIMAN L.Random forest [J].Machine Learning,2001,45:5-32.
[18] 王璟睿,沈文娟,李衛(wèi)正,等.基于RapidEye的人工林生物量遙感反演模型性能對(duì)比[J].西北林學(xué)院學(xué)報(bào),2015,30(6):196-202.
WANG J R,SHEN W J,LI W Z,etal.Performances comparison of multiple non-linear models for estimating plantations' biomass based on RapidEye imagery [J].Journal of Northwest Forestry University,2015,30(6):196-202.(in Chinese)
[19] CUTLER D R,EDWARDS T C,BEARD K H,etal.Random forests for classification in ecology[J].Ecology,2007,88(11):2783-92.
[20] RODRIGUES M,RIVA J D L.An insight into machine-learning algorithms to model human-caused wildfire occurrence [J].Environmental Modeling & Software,2014,57:192-201.
[21] 張馨月,蘇曉慧.四川省林火次數(shù)與氣象因子的相關(guān)性研究[J].西北林學(xué)院學(xué)報(bào),2017,32(3):176-180.
ZHANG X Y,SU X H.Correlation analysis on forest fire occurring frequency and meteorological factors in Sichuan [J].Journal of Northwest Forestry University,2017,32(3):176-180.(in Chinese)
[22] WOTTON B M.Interpreting and using outputs from the Canadian forest fire danger rating system in research applications [J].Environmental & Ecological Statistics,2009,16(2):107-131.
[23] 郭福濤,蘇漳文,馬祥慶,等.大興安嶺塔河地區(qū)雷擊火發(fā)生驅(qū)動(dòng)因子綜合分析[J].生態(tài)學(xué)報(bào),2015,35(19):6439-6448.
GUO F T,SU Z W,MA X Q,etal.Climatic and non-climatic factors driving lightning-induced fire in Tahe,Daxing'an mountain[J].Acta Ecologica Sinica,2015,35(19):6439-6448.(in Chinese)
[24] 張恒,金森,邸雪穎.基于FWI濕度碼的塔河林業(yè)局地表凋落物含水率預(yù)測(cè)[J].應(yīng)用生態(tài)學(xué)報(bào),2014,25(7):2049-2055.
ZHANG H,JIN S,DI X Y.Prediction of litter moisture content in Tahe forestry bureau of northeast China based on FWI moisture codes [J].Chinese Journal of Applied Ecology,2014,25(7):2049-2055.(in Chinese)
[25] 信曉穎,江洪,周國模,等.加拿大森林火險(xiǎn)氣候指數(shù)系統(tǒng)(FWI)的原理及應(yīng)用[J].浙江農(nóng)林大學(xué)學(xué)報(bào),2011,28(2):314-318.
XIN X Y,JIANG H,ZHOU G M,etal.Canadian forest fire weather index (FWI) system:a review [J].Journal of Zhejiang A&F University,2011,28(2):314-318.(in Chinese)
[26] 梁慧玲,林玉蕊,楊光,等.基于氣象因子的隨機(jī)森林算法在塔河地區(qū)林火預(yù)測(cè)中的應(yīng)用[J].林業(yè)科學(xué),2016,52(1):89-98.
LIANG H L,LIN Y R,YANG G,etal.Application of random forest algorithm on the forest fire prediction in Tahe area based on meteorological factors[J].Scientia Silvae Sinicae,2016,52(1):89-98.(in Chinese)
[27] 郭福濤,蘇漳文,王光玉,等.我國北方針葉林人為火發(fā)生的預(yù)測(cè)模型[J].應(yīng)用生態(tài)學(xué)報(bào),2015,26(7):2099-2106.
GUO F T,SU Z W,WANG G Y,etal.Prediction model of human-caused fire occurrence in the boreal forest of northern China [J].Chinese Journal of Applied Ecology,2015,26(7):2099-2106.(in Chinese)
[28] CHANG Y,ZHU Z,BU R,etal.Predicting fire occurrence patterns with logistic regression in Heilongjiang Province,China [J].Landscape Ecology,2013,28(10):1989-2004.
[29] 孫瑜,史明昌,彭歡,等.基于MAXENT模型的黑龍江大興安嶺森林雷擊火火險(xiǎn)預(yù)測(cè)[J].應(yīng)用生態(tài)學(xué)報(bào),2014,25(4):1100-1106.
SUN Y,SHI M C,PENG H,etal.Forest lighting fire forecasting for Daxing'anling mountains based on MAXENT model [J].Chinese Journal of Applied Ecology,2014,25(4):1100-1106.(in Chinese)
[30] 尹華,胡玉平.基于隨機(jī)森林的不平衡特征選擇算法[J].中山大學(xué)學(xué)報(bào):自然科學(xué)版,2014,53(5):59-65.
YIN H,HU Y P.An imbalanced feature selection algorithm based on random forest [J].Acta Scientiarum Naturalium Universitatis Sunyatseni,2014,53(5):59-65.(in Chinese)
[31] 鞏亞楠,帕提麥·馬秉成,朱登浩,等.隨機(jī)森林與Logistic回歸在預(yù)約掛號(hào)失約影響因素預(yù)測(cè)中的應(yīng)用[J].現(xiàn)代預(yù)防醫(yī)學(xué),2014,41(5):769-772.
GONG Y N,PA T M,ZHU D H,etal.Application of random forests and logistic regression in prediction of influencing factors of missed appointment registration [J].Modern Preventive Medicine,2014,41(5):769-772.(in Chinese)
[32] 彭國蘭.隨機(jī)森林在企業(yè)信用評(píng)估中的應(yīng)用[D].廈門:廈門大學(xué),2007.
[33] LIAW A,WIENER M.Classification and regression by random forest [J].R.News,2002,23:23.
[34] 呂杰,汪康寧,李崇貴,等.基于小波變換和隨機(jī)森林的森林類型分類研究[J].西北林學(xué)院學(xué)報(bào),2016,31(6):264-267.
LYU J,WANG K N,LI C G,etal.Classification of forest types based on discrete wavelet transform and random forests from GF-1 images[J].Journal of Northwest Forestry University,2016,31(6):264-267.(in Chinese)
[35] GENUER R,POGGI J M,TULEAU-MALOT C.Variable selection using random forests [M].New York:Elsevier Science Inc.,2010.
[36] 武曉巖,閆曉光,李康.基因表達(dá)數(shù)據(jù)的隨機(jī)森林逐步判別分析方法[J].中國衛(wèi)生統(tǒng)計(jì),2007,24(2):151-154.
WU X Y,YAN X G,LI K.The stepwise discriminant analysis of random forests used in gene expression data[J].Chinese Journal of Health Statistics,2007,24(2):151-154.(in Chinese)
[37] LITTELL J S,MCKENZIE D,PETERSON D L,etal.Climate and wildfire area burned in western USA ecoprovinces,1916-2003[J].Ecological Applications,2009,19(4):1003-1021.
[38] WOTTON B M,MARTELL D L,LOGAN K A.Climate change and People-caused forest fire occurrence in Ontario [J].Climatic Change,2003,60(3):275-295.
[39] FLANNIGAN M D,STOCKS B J,WOTTON B M.Forest fires and climate change [J].Science of the Total Environment,262:221-230.
[40] 郭福濤,蘇漳文,馬祥慶,等.大興安嶺塔河地區(qū)雷擊火發(fā)生驅(qū)動(dòng)因子綜合分析[J].生態(tài)學(xué)報(bào),2015,35(19):6439-6448.
GUO F T,SU Z W,MA Q X,etal.Climatic and non-climatic factors driving lightning-induced fire in Tahe,Daxing′an mountain[J].Acta Ecologica Sinica,2015,35(19):6439-6448.(in Chinese)
[41] CHANG Y,ZHU Z,BU R,etal.Predicting fire occurrence patterns with logistic regression in Heilongjiang Province,China [J].Landscape Ecology,2013,28(10):1989-2004.
[42] 田曉瑞,MCRAE D J,舒立福,等.大興安嶺地區(qū)森林火險(xiǎn)變化及FWI適用性評(píng)估[J].林業(yè)科學(xué),2010,46(5):127-132.
TIAN X R,Douglas J M,SHU L F,etal.Changes of forest fire danger and the evaluation of the FWI system application in the Daxing'anling region[J].Scientia Silvae Sinicae,2010,46(5):127-132.(in Chinese)
[43] PAUSAS J G.Changes in fire and climate in the eastern iberian peninsula (mediterranean basin) [J].Climatic Change,2004,63(3):337-350.
[44] GUO F,SU Z,WANG G,etal.Wildfire ignition in the forests of southeast China:identifying drivers and spatial distribution to predict wildfire likelihood [J].Applied Geography,2016,66:12-21.
[45] STOCKS B J.Forest fires and sustainability in the boreal forests of Canada [J].Ambio,1998,27(7):545-550.
[46] RODRIGUES M,RIVA J D L,FOTHERINGHAM S.Modeling the spatial variation of the explanatory factors of human-caused wildfires in Spain using geographically weighted logistic regression [J].Applied Geography,2014,48(48):52-63.
[47] SAEFUDDIN A,SETIABUDI N A,FITRIANTO A.On comparison between logistic regression and geographically weighted logistic regression:with application to indonesian poverty data[J].World Applied Sciences Journal,2012,19(2):205-210.
[48] 趙玉,王紅,張珍珍.基于遙感光譜和空間變量隨機(jī)森林的黃河三角洲刺槐林健康等級(jí)分類[J].遙感技術(shù)與應(yīng)用,2016,31(2):359-367.
ZHAO Y,WANG H,ZHANG Z Z.Forest healthy classification of robinia pseudoacacia in the Yellow River Delta,China based on spectral and spatial remote sensing variables using random forest[J].Remote Sensing Technology and Application,2016,31(2):359-367.(in Chinese)
[49] 趙銅鐵鋼,楊大文,蔡喜明,等.基于隨機(jī)森林模型的長江上游枯水期徑流預(yù)報(bào)研究[J].水力發(fā)電學(xué)報(bào),2012,31(3):18-24,38.
ZHAO T T G,YANG D W,CAI X M,etal.Predict seasonal low flows in the upper Yangtze River using random forests model [J].Journal of Hydroelectric Engineering,2012,31(3):18-24,38.(in Chinese)
[50] 賴成光,陳曉宏,趙仕威,等.基于隨機(jī)森林的洪災(zāi)風(fēng)險(xiǎn)評(píng)價(jià)模型及其應(yīng)用[J].水利學(xué)報(bào),2015,46(1):58-66.
LAI C G,CHEN X H,ZHAO S W,etal.A flood risk assessment model based on random forest and its application[J].Journal of Hydraluic Engineering,2015,46(1):58-66.(in Chinese)