劉方策 張運林 滿子源 孫龍
(東北林業(yè)大學,哈爾濱,150040)
森林可燃物類型是反映占據(jù)一定時間和空間的具有相同或相似燃燒性的可燃物復合體,不同可燃物類型有不同的火險情況[1]。單獨的森林可燃物,理化性容易測定,但在實際工作中,森林可燃物是復雜的綜合體,不同的可燃物構成不同的可燃物類型,具有不同的火險情況。因此,進行森林可燃物類型劃分,對于我國森林火險區(qū)劃,森林防火基礎數(shù)據(jù)庫建立有重要意義。
可燃物類型的劃分方法主要有直接估計法、植物群落法、資源衛(wèi)星圖片法、可燃物檢索表法和照片分類法。直接估計法和可燃物檢索表法主要依賴林火管理人員的經驗[2];植物群落法對于火行為難以確定,數(shù)據(jù)收集成本高[3];資源衛(wèi)星圖片法對林下可燃物類型分類不足[4];而照片分類法是一種快速簡便的方法,用于量化和描述現(xiàn)場的可燃物特性,將可燃物樣地照片與可燃物特征建立視覺聯(lián)系,從而判斷可燃物類型,客觀真實的反映可燃物特征,相比其他劃分方法,測定可燃物類型的時間減少80%[5]。
在20世紀70年代,美國開展了很多照片分類法的研究[6-10]。Muraro[7]提供可燃物類型的量化信息與抽樣的森林可燃物照片,建立了現(xiàn)場可燃物和可燃物類型之間的視覺關聯(lián),從而判斷兩者的火行為是否相似。美國林務局在70年代啟動了國家可燃物分類和數(shù)據(jù)庫系統(tǒng),其目標是生成定量可燃物數(shù)據(jù)、可燃物照片系列等[11]。每個照片系列旨在對可燃物類型進行快速、簡單和廉價的評估,并附有數(shù)據(jù)表,包括可燃物類型量化參數(shù)[12]。Brown et al.[13]認為利用快速劃分可燃物類型的照片分類法代替野外可燃物調查的詳細測量。目前,北美地區(qū)已有52個可燃物照片指南[3],其他地區(qū)也在進行可燃物照片分類的研究(如南美、歐洲和墨西哥也進行了這類系列的開發(fā))[14-17]。
金森等[18]利用照片和圖像處理技術對人工林地表可燃物進行分類,建立了1 h時滯可燃物圖像分類模型。除此之外,我國再沒開展過可燃物類型照片分類法的研究。
森林可燃物類型的照片分類法是一種快速方便獲取可燃物類型信息的方法。利用照片分類法劃分可燃物類型,可更加快速的為林火預報提供依據(jù),使預報落實到具體地段上。撲救森林火災時,照片分類法可及時評估可燃物類型,有助于指揮撲火。在營林安全用火中,根據(jù)其劃分的不同可燃物類型決定用火技術。本文以黑龍江省大興安嶺地區(qū)為研究對象,將照片分類法與近年來發(fā)展迅速的圖像識別技術相結合,為森林可燃物類型分類提供參考。
黑龍江省大興安嶺地區(qū)地處我國東北部,平均海拔573 m,年平均氣溫-2.8 ℃,年平均降水量746 mm。土壤類型主要有棕色針葉林土、暗棕壤、灰黑土、草甸土和沼澤土;黑龍江省大興安嶺地區(qū)是我國緯度最高,且面積最大的林區(qū)(50°10′~53°33′N,121°12′~127°00′E),是我國唯一的寒溫帶針葉林區(qū),以興安落葉松(Larixgmelinii)為主要優(yōu)勢建群種,其他喬木樹種主要有針葉喬木樟子松(Pinussylvestris)、偃松(Pinuspumila)、云杉(Piceaasperata)等,闊葉喬木白樺(Betulaplatyphylla)、黑樺(Betuladavurica)、蒙古櫟(Quercusmongolica)、山楊(Populusdavidiana)、紫椴(Tiliaamurensis)等。灌草層的結構較為單一,以杜鵑(Rhododendronsimsii)、杜香(Ledumpalustre)和胡枝子(Lespedezabicolor)占優(yōu)勢。
2.1.1 樣地設置和可燃物調查
設置20 m×20 m樣地,調查記錄樣地坐標、海拔、坡位、坡度、坡向、林分郁閉度、物種名稱等。對胸徑大于等于1 cm的喬木每木檢尺,記錄主林層、次林層、站桿的蓋度、第一枝下高、株數(shù)、平均胸徑和平均樹高。
在每個樣地的四角和中心設置5個2 m×2 m小樣方,調查胸徑1 cm以下的灌木,記錄灌木主層的蓋度、活灌木比例、是否有針葉樹垂下枝條。
樣地內設置5個1 m×1 m小樣方,調查非木質可燃物(活的草本和蕨類等),記錄草本層主層和次層的蓋度、活草比例、高度、載量,木質可燃物的厚度和蓋度,腐爛和未腐爛樹樁的數(shù)量、直徑、高度,堆狀可燃物的長、寬、高。
沿樣地對角線設置5塊0.5 m×0.5 m樣方,調查腐殖質,記錄凋落物、半腐殖質、腐殖質層和地衣苔蘚的厚度、蓋度、形態(tài)、物種組成及針葉、闊葉、草本植物的比例。
2.1.2 可燃物照片拍攝方法
拍攝方法的設計目的是為圖像識別技術采集可燃物圖像特征。森林可燃物層次體系[19]如圖1,不同的可燃物層次結構對火行為的影響也不同。設計原則是快速且盡可能多的涵蓋可燃物樣地特征。因此,本研究按照森林可燃物的層次體系結構,將可燃物照片拍攝分為4個層次。
樹冠層:該層次主要是在照片上體現(xiàn)可燃物層次體系的樹冠特征。在樣地內用相機對準正上方,拍攝樣地內喬木樹冠,照片內只包括樹冠和天空。
圖1 森林可燃物的層次體系結構
中間層:該層次主要拍攝樹冠之下、低矮植被層之上的喬木,包括梯子可燃物、枯立木,在圖片上體現(xiàn)可燃物層次體系的喬木層特征。對喬木遠景拍照,包括整個樹高,但盡量不要照到喬木層以下的可燃物(視地形而定)。
灌木層:該層次涵蓋的可燃物特征最多,包括喬木層、灌木層、粗可燃物層、枯枝落葉層、地表可燃物層。將相機對準前方拍攝包括喬木、灌木、低矮植被及地面的照片,盡量不要拍攝到樹冠。
地被層:該層主要拍攝樣地內的低矮植被層、粗可燃物層、枯枝落葉層、地表可燃物層。將相機對準下方拍攝灌木、地表可燃物及地面。
每個層次不同方向共拍攝5張以上照片,拍攝時應站在樣地中心拍攝并將焦距歸零。若某層次缺失相應的可燃物特征,例如,樣地內喬木未達到起測徑級,沒有形成樹冠,則不拍攝樹冠層照片。
2.1.3 可燃物照片數(shù)據(jù)庫建立
將大興安嶺地區(qū)調查的51塊樣地,保存在數(shù)據(jù)庫內,再把采集的照片保存到相應樣地的文件夾;每個樣地文件夾中的照片依照拍攝層次保存到各自相應的層次文件夾中,這樣每一張照片都被準確的定義。例如,某一張圖片的定義是:大興安嶺-1號樣地-喬木層。并且,數(shù)據(jù)庫內每塊樣地都附有可燃物樣地參數(shù)。
2.1.4 可燃物類型劃分
本研究采用系統(tǒng)聚類方法,對大興安嶺地區(qū)調查的51塊樣地進行可燃物類型劃分。該方法的基本思想是,先將n個樣本看成一類,并規(guī)定樣本之間和類別之間的距離,開始時距離是相同的,然后在所有類中,選擇距離最小的兩個類合并為一個類,并計算新類之間的距離;再將距離最近的兩個類合并,并且計算距離,這樣每次合并兩類,直到所有樣本合并為一類為止。
由于本研究調查參數(shù)多達39個,調查樣地為51個,過多的聚類因子不適合進行可燃物類型劃分,因此,采用主成分分析法對聚類因子降維,降維后的因子回歸系數(shù)作為聚類因子。在主成分分析之前,對調查參數(shù)進行Z分值標準化處理。
2.2.1 圖像識別的步驟
圖像識別一般分為三個步驟:
第一步,將目標圖片進行特征提取。采用目前最新、效果最好的卷積神經網(wǎng)絡(CNN),這是一種帶有卷積結構的深度神經網(wǎng)絡,卷積結構可以減少深層網(wǎng)絡占用的內存量,也可以減少網(wǎng)絡的參數(shù)個數(shù),緩解模型的過擬合問題。
第二步,將圖像特征信息進行編碼列表。對于分辨率較大的照片作降低分辨率處理后,再進行圖像特征提取和編碼處理。
第三步,相似度匹配運算。利用目標圖像的編碼值,在圖像識別引擎中的圖像數(shù)據(jù)庫進行全局的相似度計算;根據(jù)所需要的魯棒性,設定閾值,然后將相似度高的圖片預保留下來。
2.2.2 建立識別算法
提取CNN特征:采用Imagenet-vgg-f(VGGNet)模型[20]來提取樣地圖像的CNN特征。VGGNet是一種深度卷積神經網(wǎng)絡,揭示了卷積神經網(wǎng)絡的深度與其性能之間的關系,相比之前的網(wǎng)絡結構,錯誤率大幅下降。同時,其具有擴展性強,泛用性好,結構簡潔的優(yōu)點。VGGNet訓練后的模型參數(shù)在官方網(wǎng)站上是開源的,可用來在特定的圖像分類任務上進行再訓練,提供了非常好的初始化權重。VGGNet最主要的特色是減少運算的參數(shù)量,對于單個的5×5的卷積層,在VGGNet模型上則體現(xiàn)為2個3×3的卷積層;單個7×7的卷積層,在VGGNet模型則是3個3×3的卷積層,參數(shù)量只有前者的(3×3×3)/(7×7)=55%,大大降低了模型的運算量,簡化了數(shù)據(jù)結構,使得CNN對特征的學習能力更強。訓練時,輸入的是大小為224×224的RGB圖像,預處理過程中只在訓練集中的每個像素上減去RGB的均值。用第20個struct的數(shù)據(jù),通過VGGNet模型獲得每個樣本圖像4096維的特征向量。
圖像相似度評判:對于兩張圖像I1和I2,需要計算兩者相似度。首先利用VGGNet模型提取兩張圖像的4096維特征向量f1和f2,然后利用下式計算相似性:
式中:s為相似得分。這相當于兩張圖像歸一化特征向量的內積,該值越大,代表圖像的相似性越大。
樣地檢索:對于一塊樣地,可將可燃物樣地圖像特征分為4個層次(樹冠層、中間層、灌木層以及地被層),每個層次采集有不同數(shù)量的照片。對于一張測試圖像,如果其屬于某一層次,則只在相應層次的數(shù)據(jù)庫中進行檢索。為了消除不同樣地照片數(shù)目不同所帶來的差異,僅計算該照片與不同樣地樣本的最大相似度。如果輸入多張照片,則將多個最大相似度進行相加,這樣就獲得了測試樣地同數(shù)據(jù)庫中樣地的相似度關系。按照相似度大小排序,最終返回樣地檢索結果。
在圖像識別研究領域,存在top-n容錯率,即在排名前n個結果中,如果有一個結果正確,那么本次分類即為正確[21]。大興安嶺地區(qū)的照片樣本數(shù)為671個,采用Top-3容錯率,即為排名前3的結果中有一個結果分類正確,那么本次分類就是正確的。
該測試旨在分析該技術每層至少需要多少張照片,才能達到輸出結果差異不顯著。對大興安嶺地區(qū)51塊調查樣地進行測試,共671張照片,每塊樣地每層2至6張照片隨機組合,依次遞進測試,每種照片數(shù)測試30次,取Top-1結果,共得到7650個數(shù)據(jù)。
理論上,每層照片數(shù)越多,識別穩(wěn)定性越高。該測試旨在找出可以達到穩(wěn)定結果的每層最少照片數(shù),將每層照片數(shù)得到的結果樣地進行相互對比,2張對比3張,3張對比4張,依次類推。采用單因素方差分析法,分析兩組結果的差異性是否顯著。
由表1可知,F(xiàn)值大于F-crit值,表明每層2張與每層3張存在差異,P值大于0.01,小于0.05,說明差異顯著。表明在每層2張的情況下,識別結果未達到穩(wěn)定。
表1 每層2張與每層3張結果差異分析
由表2可知,F(xiàn)值小于F-crit值,表明每層3張與每層4張結果無差異,P值大于0.05,更進一步說明二者之間不存在差異,暫時認定每層3張可達到結果穩(wěn)定。
表2 每層3張與每層4張結果差異分析
由表3可知,F(xiàn)值小于F-crit值,說明每層4張與每層5張結果無差異,P值大于0.05,更進一步說明二者之間不存在差異,當每層照片數(shù)大于3時,結果都是穩(wěn)定的。
表3 每層4張與每層5張結果差異分析
由此可見,該軟件至少每層3張照片,即可達到結果基本穩(wěn)定。說明該軟件在使用時,每層至少要導入3張照片,在調查拍攝可燃物樣地時也應該每層至少拍攝3張。
3.2.1 可燃物類型劃分
可燃物類型是檢驗識別精度的標準,對于目標樣地和算法輸出的結果樣地是否能歸為一類,是通過可燃物類型來判斷的。若目標樣地與結果樣地可燃物類型一致,那么本次分類即為正確,反之就是錯誤的。
本研究系統(tǒng)聚類分析采用歐幾里得距離衡量相似尺度,依據(jù)華氏方法進行聚類,所有變量值均為Z分值。在聚類之前采用主成分分析法對聚類因子降維,連續(xù)并類的過程可以通過聚類譜系圖直觀展現(xiàn)出來,聚類因子主要為野外調查所收集的可燃物參數(shù)。
由表4可知,各聚類因子的信息提取率均高于0.6,說明合并因子造成的信息損失率在可接受的范圍內。
由表5可知,39個因子被分為12類主成分,12類主成分的累加平方和為81.699%,大于75%,小于85%,說明當39個因子被分為12類主成分時,信息損失率稍大。考慮到可燃物床層的復雜性,累加平方和81.699%接近85%,信息損失率可以接受。
由圖2可知,將12類主成分回歸系數(shù)作為聚類因子,通過系統(tǒng)聚類分析得出,在聚集固定值為10的情況下,根據(jù)林分類型,將可燃物類型分為:灌木叢、落葉松-針闊混交林、落葉松-針葉混交林、闊葉純林、落葉松純林、樟子松純林、灌叢草甸、針闊混交林、地衣苔蘚、白樺純林。利用系統(tǒng)聚類分析法,在聚類固定值為5的情況下,根據(jù)10個聚類的優(yōu)勢樹種,將可燃物類型分為5類:LX-1(低矮植被類)、LX-2(落葉松-針闊混交林類)、LX-3(落葉松-針葉混交林類)、LX-4(樟子松純林類)、LX-5(地衣苔蘚地)。
表4 Z分值標準化后聚類因子的公共因子分析
3.2.2 精度檢驗
將劃分好的可燃物類型編譯成數(shù)值導入到每層3張照片數(shù)的結果中,如果目標樣地的可燃物類型數(shù)值與結果樣地的可燃物類型數(shù)值相減等于0,即視為分類正確。結果顯示,51塊樣地,在每層3張照片隨機組合,進行30次重復,共進行1530次檢驗,得到4950個結果。
51塊樣地Top-1檢驗結果,其中11塊樣地錯分率為100%,9塊樣地準確率不足80%,32塊樣地準確率超過80%,23塊樣地準確率達到100%。因此,Top-1(僅將相似得分第一的結果計入)整體分類準確率為67.85%。
51塊樣地Top-2檢驗結果,其中8塊樣地錯分率為100%,4塊樣地準確率低于80%;39塊樣地準確率高于80%,其中,37塊樣地準確率為100%。因此,Top-2整體分類準確率為78.95%,
51塊樣地Top-3檢驗結果,其中7塊樣地地錯分率為100%,3塊樣地準確率低于80%,41塊樣地準確率高于80%,其中38塊樣地準確率為100%。因此,Top-3整體分類準確率為82.61%。
表5 聚類因子的變異數(shù)總計
從照片輸入數(shù)量來看,在每層3張照片的輸出結果與每層大于3張照片的輸出結果無顯著差異,說明每層輸入3張片可以得到穩(wěn)定的結果。從理論上講,結果的穩(wěn)定與檢驗樣地的圖片組合數(shù)成負相關,也就是說,每層照片數(shù)輸入的越多,樣地各層的照片組合的選擇越少,結果的差異性也就越小??傊?,無論是填充數(shù)據(jù)庫還是做野外調查拍攝,每層照片數(shù)不能少于3張。
從精度檢驗來看,Top-1的整體分類精度為67.85%,分類結果不理想;Top-2的分類精度為78.95%,可以接受;Top-3的精度達到了82.61%,表明在Top-3的情況下分類準確率是可靠的。在一般的圖像分類中,通常采用Top-5容錯率,主要應用在物體識別、風景識別、人臉識別等。本研究采用Top-3容錯率,主要因為外業(yè)調查樣地為51塊,共拍攝671張照片,樣本較少,同時又考慮到可燃物在空間上呈現(xiàn)的復雜結構,放寬了容錯率。
一般的圖像識別的對象為指紋、人臉、車輛、建筑、植物葉片、動物等,這些事物往往具有獨特的結構、顏色和形態(tài)特征,識別難度相對較低。而森林可燃物樣地尺度的群落特征十分復雜,可燃物種類繁多且形態(tài)各異,具有很強的空間異質性,識別難度相對較高。根據(jù)森林可燃物層次體系結構,將可燃物樣地的圖像特征分為4層,盡可能將各種可燃物都涵蓋進圖像特征。這種分層對各種可燃物層次、種類在檢索時有很強的針對性,基本不會造成過度檢索,既提高了準確率又提升了檢索速度。
本研究與美國的照片分類法有著明顯不同。美國的照片分類法是在目視前方拍攝平面和立體照片,由林務人員用立體眼鏡對比現(xiàn)場可燃物與資料庫里可燃物照片的相似程度[3]。本研究利用人工智能代替肉眼識別,旨在盡可能的在照片分類過程中,減少主觀成分,同時,也是為了盡可能提取可燃物床層的特征。該分類依據(jù)是計算目標樣地與數(shù)據(jù)庫樣地的每層每張照片最大相似程度,在結果輸出窗口會輸出相似得分排名前3的樣地。根據(jù)目標樣地的實際情況與Top-3樣地在群落相似性、林分因子和可燃物參數(shù)等方面進行綜合的對比,提高了檢索速度。
圖2 可燃物類型聚類結果
該技術目前尚處于初步研究階段,與美國照片分類法相比還有很多不足。美國森林可燃物類型照片分類法經歷40余年的發(fā)展,已經成為一個龐大的、不斷完善的、易于調用的可燃物類型數(shù)據(jù)庫。很多研究開發(fā)出可以用照片直接提取出可燃物載量、可燃物模型、潛在火行為和火效應模型等技術[22-25]。目前,該方法還不能直接提取出可燃物載量、火效應等指標,但原始調查數(shù)據(jù)可用于模型的計算,進而推算出更多的可燃物參數(shù)[26-31]。
由于數(shù)據(jù)庫樣本較少,但該方法的軟件平臺已經建立了數(shù)據(jù)庫擴充的窗口,用戶可以根據(jù)自己的需要添加樣地,并劃分可燃物類型。用戶可以按照需求制定檢索地區(qū),不會擴大的檢索范圍。
探究圖像特征與可燃物參數(shù)之間的聯(lián)系,建立相關的線性或非線性模型,利用插值法推算出目標樣地的可燃物參數(shù)。目前面臨的問題是通過VGGNet模型提取的CNN特征,在每張照片上體現(xiàn)的是4096維的特征向量,無法直接用于建立可燃物參數(shù)圖像模型。因此,在后續(xù)的研究中,需要對4096維的特征向量進行更高程度的降維,將高維度圖像特征向量轉化為輸入到模型中的參數(shù),建立與可燃物參數(shù)之間聯(lián)系。