嚴恩萍,莫登奎
(1. 中南林業(yè)科技大學 林業(yè)遙感大數(shù)據(jù)與生態(tài)安全湖南省重點實驗室, 湖南 長沙 410004; 2. 中南林業(yè)科技大學 南方森林資源經(jīng)營與監(jiān)測國家林業(yè)與草原局重點實驗室, 湖南 長沙 410004; 3. 中南林業(yè)科技大學 林學院, 湖南 長沙 410004)
散墳是森林火災的主要隱患,其空間分布、數(shù)量、密度等信息都是林業(yè)、應急、民政部門需要掌握的基礎數(shù)據(jù)。對大面積的散墳火災隱患點進行系統(tǒng)監(jiān)測與空間分布研究,有助于掌握散墳的位置、數(shù)量、密度以及分布規(guī)律,進而有利于森林火災的早期預警,從而降低森林火災的發(fā)生概率。然而由于未受到足夠的重視,國內(nèi)外鮮有大面積散墳火災隱患點的智能監(jiān)測與空間分布方面的研究報道,缺少基于散墳的火災隱患點專題數(shù)據(jù)庫。
相關學者一直致力于火災隱患調(diào)查方法的改進研究[1-6]。傳統(tǒng)的火災隱患調(diào)查方法主要以人工實地調(diào)查為主,雖然這種方法檢測精度高,但是消耗大量的人力、物力和財力,無法用于大面積火災隱患的檢測?,F(xiàn)有的火災隱患監(jiān)測主要有2種。一是依靠衛(wèi)星遙感的監(jiān)測方法,包括基于低空間分辨率和高空間分辨率的2種監(jiān)測方法。前者主要依靠中紅外/熱紅外波段進行識別,然而這些衛(wèi)星由于空間分辨率低,無法探測小面積的目標,故不利于火災隱患點的早期識別[7-10];后者主要依靠短波紅外/可見光波段進行識別,這些衛(wèi)星雖然能夠識別火災隱患的大概范圍,但是由于空間分辨率有限,無法自動定位火災隱患點的具體位置[11-14]。二是依靠視頻分析技術的火災隱患檢測,雖然該方法簡便快捷精度高,能夠獲取火災隱患點的精確位置,但是只能適用于面積較小的局部區(qū)域,無法實現(xiàn)大面積火災隱患點的自動定位與快速檢測[15]。
近年來,亞米級高分辨率遙感的發(fā)展為散墳的智能檢測提供了新途徑[16-18]。同衛(wèi)星遙感相比,亞米級高分辨遙感具有單景覆蓋面積廣、海量星上存儲、地理定位精度高的優(yōu)勢,能夠?qū)崿F(xiàn)大面積散墳火災隱患點的高效精準監(jiān)測。歸納起來,關于人工智能和高分辨率遙感結(jié)合研究很多[19-22],缺少對大面積散墳火災隱患點進行自動檢測與快速清查的研究報道。
鑒于此,研究以高分辨率航拍影像為數(shù)據(jù)源,提出一種基于Detectron2工具箱改進的Mask RCNN智能識別方法,以期實現(xiàn)大面積散墳火災隱患點的自動檢測與及時預警,同時嘗試繪制具有極高應用價值的第一份散墳分布數(shù)據(jù),試圖揭示不同分級條件下散墳隨地形和道路的空間分布規(guī)律。研究表明,文中提供的自動檢測方法簡單通用、可移植性強,具有應用于全國散墳火災隱患點自動檢測與預警的潛力。
研究區(qū)選擇湖南省東部偏北的長沙縣,位于長衡丘陵盆地的北部,地理位置介于112°58′23″~113°30′09″E,28°02′04″~28°39′51″N之間,屬亞熱帶濕潤氣候,春暖夏涼,四季分明,年平均氣溫17 ℃,年均無霜期271 d,年均降水量1 877.1 mm,主要土地覆蓋類型包括林地、耕地、草地、水體、建設用地和其他用地。
1.2.1 無人機影像
研究區(qū)的無人機高清影像拍攝于2019年10月19—21日,航拍當日天氣晴朗、風速小、光線充足。無人機航線規(guī)劃數(shù)據(jù)的采集高度100 m,速度5 m/s,鏡頭垂直于地面,航向重疊率70%,旁向重疊率80%,空間分辨率0.5 m×0.5 m。正值秋季,無人機航拍的散墳火災隱患點更容易與背景區(qū)分。
1.2.2 地面實測數(shù)據(jù)
地面實測數(shù)據(jù)主要用于研究區(qū)火災隱患點樣本數(shù)據(jù)集的標注。課題組首先利用Google earth高清影像分析研究區(qū)火災隱患點的總體分布情況,初步確定可調(diào)查火災隱患點的分布和范圍;然后于2020年2月5—10日前往長沙縣開展實地調(diào)查,沿著可及的研究區(qū)道路,收集火災隱患點(散墳)的位置、地形以及其他相關信息。
研究采用的數(shù)據(jù)為2016年無人機航拍的高分辨率遙感影像數(shù)據(jù),格式為TIFF,影像分辨率為0.2 m×0.2 m。具體樣本集構建包括5個步驟:1)樣本抽樣。以內(nèi)轄行政鄉(xiāng)鎮(zhèn)為單位,從每個鎮(zhèn)隨機選取4塊1 000 m×1 000 m的區(qū)域裁剪獲取樣本數(shù)據(jù),共獲取52張樣本影像;2)數(shù)據(jù)標注。為滿足網(wǎng)絡訓練要求,利用ArcGIS 10.7軟件對散墳火災隱患點進行人工標注,原則上以人眼清晰可見為準,標注完成輸出二值圖;3)數(shù)據(jù)裁剪。由于深度學習網(wǎng)絡無法直接輸入尺寸過大樣本,因此,將樣本數(shù)據(jù)和相應二值圖按50%的重疊率裁剪為512 pixels×512 pixels的樣本數(shù)據(jù)集(圖1);4)數(shù)據(jù)擴增。研究綜合考慮散墳目標的形狀和分布特征,結(jié)合具有50%重疊步長的圖像裁剪方法,采用圖像旋轉(zhuǎn)、圖像移動和對角鏡像等方法進行數(shù)據(jù)擴增,共獲取樣本圖片1 256張;5)數(shù)據(jù)劃分。將已擴增的數(shù)據(jù)集按照7.5∶2.5的比例分為2份:訓練數(shù)據(jù)集和驗證數(shù)據(jù)集。其中訓練數(shù)據(jù)集用于模型參數(shù)訓練和調(diào)優(yōu),驗證數(shù)據(jù)集用于評估訓練模型對樣本的泛化誤差。
圖1 研究區(qū)散墳樣本Fig. 1 Samples of scattered graves in the study area
研究采用目前應用廣泛的Mask RCNN網(wǎng)絡提取散墳目標,該算法包含3個任務分支:預測類別、預測矩形框和預測掩碼。首先利用深度殘差網(wǎng)絡ResNet提取特征圖像;然后結(jié)合區(qū)域生成網(wǎng)絡RPN提取潛在ROI;利用ROIAlign層將ROI映射成固定維數(shù)的特征向量,其中2個分支經(jīng)過全連接層進行目標分類和坐標框回歸,另1個分支經(jīng)過全卷積運算生成預測掩碼[23]。具體結(jié)構如圖2所示。
圖2 改進的Mask R-CNN框架結(jié)構圖Fig. 2 Network structure diagram of improved Mask R-CNN
2.2.1 訓練環(huán)境
文中使用的Mask RCNN網(wǎng)絡的主體框架來自于Facebook下FAIR研究院推出的基于Pytorch的Detectron2工具箱。實驗在Ubuntu 18.04操作系統(tǒng)下完成,CPU為I9-10900k,GPU為RTX 3080,內(nèi)存32G。程序在Pycharm編譯器下,基于Python 3.6語言和Pytorch 1.8.0深度學習框架編譯實現(xiàn)。實驗過程中的影像讀取和處理模塊使用的工具包為GDAL 3.1.4和OpenCV 3.4.2。
研究使用的預訓練模型為Detectron2官方提供的COCO目標檢測模型,初始學習率為0.005,批次大小為4,每個Epoch進行迭代訓練,共訓練150個Epoch。訓練初期采用預熱策略保證參數(shù)穩(wěn)定,以開始訓練的前1 000次迭代為預熱階段,該階段內(nèi)線性增加學習率至初始學習率。
2.2.2 模型評價
由于需要同時考慮精確率和召回率,研究采用F1分數(shù)(F1 Score)作為模型預測結(jié)果的評價指標,散墳檢測任務屬于單分類任務,具體表達式見式(1)~式(3):
(1)
(2)
(3)
式中:Precision代表精確率;Recall代表召回率;TP表示實際為散墳且被識別為散墳的樣本數(shù);FP表示實際為背景但被識別為散墳的樣本數(shù);FN表示實際為散墳但沒有被網(wǎng)絡識別為散墳的樣本數(shù)。
已有研究表明,分析目標的空間分布特征有利于提出科學合理的目標布局優(yōu)化策略。鑒于此,文中采用核密度指數(shù)、最鄰近指數(shù)、地理集中指數(shù)和不平衡指數(shù)對研究區(qū)散墳空間分布的集聚性進行可視化分析[24]。具體計算公式見表1。
表1 4種空間分布特征指數(shù)Table 1 Four spatial distribution characteristic indexes
研究對象屬于均勻分布;若02.4 影響因素分析
地形地貌作為制約人類經(jīng)濟活動的重要基礎,對研究區(qū)散墳分布有著廣泛深刻的影響,文中研究采用分層分級的方法分析散墳空間分布的影響因素,主要因素包括海拔、坡度、坡向和道路。海拔按照[0, 200)m、[200, 500)m、[500, 1 000)m、[1 000,+∞)m劃分為4類;坡度按照[0°, 2°)、[2°, 5°)、[5°, 15°)、[15°, 35°)、[35°, 55°)和[55°, 90°)的分類依據(jù)依次分為平坡、緩坡、斜坡、陡坡、峭坡和垂壁[25]:坡向以0°為起點,按順時針將坡向平均分為8級,采用ArcGIS10.7軟件分別統(tǒng)計不同級別散墳的分布數(shù)量;為量化道路的影響距離,研究采用ArcGIS10.7軟件統(tǒng)計道路兩側(cè)[0, 100)m、[100, 500)m、[500, 1 000)m、[1 000, 2 000)m和[2 000, 3 000)m緩沖區(qū)的散墳分布情況。
由于風土習俗的影響,不同鄉(xiāng)鎮(zhèn)的散墳形狀特征、空間分布和背景環(huán)境存在差異,進而影響散墳檢測精度。為測試訓練模型的泛化能力,研究將未參與訓練的江背鎮(zhèn)、黃花鎮(zhèn)和路口鎮(zhèn)作為試驗區(qū),分別隨機選取3張1 km×1 km影像作為驗證集進行測試,具體測試結(jié)果如表2,檢測結(jié)果見圖3。
表2 不同鄉(xiāng)鎮(zhèn)的測試結(jié)果Table 2 Experimental results for different townships
圖3 黃花鎮(zhèn)散墳火災隱患點測試結(jié)果Fig. 3 Test results of fire hazard points for scattered graves in Huanghua Town
由表2可知,研究區(qū)江背鎮(zhèn)、黃花鎮(zhèn)和路口鎮(zhèn)散墳檢測的平均F1分數(shù)均超過88.42%,說明改進Mask RCNN模型的通用性較強,能夠適應不同區(qū)域的散墳檢測。由于路口鎮(zhèn)的散墳特征接近訓練樣本提供的全局目標特征,因此該區(qū)域改進Mask RCNN模型輸出的檢測精度更精確,平均F1分數(shù)達到94.37%,同江背鎮(zhèn)和黃花鎮(zhèn)相比,高出約6%。說明利用改進Mask RCNN模型開展散墳檢測時,可以結(jié)合訓練階段的檢測結(jié)果,實時補充針對不同區(qū)域目標特征的訓練樣本,以期提高模型的泛化性,以滿足不同區(qū)域散墳目標檢測的精度需求。
圖3為黃花鎮(zhèn)散墳火災隱患點的測試結(jié)果,從左到右依次為研究區(qū)影像、局部檢測結(jié)果放大圖、局部二值結(jié)果放大圖。紅色框覆蓋背景為森林;藍色框覆蓋背景為城鎮(zhèn)。分析可知,Mask RCNN框架對不同背景和密度的散墳目標檢測效果均很好,其中森林覆蓋的F1分數(shù)值(91.40%)略高于城鎮(zhèn)覆蓋的F1分數(shù)值(89.26%),說明林木陰影與土壤混淆的背景因素對模型檢測效果影響較小,能夠滿足森林覆蓋的散墳目標檢測與清查的需要。
3.2.1 密度特征分析
長沙縣散墳分布的總體密度約為25.13個/km2,呈現(xiàn)出“中部北部密集分布,其他區(qū)域零星分布”的空間分布格局(圖4)。散墳密度介于60~135個/km2區(qū)域面積比例為1.60%,主要分布在開慧鎮(zhèn)東北部、安沙鎮(zhèn)中南部和北山鎮(zhèn)北部,其次春華鎮(zhèn)也有少量分布,上述區(qū)域主要分布在研究區(qū)城區(qū)外圍,呈沿交通干線附近分布的格局,由于受到城區(qū)社會、經(jīng)濟的輻射作用,安沙鎮(zhèn)的散墳分布最密集;散墳密度介于40~60個/km2區(qū)域主要分布在60~135個/km2區(qū)域的外圍,呈環(huán)狀分布,其次金井鎮(zhèn)和果園鎮(zhèn)中部也有大面積分布,另外北山鎮(zhèn)西南部、黃興鎮(zhèn)南部、春華鎮(zhèn)東南部和江背鎮(zhèn)北部呈零星狀態(tài)分布;散墳密度介于0~10個/km2區(qū)域面積比例為19.18%,主要集中在研究區(qū)西南部城區(qū),由于城市化效應導致研究區(qū)散墳分布較為稀疏。
圖4 長沙縣散墳核密度分布Fig. 4 Kernel density distribution of scattered graves in Changsha County
3.2.2 集聚特征分析
研究運用ArcGIS10.7軟件計算長沙縣散墳的最近鄰距離指數(shù)NNI,具體結(jié)果見表3。分析可知,研究區(qū)散墳總體呈現(xiàn)聚集-隨機分布,且P值高度顯著,說明研究結(jié)果可信。從區(qū)域方面分析,長沙縣8個鄉(xiāng)鎮(zhèn)散墳呈聚集分布,占比為64.54%;其次35.43%的鄉(xiāng)鎮(zhèn)呈聚集-隨機分布;1個鄉(xiāng)鎮(zhèn)呈隨機-離散分布,即泉塘街道,占比為0.03%。
表3 研究區(qū)散墳分布最近距離指數(shù)Table 3 Nearest neighbor distance index of scattered graves in study area
3.2.3 均衡特征分析
根據(jù)表1公式分別計算研究區(qū)的地理集中指數(shù)和不平衡指數(shù),結(jié)果表明長沙縣散墳地理集中指數(shù)的實際值(G=9.214)大于理想值(G=5.556),說明研究區(qū)散墳空間分布不均勻。為進一步描述散墳的內(nèi)部分布格局,研究采用不平衡指數(shù)S驗證散墳分布均衡性[26],通過計算S=0.49,說明長沙縣散墳空間分布不均勻。分析洛倫茨曲線(圖5)可知,研究區(qū)散墳整體呈上凸趨勢,主要集中在6個鄉(xiāng)鎮(zhèn),占區(qū)域總數(shù)的66.65%。
圖5 研究區(qū)散墳單位空間分布的洛倫茨曲線Fig. 5 Lorenz curve of spatial distribution of scattered graves in study area
海拔是地形地貌的重要屬性,不同海拔位置的水資源、土壤條件等均有差異。由圖6(a)統(tǒng)計可知,研究區(qū)散墳主要分布在0~200 m的平原地帶,總占比高達98.52%,這是因為平原地帶適宜人類居住,人類活動頻繁,進而分布較多的散墳;坡度作為地面傾斜度的定量描述,表征研究區(qū)的地勢起伏情況。由圖6(b)可知,長沙縣散墳隨著坡度增加呈減少趨勢,分布于緩坡區(qū)域的散墳數(shù)最多,比例為47.87%,其次是斜坡(25.05%),說明農(nóng)村居民偏向選擇有一定坡度的區(qū)域設置墓地;作為重要的地形因子,坡向直接影響地表接受的光熱條件。由圖6(c)可知,研究區(qū)散墳分布沒有明顯的坡向特點,陽坡的散墳數(shù)量和陰坡相當。陽坡分布范圍內(nèi),西南坡的散墳數(shù)量較多(比例14.74%)。陰坡分布范圍內(nèi),西坡的散墳數(shù)量較多(比例13.77%);道路作為靈活的交通運輸方式,對研究區(qū)散墳分布具有重要的影響。將研究區(qū)散墳與主要道路疊加,同時按照分級建立緩沖區(qū)(圖6(d)),分析可知長沙縣高達74.40%的散墳沿道路2 000 m緩沖區(qū)范圍分布,說明道路對研究區(qū)散墳的空間分布具有積極的正向作用。
圖6 研究區(qū)散墳的分布情況統(tǒng)計Fig. 6 Statistics of distribution of scattered graves in study area
由于散墳主要分布在林地和城鎮(zhèn)周邊,且不同地類、密度和區(qū)域的散墳分布特征各異,為防止模型訓練的過度擬合,因此需要大量訓練樣本。已有研究表明,數(shù)據(jù)擴增是一種常用的擴大數(shù)據(jù)集方法,其提高模型泛化能力的同時減少模型的過度擬合[27]。研究考慮農(nóng)村散墳與林地陰影的相似性,以及無人機航拍的空間分辨率有限和背景的不確定性,難以滿足Mask RCNN訓練的樣本需求,文中采用圖像旋轉(zhuǎn)、圖像移動和對角鏡像等方法,對樣本數(shù)據(jù)進行擴增,目的是增加樣本數(shù)量的同時減少復雜背景對散墳檢測造成的不良影響,進而提高檢測精度。
研究采用Mask RCNN框架對不同地類覆蓋、分布密度和分布區(qū)域的散墳進行識別,結(jié)果表明該框架不僅能準確提取目標散墳的定位框,還能準確繪制目標散墳的Mask掩碼,說明該框架具有良好的準確性和穩(wěn)定性,檢測精度較高[28]。為提高檢測模型的泛化性,制作包含更多目標種類和分布特征的數(shù)據(jù)集,發(fā)展檢測效果更好的深度學習算法是今后的研究方向。為滿足大面積的散墳檢測需求,文中結(jié)合多時相遙感影像,研究針對完全裸露或半裸露的散墳檢測算法,旨在提出適應復雜數(shù)據(jù)的超參數(shù)訓練模型,提高散墳檢測精度。
已有研究表明,分布密集、遮擋重疊、背景相似以及表面陰影等是影響研究區(qū)散墳準確識別的主要干擾因素[29-30],例如城鎮(zhèn)附近航拍的遙感影像通常容易引入相似的地物干擾特征,進而降低模型檢出率;林區(qū)周邊航拍的遙感影像雖然沒有過多相似地物干擾,但是林區(qū)影像容易因光線不足和分布密集與背景土壤混淆,降低檢測精度。文中通過采用全卷積神經(jīng)網(wǎng)絡FCN提取散墳目標的準確特征,減少背景、遮擋和陰影等因素的干擾,實現(xiàn)研究區(qū)散墳的高效檢測,這與已有學者采用全卷積神經(jīng)網(wǎng)絡檢測蘋果的研究結(jié)論相似[31],說明全卷積神經(jīng)網(wǎng)絡具有消除背景干擾的潛力。由于文中重點針對高分辨率遙感影像中肉眼可見的散墳進行識別研究,因此不涉及被遮擋的散墳檢測問題,但是作為重要的火災隱患點,樹林遮擋方面的影響不容忽視。隨著研究范圍的逐步擴大,后續(xù)將通過人工實地核查的方式予以補充。
地形地貌和道路是制約人類經(jīng)濟活動的基礎,對其他要素與地理環(huán)境有廣泛深刻影響。文中將長沙縣散墳分布點與土地利用覆蓋圖進行疊加,分析農(nóng)村散墳的空間分布格局及其影響因素,有利于揭示研究區(qū)散墳的空間演變規(guī)律,進而為農(nóng)村墓地的合理規(guī)劃建設提供合理依據(jù)。根據(jù)研究區(qū)散墳空間分布特征,結(jié)合國家倡導的“厚養(yǎng)薄葬、文明節(jié)儉、生態(tài)環(huán)保”殯葬風尚,將研究區(qū)散墳布局優(yōu)化方案分為:一級區(qū)、二級區(qū)和三級區(qū)。一級區(qū)的散墳大都距離公共服務設施較近,交通便利,可將周邊零星的散墳移至規(guī)模較大的散墳集中地;二級區(qū)的區(qū)位優(yōu)勢不明顯,可以選擇交通便利的墓地集中點為基礎,引導附近規(guī)模小且不合理的散墳點歸并;三級區(qū)的交通可達性差,可與二級區(qū)的墓地集中點合并。這樣有利于加快農(nóng)村公益性墓地建設,推進農(nóng)村居民用地的合理利用。
由于缺乏足夠的重視,散墳火災隱患點(散墳)監(jiān)測長期被忽視,國內(nèi)外鮮有農(nóng)村散墳(潛在火災隱患點)的快速檢測與清查報道。鑒于此,研究以高分辨率航拍影像為數(shù)據(jù)源,結(jié)合實地踏查數(shù)據(jù),提出一種基于Detectron2工具箱改進的Mask RCNN網(wǎng)絡識別方法,開展長沙縣散墳(潛在火災隱患點)的快速檢測與清查,制作研究區(qū)散墳火災隱患點分布圖;同時結(jié)合4種空間特征指數(shù)分析研究區(qū)散墳的分布特征及其影響因素。結(jié)果表明:
1) 智能檢測方面?;贒etectron2工具箱改進的Mask RCNN網(wǎng)絡,能夠有效識別不同土地覆蓋、分布密度和研究區(qū)域的散墳目標,F1分數(shù)分別達90.33%、92.61%和90.41%;
2) 空間分布方面。研究區(qū)散墳總體呈聚集-隨機分布,分布密度約為25.13座/km2,呈現(xiàn)“中部北部密集分布,其他區(qū)域零星分布”的分布格局;
3) 影響因素方面,研究區(qū)散墳空間分布格局主要受地形和道路等因素影響,集中分布在0~200 m平原地帶,且0°~5°坡度的散墳分布最多,總體沒有明顯的坡向效應,主要沿道路網(wǎng)分布。研究表明文中繪制的國內(nèi)第1份基于散墳的火災隱患點分布數(shù)據(jù),具有較高的應用價值,可為全國散墳火災隱患點的快速檢測和自動清查提供參考。