葉謀鑫 龔輝
1.深圳市紅樹林濕地保護(hù)基金會(huì);2.廣州市城市規(guī)劃勘測(cè)設(shè)計(jì)研究院
土地利用是城鄉(xiāng)發(fā)展規(guī)劃及資源開發(fā)利用的關(guān)鍵信息。近年來,國(guó)內(nèi)外學(xué)者使用不同的遙感影像進(jìn)行了土地利用分類研究,但受限于空間分辨率,在提取部分細(xì)小地物時(shí)具有局限性。無(wú)人機(jī)體型小、機(jī)動(dòng)靈活,具備時(shí)效性強(qiáng)、空間分辨率高的特點(diǎn),可有效克服光學(xué)衛(wèi)星缺點(diǎn)。不同于以像元為基本單位的傳統(tǒng)方法,面向?qū)ο蠓椒ㄒ詫?duì)象作為基本處理單位,能在較大程度上解決光譜混淆、混合像元等問題,也可以減小分類結(jié)果中的“椒鹽效應(yīng)”。盡管近年來機(jī)器學(xué)習(xí)算法與面向?qū)ο笤诘匚锓诸惖难芯繑?shù)量眾多[1],但其在鄉(xiāng)村土地利用覆蓋中的研究仍較少。本文選用無(wú)人機(jī)可見光影像,使用隨機(jī)森林、支持向量機(jī)(SVM)與旋轉(zhuǎn)森林三種算法進(jìn)行土地利用分類并對(duì)比,驗(yàn)證無(wú)人機(jī)影像與這三種分類方法在鄉(xiāng)村地物分類應(yīng)用中的可行性。
研究區(qū)域位于廣東省云浮市新興縣太平鎮(zhèn)南部區(qū),該地區(qū)屬亞熱帶季風(fēng)氣候,熱量豐富,雨水充沛。研究區(qū)呈矩形,南北長(zhǎng)約800m,東西長(zhǎng)約600m(圖1)。研究區(qū)內(nèi)土地利用類型較為豐富,農(nóng)作物主要以水稻為主,建物分布比較集中,坡度較緩。
采用大疆DJI 精靈4 PRO V2.0 四旋翼消費(fèi)級(jí)可見光無(wú)人機(jī)設(shè)備進(jìn)行研究區(qū)數(shù)據(jù)采集。該無(wú)人機(jī)質(zhì)量輕、體積小,CMOS 傳感器,鏡頭焦距為8.8mm,無(wú)人機(jī)平臺(tái)與RGB 傳感器集成一體,整機(jī)重量1375g。共有紅、綠、藍(lán)3 個(gè)波段,傳感器分辨率為5472×3648。無(wú)人機(jī)影像的采集時(shí)間為2022 年7 月6 日,天氣狀況良好,飛行時(shí)段選擇正午10:00-14:00。使用DJI Pilot 生成無(wú)人機(jī)正射攝影航線,航向重疊率設(shè)置為80%,旁向重疊率設(shè)置為80%,航高設(shè)置為120m,飛行速度約為10m/s。共獲取覆蓋研究區(qū)的無(wú)人機(jī)傾斜攝影影像2590 幅。
基于攝影建模軟件ContextCapture 生成研究區(qū)無(wú)人機(jī)正射影像圖(Digital Orthophoto Map,DOM)和數(shù)字表面模型(Digital Surface Model,DSM),空間分辨率均為0.05m。在eCognition 軟件中基于DOM 與DSM 進(jìn)行多尺度分割,選擇不透水面、耕地、裸地、植被與水體作為分類類別,隨機(jī)選取983 個(gè)對(duì)應(yīng)樣本并提取其光譜、紋理等特征,分別使用SVM、隨機(jī)森林和旋轉(zhuǎn)森林三種不同的分類模型用于地物分類,技術(shù)路線如圖2 所示:
圖2 技術(shù)路線
本文使用eCognition 軟件對(duì)影像進(jìn)行多尺度分割,分割時(shí)需要對(duì)尺度參數(shù)、形狀參數(shù)和緊湊度參數(shù)進(jìn)行設(shè)置,尺度參數(shù)決定影像對(duì)象的大小,形狀參數(shù)決定色彩和形狀分割準(zhǔn)則的關(guān)系,緊湊度參數(shù)用于區(qū)分影像對(duì)象。多次試驗(yàn)與對(duì)比分析后,本研究選定的最適宜的尺度參數(shù)為80,形狀參數(shù)為0.6,緊致度參數(shù)為0.4。
由于無(wú)人機(jī)可見光影像光譜波段較少,本文進(jìn)一步提取影像對(duì)象的指數(shù)特征、紋理特征、形狀特征和高度特征進(jìn)行地物分類如表1 所示。其中選取的植被指數(shù)如表2 所示。
表1 分類所用特征
表2 可見光指數(shù)特征
1.SVM
SVM 是由Vapnik 于1995 年在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上提出的一種機(jī)器學(xué)習(xí)算法,目標(biāo)是尋找一個(gè)最優(yōu)的超平面,在盡可能滿足分類的限制條件下,把分類數(shù)據(jù)集中的所有點(diǎn)分開,且使點(diǎn)與該超平面距離最遠(yuǎn)[3]。
2.隨機(jī)森林
隨機(jī)森林(RF)是一種統(tǒng)計(jì)學(xué)習(xí)理論,2001 年由Leo Breiman 提出,它是利用bootsrap 重抽樣方法從原始樣本中抽取多個(gè)樣本,對(duì)每個(gè)bootsrap 樣本進(jìn)行決策樹建模,然后組合多棵決策樹的預(yù)測(cè),通過投票得出最終預(yù)測(cè)結(jié)果[4]。隨機(jī)森林可以處理高維數(shù)據(jù),且具有避免過擬合和可以對(duì)特征重要性進(jìn)行排序等優(yōu)點(diǎn)。
3.旋轉(zhuǎn)森林
旋轉(zhuǎn)森林(Rotation Forest)是在隨機(jī)森林上改進(jìn),添加了數(shù)據(jù)軸的一種算法。該算法通過訓(xùn)練整個(gè)數(shù)據(jù)集中旋轉(zhuǎn)特征空間的每棵樹得到樹的多樣性。在確保樹的多樣性同時(shí)被旋轉(zhuǎn)的樹能降低對(duì)單變量樹的約束,這些單變量樹能分解輸入空間到平行與原始特征軸的超平面[5]。隨機(jī)分離特征集到K 個(gè)互相獨(dú)立的區(qū)間,之后分別在每個(gè)特征區(qū)間使用主成分分析法,保證第一主要元素具有最大方差。新的訓(xùn)練集被應(yīng)用到訓(xùn)練分類樹的樹歸納算法中。
運(yùn)用Weka 3.8.6 軟件中的libsvm、隨機(jī)森林和旋轉(zhuǎn)森林算法對(duì)區(qū)域進(jìn)行分類,得到的分類結(jié)果如圖3 所示。從三種結(jié)果的圖可以看出總體分類效果都較好,但部分裸地和水體會(huì)出現(xiàn)誤分現(xiàn)象,而SVM的分類結(jié)果中出現(xiàn)部分水體誤分為建筑和裸地的情況。
圖3 地物分類結(jié)果(a)隨機(jī)森林分類結(jié)果(b)SVM分類結(jié)果(c)旋轉(zhuǎn)森林分類結(jié)果
對(duì)分類結(jié)果進(jìn)行混淆矩陣的計(jì)算,混淆矩陣是精度評(píng)價(jià)的核心方法,描述分類精度與類別間的混淆性,基本統(tǒng)計(jì)量包括總體精度、Kappa 系數(shù)、用戶精度和制圖精度。
三種分類精度評(píng)價(jià)結(jié)果如下表3 所示。
表3 三種分類方法精度評(píng)價(jià)結(jié)果對(duì)比
從表3 可得,三種分類算法中隨機(jī)森林的總體分類精度最高,為95.32%,Kappa 系數(shù)為0.9371;SVM 的總體分類精度最低,為84.44%,Kappa 系數(shù)只有0.7919。其中,隨機(jī)森林與旋轉(zhuǎn)森林得到的分類精度類似。相比于其他地物,三種方法在水體的區(qū)分上精度較低,這可能與無(wú)人機(jī)在對(duì)水體部分影像拼接時(shí)難以確定同名點(diǎn)因而造成水體部分的影像質(zhì)量較低有關(guān)。
無(wú)人機(jī)數(shù)據(jù)可以有效地為對(duì)鄉(xiāng)村的土地利用與土地覆蓋類型進(jìn)行分類,為鄉(xiāng)村發(fā)展提供基礎(chǔ)數(shù)據(jù),且具有較高精度。隨機(jī)森林的方法相比于SVM 與旋轉(zhuǎn)森林的方法,在針對(duì)厘米級(jí)無(wú)人機(jī)數(shù)據(jù)在鄉(xiāng)村地區(qū)的分類中具有更好的優(yōu)勢(shì)。