董秀春,蔣 怡,黃 平,李宗南,劉 軻
(四川省農業(yè)科學院遙感應用研究所,成都610066)
休耕監(jiān)測,是配合農業(yè)農村部休耕輪作試點開展的重要工作,通過遙感快速監(jiān)測地塊是否休耕或種植有保護地力的綠肥作物,為有關部門的管理及農戶休耕補貼發(fā)放提供客觀信息[1-3]。云南石漠化休耕區(qū)地塊破碎,種植結構復雜,分辨率較粗的遙感影像難以滿足休耕地塊監(jiān)測精度需要,已進行的休耕監(jiān)測采用了RapidEye、Planet等空間分辨率優(yōu)于5 m的遙感影像。隨著農業(yè)監(jiān)測使用的遙感影像空間分辨率、時間分辨率提高,傳統(tǒng)分類方法存在效率和精度的不足。機器學習利用先驗知識使分類器進行自我學習,可更深層次挖掘影像光譜、紋理等特征信息,根據(jù)其模型結構可分為淺層學習和深度學習。常用的淺層機器學習分類器包括決策樹、支持向量機、隨機森林、Softmax等[4-5];較深度學習方法,具有模型結構較簡單、訓練樣本需求少、運算速度快等特點,在冬小麥[6-7]、大豆和玉米[8]、棉花[7]、水稻[9]等作物分類提取研究中取得較高分類精度。Softmax分類器適合于多類別的自動分類[10],其在高分辨率影像多種土地覆蓋分類中有良好表現(xiàn)[10-11],因而擬使用Softmax分類器進行休耕區(qū)多種作物的遙感分類。文章分析基于Softmax分類器和RapidEye遙感影像提取研究區(qū)綠肥、水稻、玉米及煙草等4種作物空間分布信息的精度及誤差因素,為使用淺層機器學習方法快速準確掌握休耕情況提供參考。
研 究 區(qū) 地 處 云 南 省 石 林 彝 族 自 治 縣 北 部,位 于 東 經 103°10′~103°41′、 北 緯24°30′~25°03′之間,見圖1。該區(qū)域平均海拔約1 900 m,屬低緯高原山地季風氣候,年平均氣溫16.3℃,年平均降雨量940 mm,年平均日照2 097 h。巖溶地貌明顯,巖溶面積位于昆明市第一,土地石漠化嚴重,面積占全縣巖溶面積的28.43%[12],是云南省首批被確定為耕地休耕制度試點縣之一。研究區(qū)內夏季種植作物主要包括水稻、玉米、煙草等;休耕作物為光葉紫花苕,是云南休耕地區(qū)用于養(yǎng)地的綠肥作物。
圖1 研究區(qū)位置Fig.1 Location of the study area
使用2017年8月2日獲取的RapidEye衛(wèi)星影像。RapidEye影像幅寬77 km,空間分辨率為5 m,包括藍(440~510 nm)、綠(520~590 nm)、紅(630~685 nm)、紅邊(690~730 nm)、近紅外(760~850 nm)5個波段,其中紅邊波段是首顆商業(yè)衛(wèi)星提供的波段,可增加地物間的可分離度,提高農作物識別精度[13]。
結合Google Earth高清影像,在研究區(qū)內建立7個隨機分布的樣方,樣方大小為500 m×500 m。于2017年7月17—24日到實地開展地面調查,確定樣方各地塊種植的作物和覆蓋類型,樣方調查結果作為分類的解譯標志和精度驗證數(shù)據(jù)。
將獲取的RapidEye影像在ENVI5.5中進行大氣校正、正射校正、重投影、幾何精校正等預處理。計算影像的增強型植被指數(shù)(Enhanced Vegetation Index,EVI),通過波段組合,以增加影像波段屬性,提高地物可區(qū)分性[10]。
Softmax模型為Logistic回歸模型在多分類問題上的擴展,屬于監(jiān)督學習算法,需要提供訓練樣本和測試樣本以及相應的分類標簽。基本思路為[14]:對于m個樣本,為訓練集及其所對應的標簽為:{(x(1),y(1)),(x(2),y(2)),…,(x(m),y(m))},其中樣本x(i)定義為n+1維向量,y(i)∈{1,2,…,k},則樣本x(i)對應類別k的估計概率為:
式(2)中,1{y(i)=j}為示性函數(shù),當大括號中為真時,該函數(shù)結果為1,反之為0。
在ENVI5.5中使用Softmax分類器對研究區(qū)4種典型作物進行遙感識別與空間信息提取。選取RapidEye影像的第5,4,3波段,分別賦予紅、綠、藍3色進行假彩色合成,突出各類作物顯示效果,便于選取訓練區(qū)。根據(jù)地面調查,在研究區(qū)選取各地物的感興趣區(qū),包括綠肥、水稻、玉米、煙草等4種典型作物以及林地、水體、建筑物等地物。通過訓練樣本對Softmax分類器進行訓練,使繪制的損失曲線收斂到最小,利用訓練效果最優(yōu)的分類器進行分類,得到研究區(qū)的分類結果。Softmax分類技術流程見圖2。
圖2 Softmax分類技術流程Fig.2 Process of Softmax classification
評價基于Softmax分類器的4種典型作物分類精度,并與基于極大似然法的分類結果進行比較。
使用RapidEye影像的多作物分類結果見圖3,Softmax法的分類結果較極大似然法減少了“椒鹽噪聲”現(xiàn)象。根據(jù)地面樣方數(shù)據(jù)驗證,精度評價結果見表1。研究區(qū)內Softmax分類器對綠肥、水稻、玉米和煙草的分類總精度為85.98%,Kappa系數(shù)為0.815 7;較極大似然分類高4.59%和0.061 7,并減少了錯分、漏分像元。
圖3 兩種方法分類結果(部分區(qū)域)Fig.3 Results of two method(Part of the study area)
比較Softmax法4類作物的分類效果,綠肥、水稻、煙草的生產者精度和用戶精度均達到84%以上,玉米則低于75%。主要由于研究區(qū)內綠肥、水稻、煙草種植較為集中;而玉米種植地塊的面積小且在空間上極為分散。根據(jù)表1兩種方法的混淆矩陣結果可見,綠肥與煙草錯分問題較明顯。根據(jù)地面調查情況,認為綠肥與煙草易混淆主要原因包括兩方面:一方面研究區(qū)休耕地塊的肥力及管理差異大導致不同地塊綠肥長勢差異明顯,出現(xiàn)“同物異譜”;另一方面則是監(jiān)測期間的煙草處于采收季,部分采收后地塊植被情況與綠肥接近,出現(xiàn)“異物同譜”。
表1 兩種分類方法的混淆矩陣Table 1 Confusion matrix of two classification methods
通過遙感手段快速準確獲取休耕區(qū)內地塊種植情況,監(jiān)測結果對地塊休耕現(xiàn)狀判別具有重要作用。研究利用2017年8月2號獲取的RapidEye影像,采用淺層機器學習Softmax分類器在云南省石林縣部分休耕試點區(qū)開展夏季綠肥作物、水稻、玉米及煙草等4種典型作物的遙感分類,得出如下結論:(1)基于Softmax方法的4種典型作物分類的總體精度和Kappa系數(shù)分別為85.67%和0.811 6,極大似然為81.39%和0.754 0,Softmax方法分類精度略高于極大似然;(2)綠肥、水稻、煙草的生產者精度和用戶精度遠高于玉米,因研究區(qū)內地塊作物種植集中程度影響分類精度;(3)“同物異譜、異物同譜”現(xiàn)象導致綠肥與煙草錯分問題較明顯。
該文研究淺層機器學習分類器在云南休耕地區(qū)夏季多作物遙感分類效果,較常用的最大似然法,分類精度有所提高。使用高精度作物空間分布信息進一步與休耕地塊矢量數(shù)據(jù)結合,可去除非休耕監(jiān)測區(qū)臨近地物的影響,提高休耕地塊的判別精度,減少地塊休耕誤判以及外業(yè)核查工作量。隨著對農業(yè)精準監(jiān)測需求的增加,越來越多高時空分辨率的多光譜、高光譜遙感數(shù)據(jù)應用于農業(yè)監(jiān)測,數(shù)據(jù)量大、質量不統(tǒng)一等遙感大數(shù)據(jù)問題需通過整合系統(tǒng)、復雜的算法加以解決。淺層機器學習分類算法小樣本學習和過擬合等不足將影響其進一步應用。深度學習方法使用更大規(guī)模的訓練數(shù)據(jù)、構建更復雜的模型,能實現(xiàn)更多種類地物的精確識別與分類,降低過擬合的程度。因此,未來將根據(jù)我國遙感大數(shù)據(jù)發(fā)展,開展農作物遙感訓練數(shù)據(jù)集整理、深度學習模型研究等工作。