解文歡,張有智,吳 黎,張海峰,張 宇,張效霏
(黑龍江省農(nóng)業(yè)科學(xué)院 農(nóng)業(yè)遙感與信息研究所,150086,黑龍江哈爾濱)
高分衛(wèi)星數(shù)據(jù)是國家的戰(zhàn)略資源,其應(yīng)用已深入到國家經(jīng)濟和社會發(fā)展、生態(tài)建設(shè)、民生保障、國家安全等方面。在農(nóng)業(yè)農(nóng)村領(lǐng)域,高分衛(wèi)星數(shù)據(jù)得到了廣泛應(yīng)用,通過有效監(jiān)測農(nóng)業(yè)生產(chǎn)情況,科學(xué)預(yù)測作物長勢、面積、產(chǎn)量等情況,對農(nóng)業(yè)生產(chǎn)災(zāi)害能做到快速反應(yīng)和評估,為客觀掌握宏觀農(nóng)業(yè)生產(chǎn)形勢、制定和實施精準(zhǔn)的政策措施等提供了高效的技術(shù)手段。
趙璐等以館陶縣為研究區(qū),基于國產(chǎn)高分二號衛(wèi)星影像數(shù)據(jù),采用面向?qū)ο蟮淖罱彿椒ㄌ崛⊙芯繀^(qū)農(nóng)業(yè)大棚信息,提取精度為95.65%[1]。張彥等利用GF-6 WFV數(shù)據(jù)構(gòu)建溫度植被干旱指數(shù),最大相關(guān)系數(shù)為0.85,花生干旱等級監(jiān)測總體準(zhǔn)確率為91.98%[2]。郭燕等利用高分一號衛(wèi)星數(shù)據(jù),結(jié)合Landsat-8 和RapidEye 數(shù)據(jù),對比支持向量機法和光譜角法提取鄢陵縣玉米面積,支持向量機法的分類精度優(yōu)于光譜角法的分類精度[3]。葛皓使用國產(chǎn)高分一號衛(wèi)星WFV 影像提取了江蘇省鹽城市東臺市條子泥條北水稻墾區(qū)的紅、綠、藍及近紅外波段的反射率,比較了22 個常用植被指數(shù)診斷大田水稻氮素營養(yǎng)水平的能力與估產(chǎn)的能力[4]。王婷等基于GF-1 WFV 衛(wèi)星遙感數(shù)據(jù),應(yīng)用歸一化植被指數(shù),對盤錦2020 年水稻長勢進行多時相動態(tài)遙感監(jiān)測,結(jié)果顯示:2020 年盤錦水稻長勢前期較好,中期變差,后期恢復(fù)[5]。
GF-6 衛(wèi)星具有高分辨率、寬覆蓋、多波段、高質(zhì)量和高效率成像等特點,為作物識別提供更豐富的信息。GF-6 衛(wèi)星遙感數(shù)據(jù)的使用,擴大了遙感監(jiān)測范圍,提高了遙感監(jiān)測頻率,提升了遙感識別精度,降低了農(nóng)業(yè)資源調(diào)查成本。由于GF-6 衛(wèi)星可獲取紅邊波段,打破了RapidEye 衛(wèi)星對于紅邊波段遙感影像的壟斷,在農(nóng)作物面積監(jiān)測中將替代50%的國外衛(wèi)星數(shù)據(jù)(Landsat8_OLI),提高了國產(chǎn)衛(wèi)星影像應(yīng)用能力。GF-6 衛(wèi)星的發(fā)射成功標(biāo)志著我國農(nóng)業(yè)遙感的研究工作開啟了以GF-6 衛(wèi)星數(shù)據(jù)為主要數(shù)據(jù)源的新局面。本文以拜泉縣為研究區(qū)域,基于GF-6 WFV 遙感數(shù)據(jù),采用隨機森林算法對研究區(qū)的玉米、大豆和水稻進行分類,通過實地采集GPS 地面驗證點進行分類精度評價,探究采用隨機森林算法對GF-6 WFV 影像提取農(nóng)作物種植結(jié)構(gòu)精度,為農(nóng)作物面積和種植結(jié)構(gòu)提取提供數(shù)據(jù)參考。
拜泉縣位于黑龍江省中西部地區(qū),地處小興安嶺余脈與松嫩平原過渡地帶,東經(jīng)125.5°~126.5°,北緯47.3°~47.9°,面積為3 599 km2,地勢呈東高西低、南高北低,由東向西逐漸平緩,地理位置如圖1 所示。地形漫川漫崗,丘陵起伏,溝谷切割強烈。研究區(qū)屬于溫帶大陸性氣候區(qū),年均氣溫在1.2 ℃,無霜期為122 d,年平均降水量為490 mm,降水多集中在夏季。研究區(qū)的土壤類型主要為黑土、黑鈣土和草甸土,土質(zhì)肥沃,有利于農(nóng)作物生長,主要農(nóng)作物類型為玉米和大豆,其他為馬鈴薯、中草藥和蕓豆等。
圖1 拜泉縣地理位置示意圖
1.2.1 遙感數(shù)據(jù)及預(yù)處理
本研究選用2020 年8 月26 日的GF-6 WFV 數(shù)據(jù)為數(shù)據(jù)源。GF-6 WFV 衛(wèi)星2018 年6 月2 日發(fā)射成功,具有窄幅(PMS)和寬幅(WFV)2 種不同空間分辨率,GF-6 WFV 數(shù)據(jù)分辨率為16 m,衛(wèi)星波段信息包括藍(0.45~0.52 μm)、綠(0.52~0.59 μm)、紅(0.63~0.69 μm)、近紅外(0.77~0.89 μm)、紅邊1(0.69~0.73 μm)、紅邊2(0.73~0.77 μm)、紫邊(0.40~0.45 μm)、黃邊(0.59~0.63 μm)8 個波段[6]。GF-6 WFV 衛(wèi)星與GF-1 衛(wèi)星組網(wǎng)運行,GF-6 WFV 影像與GF-1 WFV影像預(yù)處理流程相似,在ENVI5.3 中對獲取的GF-6 WFV 衛(wèi)星數(shù)據(jù)進行輻射定標(biāo)、大氣校正和幾何精校正等預(yù)處理工作[7]。
1.2.2 解譯標(biāo)志點和驗證點獲取
2020 年7 月5—7 日進行野外調(diào)查,使用手持GPS 野外實地采集解譯標(biāo)志點200 個和驗證點120個,涉及玉米、水稻、大豆和蔬菜等同一時期農(nóng)作物。
1.3.1 農(nóng)作物生長發(fā)育時期
農(nóng)作物類型判讀的最佳時相要選擇農(nóng)作物生長茂盛、影像反映明顯的時期。根據(jù)研究區(qū)內(nèi)各農(nóng)作物的生長發(fā)育時間(如表1 所示),確定各類農(nóng)作物的最佳識別期,對影像進行判讀。因此選擇8 月26 日農(nóng)作物處于生長旺盛期(玉米的乳熟期、大豆的結(jié)莢期、水稻的抽穗期)的影像進行農(nóng)作物識別,如圖2 所示。
表1 拜泉縣主要作物的發(fā)育期
圖2 8 月26 日GF-6 WFV 衛(wèi)星影像圖
1.3.2 分類方法
采用單模型分類方法的模型往往精度不高,容易出現(xiàn)過擬合問題,隨機森林算法是為了解決單個決策樹模型過擬合問題而提出的算法。隨機森林算法由BREIMAN L[8]提出,他通過bootstrap 重抽樣技術(shù),從原始訓(xùn)練樣本集N 中有放回地重復(fù)隨機抽取k 個樣本生成新的訓(xùn)練樣本集合,然后對每個bootstrap 樣本進行決策樹建模,把分類樹組合成隨機森林,在變量(列)的使用和數(shù)據(jù)(行)的使用上進行隨機化,生成很多分類樹,然后組合成多棵決策樹進行預(yù)測,再匯總分類樹的結(jié)果。
(1)每棵決策樹由樣本量為K 的訓(xùn)練樣本X 和隨機向量θk生成。
(2)隨機向量序列{θk,k=1,2,…,K}獨立同分布。
(3)隨機森林即所有決策樹的集合{h (X,θk),k=1,2,…,K }
(4)每個決策樹模型h(X,θk)都有一票投票權(quán)來選擇輸入變量x 的分類結(jié)果。
式中:H(x)表示隨機森林分類結(jié)果;hi(x)是單個決策樹分類結(jié)果;Y 表示分類目標(biāo);I(.)為示性函數(shù)。RF分類模型使用簡單的投票策略來完成最終的分類。
隨機森林算法的優(yōu)點是:具有極高的準(zhǔn)確率;隨機性的引入,使得隨機森林不容易過擬合,有很好的抗噪聲能力;能處理很高維度的數(shù)據(jù),并且不用做特征選擇;既能處理離散型數(shù)據(jù),又能處理連續(xù)型數(shù)據(jù),數(shù)據(jù)集無需規(guī)范化;訓(xùn)練速度快,可以得到變量重要性排序,容易實現(xiàn)并行化。隨機森林算法在運算量沒有顯著提高的前提下提高了預(yù)測精度。
在ENVI5.3 軟件中,基于GF-6 WFV 遙感數(shù)據(jù),利用GPS 采集的解譯標(biāo)志點建立訓(xùn)練樣本,在隨機森林樹設(shè)為100 的情況下進行隨機森林分類,提取大豆、水稻和玉米的種植結(jié)構(gòu)并計算面積(如圖3 所示)。分類結(jié)果數(shù)據(jù)與GPS 采集的120 個地面驗證點進行精度驗證,kappa 系數(shù)為0.893 72,總分類精度達92.5%。2020 年拜泉縣種植水稻0.796 萬hm2,玉米7.839 萬hm2,大豆17.122 萬hm2。
圖3 2020 年基于GF-6WFV 影像的拜泉縣主要農(nóng)作物種植結(jié)構(gòu)圖
本文基于GF-6 WFV 遙感數(shù)據(jù)利用隨機森林算法對拜泉縣主要農(nóng)作物玉米、大豆和水稻種植結(jié)構(gòu)進行提取研究。采用隨機森林算法,隨機森林樹為100 的情況下進行分類,總體分類精度達到了92.5%。采用隨機森林算法對GF-6 WFV 衛(wèi)星數(shù)據(jù)進行識別分類,能夠準(zhǔn)確提取農(nóng)作物空間分布,實現(xiàn)對農(nóng)作物種植范圍的更新與變化范圍的監(jiān)測,能夠極大降低人工目視解譯的工作量,提高更新效率。研究過程中也存在一些問題,本研究僅從光譜特征角度進行了分類,后續(xù)研究中可以根據(jù)不同波段和紋理特征的結(jié)合,分析對農(nóng)作物識別精度的影響,將波段和紋理特征結(jié)合,以提高對農(nóng)作物的識別精度。GF-6 WFV 衛(wèi)星數(shù)據(jù)已成為農(nóng)業(yè)遙感業(yè)務(wù)運行系統(tǒng)的主要數(shù)據(jù)源之一,在農(nóng)業(yè)生產(chǎn)和管理中得到了規(guī)?;瘧?yīng)用,為各農(nóng)業(yè)部門提供了科學(xué)客觀的信息支持。