查東平, 蔡海生, 張學(xué)玲, 何慶港
(1.江西農(nóng)業(yè)大學(xué)/江西省鄱陽(yáng)湖流域農(nóng)業(yè)資源與生態(tài)重點(diǎn)實(shí)驗(yàn)室,南昌 330045; 2.江西旅游商貿(mào)職業(yè)學(xué)院,南昌 330100)
及時(shí)準(zhǔn)確地監(jiān)測(cè)和獲取水稻種植的空間分布范圍對(duì)保障全國(guó)糧食安全具有重要意義[1-2]。傳統(tǒng)的統(tǒng)計(jì)方法有抽樣調(diào)查和逐級(jí)上報(bào),這兩種方法獲取數(shù)據(jù)成本巨大,且存在很?chē)?yán)重的信息滯后[3]。遙感技術(shù)為大尺度農(nóng)作物種植范圍監(jiān)測(cè)和提取提供了有效的技術(shù)支撐[4-5]。目前多采用Landsat系列、MODIS或Sentinel-2等光學(xué)衛(wèi)星數(shù)據(jù)對(duì)農(nóng)作物信息進(jìn)行提取,這些數(shù)據(jù)免費(fèi)且易于獲取,相關(guān)學(xué)者基于此類(lèi)數(shù)據(jù)開(kāi)展了大量研究并取得了較好的成效[6]。Zhu等[7]利用Landsat系列數(shù)據(jù)對(duì)我國(guó)南方水稻產(chǎn)區(qū)的水稻種植面積進(jìn)行了監(jiān)測(cè),結(jié)果認(rèn)為2000—2019年水稻總種植面積減少了171 474 km2; Cao等[8]采用Landsat數(shù)據(jù)識(shí)別早稻、晚稻、雙季稻和中稻,總體精度在71.83%~85.81%之間; Li等[9]通過(guò)融合MODIS和Landsat數(shù)據(jù),采用隨機(jī)森林模型和決策樹(shù)對(duì)農(nóng)作物進(jìn)行提取,精度分別達(dá)到90%和89.7%。利用光學(xué)衛(wèi)星影像數(shù)據(jù)對(duì)水稻田的提取方法多要依靠多時(shí)相數(shù)據(jù),單時(shí)相數(shù)據(jù)提取的精度往往比較低,但是南方地區(qū)水稻生長(zhǎng)季節(jié)往往為多云雨天氣,光學(xué)數(shù)據(jù)質(zhì)量難以保障,影響了實(shí)際應(yīng)用成效[10-11]。
合成孔徑雷達(dá)(synthetic aperture Radar,SAR)不受天氣影響,可以全天時(shí)全天候?qū)Φ赜^測(cè),有效解決了光學(xué)數(shù)據(jù)獲取難的問(wèn)題[12-14]。基于SAR數(shù)據(jù)的水稻田分類(lèi)雖然還沒(méi)有大范圍業(yè)務(wù)化應(yīng)用,但是也開(kāi)展了大量的研究,如Son等[15]利用Sentinel-1 SAR數(shù)據(jù)進(jìn)行了水稻田提取,第一季和第二季水稻種植面積提取精度分別為84.2%和82.6%,用戶(hù)精度分別為82.1%和85.3%; Graman等[16]利用Sentinel-1數(shù)據(jù)對(duì)Rabi地區(qū)水稻田進(jìn)行提取,總體精度達(dá)到91.5%,Kappa系數(shù)為0.83。前人的研究證明了Sentinel-1數(shù)據(jù)VV(垂直)和VH(交叉)極化數(shù)據(jù)對(duì)提取水稻田的可行性。但是研究沒(méi)有從水稻不同物候期數(shù)據(jù)去進(jìn)行對(duì)比,篩選水稻田識(shí)別的最佳時(shí)相數(shù)據(jù)。目前成熟的,研究較多的分類(lèi)方法包括最大似然法、支持向量機(jī)等,基于機(jī)器學(xué)習(xí)算法的分類(lèi)方法應(yīng)用在SAR圖像水稻田提取的研究不多[17-18]。本研究擬通過(guò)分析不同物候期SAR數(shù)據(jù)水稻田與其他地類(lèi)之間的可分離性,篩選出水稻田識(shí)別最佳時(shí)相組合,采用隨機(jī)森林方法進(jìn)行分類(lèi),以期得到較高精度的分類(lèi)結(jié)果,為今后在水稻田識(shí)別和水稻生長(zhǎng)監(jiān)測(cè)中,因?yàn)樵朴晏鞖怆y以獲得連續(xù)高質(zhì)量的光學(xué)數(shù)據(jù)的情況下,采用SAR進(jìn)行水稻監(jiān)測(cè)提供方法上的參考。
研究區(qū)(圖1)位于江西省南昌市南昌縣北部、贛江下游蔣巷鎮(zhèn)。地處E115°65′,N28°32′。蔣巷鎮(zhèn)四面環(huán)水,東臨鄱陽(yáng)湖、南北傍贛江、西接南昌市城郊,贛江南、中支流環(huán)抱而過(guò)。全鎮(zhèn)國(guó)土總面積約為240 km2,南北寬約8 km,東西長(zhǎng)約45 km。受亞熱帶季風(fēng)氣候影響,研究區(qū)內(nèi)氣候溫暖濕潤(rùn),光照充足,主要種植作物為水稻,是南昌縣重要的水稻種植區(qū)。
圖1 研究區(qū)位置Fig.1 The location of research area
選取涵蓋2020年早稻整個(gè)物候期的8期Sentinel-1地距影像產(chǎn)品數(shù)據(jù)(https: //search.asf.alaska.edu/)。SAR過(guò)境時(shí)間分別對(duì)應(yīng)水稻生長(zhǎng)的出苗期(4月9日)、三葉期(4月21日)、移栽期(5月3日,直播稻為幼苗早期)、返青期(5月15日,直播稻為幼苗中期)、分蘗期(6月2日)、孕穗期(6月14日)、乳熟期(7月8日)、收割和二季晚稻移栽期(7月26日)。在ENVI SARscape 5.5軟件中對(duì)SAR數(shù)據(jù)進(jìn)行處理(圖2),包括讀取、多視處理、配準(zhǔn)和輻射定標(biāo)等操作,采用“Adaptive Non-Local SAR Fil-tering”方法進(jìn)行濾波處理,減少相干斑噪聲。
圖2 多時(shí)相Sentinel-1數(shù)據(jù)處理方法Fig.2 Multi-temporal Sentinel-1 data processing method
為獲取研究區(qū)的解譯樣本及對(duì)結(jié)果進(jìn)行驗(yàn)證分析,對(duì)研究區(qū)開(kāi)展了現(xiàn)場(chǎng)踏勘調(diào)查,獲得了研究區(qū)主要地物類(lèi)型分布,此外于2020年7月17日采用了大疆DJI Mavic 2無(wú)人機(jī)對(duì)研究區(qū)進(jìn)行了飛行錄像(無(wú)人機(jī)飛行軌跡如圖3所示)。為節(jié)約成本,無(wú)人機(jī)采用“抬頭”拍攝,飛行過(guò)程中調(diào)整拍攝角度,從受局限的俯視過(guò)程過(guò)渡到開(kāi)闊的視角,“抬頭”拍攝鏡頭前方可觀測(cè)距離超過(guò)1 km,視野范圍影像截圖如圖4所示。
圖3 無(wú)人機(jī)飛行軌跡圖Fig.3 Flight trajectory map of UAV
圖4 無(wú)人機(jī)錄像截圖Fig.4 Video screenshot of UAV
本文研究目的是提取水稻種植范圍,結(jié)合土地利用/覆被類(lèi)型特點(diǎn),參考鄧剛等[19]、張悅琦等[20]對(duì)水稻種植范圍提取輔助分類(lèi),依據(jù)多次野外調(diào)查結(jié)果,確定分類(lèi)系統(tǒng)包括: 水稻田、林地、水體、蓮田、人工表面和濕地等6種地類(lèi)。根據(jù)外業(yè)調(diào)查和無(wú)人機(jī)飛行錄像數(shù)據(jù),在同時(shí)相GF-1影像圖上勾繪地物標(biāo)志樣本。每類(lèi)地物人工勾繪采選200個(gè)樣本點(diǎn),選擇手工勾繪確保在影像圖上獲得純凈像元,便于后期分析。
在ArcGIS中對(duì)樣本點(diǎn)矢量數(shù)據(jù)進(jìn)行編號(hào),奇數(shù)序號(hào)樣本點(diǎn)導(dǎo)出并命名為訓(xùn)練樣本,偶數(shù)樣本點(diǎn)導(dǎo)出并命名為驗(yàn)證樣本,各地類(lèi)訓(xùn)練樣本點(diǎn)和驗(yàn)證樣本均100個(gè),并且大致均勻分布于研究區(qū)。訓(xùn)練樣本點(diǎn)和驗(yàn)證樣本點(diǎn)分布情況如圖5所示。
圖5 樣本點(diǎn)分布圖Fig.5 Sample points distribution map
SAR使用微波作為發(fā)射電磁波,電磁波照射到地物上,一部分能量通過(guò)反射進(jìn)入雷達(dá)接收天線,另外一部分能量則透過(guò)地物表面繼續(xù)向下[21]。雷達(dá)照射表面如果是粗糙地物發(fā)生散射,能量朝各個(gè)方向,如果是光滑表面則發(fā)生鏡面反射[22]。雷達(dá)接收天線接收的能量取決于雷達(dá)波長(zhǎng)、入射角和地面粗糙程度[21]。一般來(lái)說(shuō)長(zhǎng)波比短波具有更好的穿透性,對(duì)于探測(cè)冠層下墊面具有更好的效果。入射角越小后向散射回的能量越大,大角度的回波信息中包含了地物粗糙程度信息[21,23]。
通常,水面和光滑的地表可認(rèn)為光滑表面,電磁波照射后易發(fā)生鏡面反射,雷達(dá)天線接收不到或者只能接收少部分回波信號(hào),在SAR圖像上呈現(xiàn)黑色[24]。隨著入射角的變化,接收到的信號(hào)也會(huì)有所不同,當(dāng)入射角達(dá)到90°時(shí),反射信號(hào)直接進(jìn)入雷達(dá)天線,圖像上呈現(xiàn)明亮點(diǎn)[24]。不同極化數(shù)據(jù),水平極化和垂直極化反射和散射后到接收器上的能量不同,兩種方式的差別可以達(dá)到5 dB,同向極化(HH和VV)與交叉極化(HV和VH)的后向散射系數(shù)也不同,二者可相差10~15 dB[25]。除水體,大部分地物都可認(rèn)為是程度不相同的粗糙表面[16,25]。根據(jù)瑞利散射原則,地物散射特性跟地物表面和波長(zhǎng)有關(guān),地物的散射十分復(fù)雜。通常,粗糙表面的散射是一條平緩的曲線,曲線斜率變化與入射角相關(guān)性較小。農(nóng)作物在不同的物候期,表現(xiàn)出來(lái)的散射特性不同。SAR接收天線接收到的地物后向散射能量受地物特性影響,如植被的密度、植被的含水量、植被高度、下墊面類(lèi)型等。不同時(shí)相、作物處于不同的物候期,會(huì)產(chǎn)生不同的雷達(dá)回波,是雷達(dá)監(jiān)測(cè)及農(nóng)作物制圖的基礎(chǔ)。
本文隨機(jī)森林訓(xùn)練流程如圖6所示。隨機(jī)森林是一個(gè)包含多個(gè)決策樹(shù)的分類(lèi)器[26]。1995年貝爾實(shí)驗(yàn)室華裔美國(guó)人何天琴(Tin Kam Ho)提出了隨機(jī)決策森林(random decision forest),2001年Leo Breiman和Adele Cutler發(fā)展并推出隨機(jī)森林算法[27-28]。該算法通過(guò)構(gòu)建多個(gè)決策樹(shù)作為基本的分類(lèi)器,每個(gè)決策樹(shù)都是一個(gè)分類(lèi)器,本質(zhì)屬于機(jī)器學(xué)習(xí)[26]。隨機(jī)森林方法通過(guò)隨機(jī)方式從原始訓(xùn)練集中選擇K個(gè)訓(xùn)練集,對(duì)訓(xùn)練集構(gòu)建分類(lèi)決策樹(shù),集成多個(gè)分類(lèi)投票的結(jié)果,將投票次數(shù)最多的分類(lèi)作為最終地類(lèi)并輸出[26]。
圖6 隨機(jī)森林訓(xùn)練流程圖Fig.6 Random forest training process
本研究隨機(jī)森林分類(lèi)通過(guò)對(duì)開(kāi)源軟件ENMAP-BOX v2.1.1源碼封裝后在ENVI 5.5軟件中運(yùn)行。
2.3.1 水稻田散射特征分析
4月9日—7月26日水稻田的后向散射系數(shù)均值見(jiàn)表1,VV極化和VH極化后向散射系數(shù)變化趨勢(shì)見(jiàn)圖7。
表1 水稻田不同時(shí)相平均后向散射系數(shù)Tab.1 Average backscattering coefficient of paddy field in different time-phase (dB)
圖7 水稻田不同時(shí)相平均后向散射系數(shù)Fig.7 Average backscattering coefficient ofpaddy field in different time-phase
水稻屬于水生植物,大部分時(shí)間水稻根部被水體淹沒(méi),雷達(dá)波照射到水稻后大概可以分為3種散射過(guò)程:
1)水稻下墊面水體的鏡面反射,水稻生長(zhǎng)的早期,鏡面反射是主要的散射過(guò)程,因此早期階段水稻田的后向散射值較低。
2)水稻葉面的奇次散射,電磁波照射到水稻葉片后一部分電磁波發(fā)生奇次散射,直接進(jìn)入雷達(dá)接收天線。
3)水稻葉片和莖稈的體散射,主要表現(xiàn)在雷達(dá)波到達(dá)水面后,水面反射到水稻莖稈或者葉片發(fā)生的多次散射,雷達(dá)波到達(dá)葉片、葉片散射到其他莖稈葉片或者水面發(fā)生的散射。
研究區(qū)水稻為直播稻,但水稻種植時(shí)間略有不同,4月初部分地區(qū)水稻已播種,部分地區(qū)水田尚未耕種長(zhǎng)滿野草,野草葉面積指數(shù)要比水稻種植區(qū)高,其后向散射系數(shù)也更高。4月21日,水稻處于三葉期,但水稻葉面積指數(shù)仍小于野草,后向散射系數(shù)要低于4月9日。隨著水稻的生長(zhǎng),四月下旬三葉期水稻冠層本身散射和冠層散射逐漸增強(qiáng)。從極化情況來(lái)看,VV極化的穿透性要高于VH,其后向散射能量包含更多的植被冠層和植被下墊面的回波能量。4月下旬至5月中旬,隨著水稻的生長(zhǎng)VV極化數(shù)據(jù)呈現(xiàn)上升趨勢(shì),但是VH極化數(shù)據(jù)變化情況不大。根據(jù)地面數(shù)據(jù)采集情況,拔節(jié)、孕穗期之后水稻含水量逐漸下降,水稻的介電常數(shù)與含水量存在正相關(guān)性,結(jié)果受水稻的介電常數(shù)和降雨等情況的綜合影響。7月26日已種植第二季晚稻,種植方式為插播,正處于返青期,此時(shí)仍受水面鏡面反射主導(dǎo)。
2.3.2 其他地物散射特征分析
對(duì)蓮田、林地、人工表面、水體和濕地等樣本點(diǎn)在SAR時(shí)相序列后向散射數(shù)據(jù)中進(jìn)行取值計(jì)算,各地物VV極化后向散射系數(shù)均值結(jié)果如表2和圖8所示,地物散射系數(shù)箱型圖見(jiàn)圖9; 各地物VH極化后向散射系數(shù)均值如表3和圖10所示,箱型圖見(jiàn)圖11。從VV極化各地物后向散射系數(shù)均值來(lái)看,各地物后向散射系數(shù)在-21~-5 dB之間,其中水體最低,人工表面最高。從圖9可知,僅從VV極化數(shù)據(jù),水體、蓮田兩種地類(lèi)均具有較好的分離度,最佳區(qū)分的時(shí)相分別為5月15日、6月2日和6月14日。蓮田與其他地類(lèi)進(jìn)行區(qū)分,最佳區(qū)分時(shí)相為4月9日和5月3日。值得一提的是,隨著時(shí)間推移,蓮田的VV后向散射系數(shù)逐漸提升,在5月3日之前,蓮田的后向散射系數(shù)要低于水稻田、濕地等地類(lèi),6月14日之后,蓮田后向散射系數(shù)要高于這兩種地類(lèi),在6月26日甚至要高于林地的后向散射系數(shù)。林地的后向散射系數(shù)一直比較穩(wěn)定,而且標(biāo)準(zhǔn)差較小,各時(shí)相均能與水稻田和蓮田區(qū)分,與人工表面的最佳區(qū)分時(shí)相為4月21日,與蓮田在4月9日、4月21日、5月3日和7月26日數(shù)據(jù)中均能較好區(qū)分,與水稻田在4月21日、6月14日、7月8日和7月26日均能較好區(qū)分; 與濕地在7月8日和7月26日具有較好的分離度。水稻田在水稻生長(zhǎng)后期與其他地類(lèi)能夠較好區(qū)分,如6月14日、7月8日和7月26日。7月8日和7月26日濕地與人工表面、林地、蓮田和水稻田具有較好的分離度,但是這2期數(shù)據(jù)濕地VV極化后向散射系數(shù)與水體極為相似,但是其他幾個(gè)時(shí)相濕地可以與水體進(jìn)行分離。
表2 VV極化各地物不同時(shí)相后向散射系數(shù)Tab.2 Backscattering coefficients of VV polarized objects in different time-phase (dB)
圖8 VV極化各地物不同時(shí)相后向散射系數(shù)圖
圖9 不同時(shí)相數(shù)據(jù)地類(lèi)VV散射系數(shù)箱型圖Fig.9 Box diagram of VV scattering coefficient for different time-phase data表3 VH極化各地物不同時(shí)相后向散射系數(shù)Tab.3 Backscattering coefficients of VH polarized objects in different time-phase (dB)
圖10 VH極化各地物不同時(shí)相后向散射系數(shù)Fig.10 Backscattering coefficient diagrams of VH polarized objects in different time-phase
圖11-1 不同時(shí)相數(shù)據(jù)地類(lèi)VH散射系數(shù)箱型圖
圖11-2 不同時(shí)相數(shù)據(jù)地類(lèi)VH散射系數(shù)箱型圖
從VH極化各地物后向散射系數(shù)均值來(lái)看,各地物后向散射系數(shù)在-27~-14 dB之間,其中水體最低,林地和人工表面數(shù)值較為接近,且相對(duì)其他地類(lèi)后向散射系數(shù)值較高。
從圖11中可以看出,水體與其他地類(lèi)具有較好的分離度,除7月8日和7月26日與濕地較為相似,其他幾個(gè)時(shí)相數(shù)據(jù)均能較好分離。在VH極化數(shù)據(jù)中人工表面、林地的后向散射系數(shù)比較接近,難以分離。4月9日—5月3日數(shù)據(jù)蓮田與水稻田分離性較低,原因是該時(shí)間段,水稻和蓮都處于生長(zhǎng)初期,地物主要受到水體的鏡面反射影響,二者區(qū)分度不大,但是6月2日之后,蓮田與水稻田的后向散射系數(shù)值逐漸拉大, 7月8日和7月26日二者具有較好的區(qū)分度。從單時(shí)相數(shù)據(jù)來(lái)看,6月14日、7月8日和7月26日水稻田與其他地類(lèi)具有較好的區(qū)分度。
2.4.1 Jeffries-Matusita距離
Jeffries-Matusita距離(J-M) 通過(guò)計(jì)算地類(lèi)樣本之間的特征距離判斷地類(lèi)的可分離程度,是分類(lèi)過(guò)程中樣本可分離程度評(píng)價(jià)的常用指數(shù)[29]。采用J-M距離計(jì)算地類(lèi)之間的差異是一種具有通用性的定量方式,它不需要假定不同地物后向散射系數(shù)呈正態(tài)分布[29-30]。J-M距離計(jì)算結(jié)果值在0~2之間,值越大可分離性越好,若大于1.8則樣本可分離性非常好,在1.4~1.8之間樣本選擇合格,樣本可分離性小于1.4地類(lèi)之間可分離性較差,建議重新選擇樣本,可分離性小于1則建議將地類(lèi)樣本進(jìn)行合并[29-30]。
J-M距離j計(jì)算公式[29-30]為:
j=2(1-e-B),
(1)
式中B為某一特征維上的巴氏距離。
不同地類(lèi)所選取的樣本巴氏距離B計(jì)算公式[29-30]為:
(2)
2.4.2 時(shí)相優(yōu)選
為達(dá)到理想的分類(lèi)精度,同時(shí)盡可能少地選用數(shù)據(jù),降低數(shù)據(jù)獲取和處理成本[31],研究對(duì)時(shí)相數(shù)據(jù)進(jìn)行優(yōu)選分析,確定水稻田識(shí)別的最佳時(shí)相。統(tǒng)計(jì)了不同時(shí)相水稻田與其他地物的可分離性,結(jié)果如表4所示。從單時(shí)相上來(lái)看,除了4月9日和7月26日的濕地,5月15日和6月14日的水體,7月26日的蓮田具有可分離性外,其他時(shí)相水稻田與其他地物之間的J-M距離小于1.4,可分離性不佳,證明雙極化數(shù)據(jù)單時(shí)相在地類(lèi)分類(lèi)過(guò)程中存在一定的局限性。
表4 單時(shí)相數(shù)據(jù)水稻田與各地物J-M距離Tab.4 Single-phase data J-M value between paddy filed and other land types
4月9號(hào)水稻剛剛出苗,易與雜草相混淆,7月26號(hào)處于第二季水稻返青時(shí)期,第二季水稻與第一季水稻種植面積有所差異。為了探測(cè)第一季水稻的種植范圍,根據(jù)表4,從4月9日—7月8日第一季水稻生長(zhǎng)過(guò)程中的SAR影像數(shù)據(jù)可分離程度最高的時(shí)相為6月14日。通過(guò)在6月14日垂直極化數(shù)據(jù)的基礎(chǔ)上加上其他極化條件,每次加入的數(shù)據(jù)以J-M距離作為標(biāo)準(zhǔn)。表5給出了不同時(shí)相條件組合條件下水稻與其他地物的J-M距離。結(jié)果可以看出,增加時(shí)相數(shù)據(jù)均能增加地類(lèi)的可分離性。這表明采用多時(shí)相數(shù)據(jù)可有效提高地類(lèi)的分離度。
表5 多時(shí)相數(shù)據(jù)水稻田與各地物J-M距離Tab.5 Multi-temporal data J-M value between paddy field and other land types
從表5中可以看出,加入7月26日影像數(shù)據(jù)水稻田與蓮田可分離性最大達(dá)到1.675; 加入5月3日數(shù)據(jù)林地與水稻田可分離性最大,達(dá)到1.952; 加入4月21日數(shù)據(jù)人工表面與水稻田可分離性性最大,達(dá)到1.786; 加入7月26日數(shù)據(jù)水稻田與水體和濕地可分離性最大,分別達(dá)到1.954和1.998。
將4月21日、5月3日和7月26日數(shù)據(jù)與6月14日數(shù)據(jù)進(jìn)行疊加生成一個(gè)包含不同時(shí)相的數(shù)據(jù)文件,計(jì)算水稻田與其他地類(lèi)之間的J-M距離,結(jié)果如表6所示。
表6 水稻田與各地物J-M距離Tab.6 J-M value between paddyfield and other land types
采用以上數(shù)據(jù)進(jìn)行組合的SAR數(shù)據(jù)水稻田與其他地類(lèi)的可分離度均超過(guò)1.8,具有較好的分離度。研究區(qū)為實(shí)現(xiàn)各種地類(lèi)有效區(qū)分,可選擇6月14日、4月21日、5月3日和7月26日這4個(gè)時(shí)相數(shù)據(jù)。
2.4.3 水稻田識(shí)別精度評(píng)價(jià)
采用總體精度和F測(cè)度來(lái)分析和評(píng)價(jià)地物提取的精度,其中F測(cè)度包括準(zhǔn)確率、召回率和F指數(shù)3個(gè)指標(biāo),準(zhǔn)確率指在水稻田識(shí)別結(jié)果中水稻田被正確識(shí)別的比例,召回率指樣本中水稻田被正確識(shí)別的比例,F(xiàn)指數(shù)指準(zhǔn)確率P和召回率R的協(xié)調(diào)平均值[31],總體精度A是所有驗(yàn)證樣本中被正確識(shí)別的比例,計(jì)算公式為:
(3)
(4)
(5)
(6)
式中:TP為水稻田樣本被正確識(shí)別的個(gè)數(shù);FP為非水稻田樣本被識(shí)別為水稻田的個(gè)數(shù);FN為水稻田樣本被識(shí)別為非水稻田的個(gè)數(shù);TN為非水稻田樣本被正確識(shí)別的個(gè)數(shù)[31]。
時(shí)相優(yōu)選前,采用水稻生長(zhǎng)所有物候期影像數(shù)據(jù)進(jìn)行分類(lèi)。分類(lèi)方法包括隨機(jī)森林法、最大似然法、支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)法4種。
采用隨機(jī)森林方法對(duì)影像進(jìn)行分類(lèi),需要設(shè)置決策樹(shù)個(gè)數(shù)n和節(jié)點(diǎn)分裂過(guò)程中抽取的特征個(gè)數(shù)m。特征變量m抽取時(shí),默認(rèn)選擇總特征個(gè)數(shù)的算術(shù)平方根作為不同方案的特征個(gè)數(shù); 理論上,決策樹(shù)n的個(gè)數(shù)越多分類(lèi)精度越高,但時(shí)間成本也越高。有研究發(fā)現(xiàn),決策樹(shù)n≥100時(shí),所有方案的袋外(out of bag,OOB)誤差逐漸收斂并趨于穩(wěn)定[26,32]。因此選取n=100作為生成決策樹(shù)的數(shù)量。最大似然法核函數(shù)選擇徑向基核函數(shù)(radial basis function),懲罰參數(shù)設(shè)置100,其他參數(shù)默認(rèn); 最大似然法概率閾值設(shè)置單值(single value),其他參數(shù)默認(rèn); 神經(jīng)網(wǎng)絡(luò)法訓(xùn)練閾值貢獻(xiàn)0.9,訓(xùn)練率0.2,其他參數(shù)默認(rèn)。各種方法執(zhí)行分類(lèi)后在ENVI軟件中通過(guò)主要分析(majority)處理后導(dǎo)出,結(jié)果如圖12所示。
圖12 時(shí)相優(yōu)選前分類(lèi)結(jié)果
隨機(jī)森林、最大似然法和支持向量機(jī)對(duì)水稻田識(shí)別的總體精度分別為0.937,0.927和0.933,但最大似然法解譯的人工表面比實(shí)際情況偏大,驗(yàn)證樣本中3個(gè)水稻田樣本被錯(cuò)分為人工表面,2個(gè)樣本被錯(cuò)分為蓮田,支持向量機(jī)2個(gè)樣本被錯(cuò)分為人工表面,1個(gè)樣本被錯(cuò)分為林地和2個(gè)樣本被錯(cuò)分為蓮田。神經(jīng)網(wǎng)絡(luò)法分類(lèi)法被錯(cuò)分為蓮田的面積最大,其水稻田驗(yàn)證樣本中1個(gè)樣本被錯(cuò)分為人工表面,6個(gè)樣本被錯(cuò)分為蓮田。
精度驗(yàn)證結(jié)果如表7所示。隨機(jī)森林的準(zhǔn)確率、召回率、F指數(shù)和總體精度均為最高,而神經(jīng)網(wǎng)絡(luò)分類(lèi)結(jié)果各項(xiàng)指標(biāo)都要比其他3種方法差,從水稻田識(shí)別的初步結(jié)果來(lái)看,在時(shí)相優(yōu)選前,采用水稻生長(zhǎng)各物候期的影像進(jìn)行分類(lèi),隨機(jī)森林分類(lèi)方法所得到的結(jié)果總體最高,達(dá)到0.937。
表7 時(shí)相優(yōu)選前結(jié)果精度比較Tab.7 Accuracy comparison of classification resultsbefore time phase optimization
針對(duì)時(shí)相優(yōu)選結(jié)果,同時(shí)使用隨機(jī)森林、最大似然法、支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)4種分類(lèi)器進(jìn)行分類(lèi)并對(duì)比結(jié)果,解譯結(jié)果如圖13所示。解譯結(jié)果總體上與圖12保持一致。不過(guò)由于時(shí)相減少,優(yōu)選后的解譯結(jié)果有所變化。4種不同分類(lèi)器對(duì)水稻田識(shí)別的結(jié)果見(jiàn)表8,隨機(jī)森林、最大似然法和神經(jīng)網(wǎng)絡(luò)法解譯結(jié)果的總體精度比時(shí)相優(yōu)選前的結(jié)果均有所提高,說(shuō)明時(shí)相優(yōu)選后保留的影像數(shù)據(jù)在水稻田識(shí)別冗余信息減少。時(shí)相優(yōu)選后,準(zhǔn)確率最高的是神經(jīng)網(wǎng)絡(luò)法,達(dá)到0.936,隨機(jī)森林法略低,為0.913; 從召回率上來(lái)看最大似然法、支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)3種分類(lèi)器在時(shí)相優(yōu)選后均有提升,解譯結(jié)果的漏檢率減少,也說(shuō)明時(shí)相優(yōu)選后對(duì)水稻田識(shí)別有用的特征增多。從總體精度上來(lái)看,隨機(jī)森林方法進(jìn)行水稻田識(shí)別效果最佳,達(dá)到0.943,Kappa系數(shù)0.932。
圖13 時(shí)相優(yōu)選后分類(lèi)結(jié)果
表8 時(shí)相優(yōu)選后分類(lèi)結(jié)果精度比較Tab.8 Accuracy comparison of classificationresults after time phase optimization
本文采用多時(shí)相Sentinel -1數(shù)據(jù),多種分類(lèi)方法提取南昌縣蔣巷鎮(zhèn)水稻種植范圍,得到如下結(jié)論:
1)從J-M距離上來(lái)看,單時(shí)相Sentinel-1數(shù)據(jù)用于地物可分離度不高,水稻田容易與其他地類(lèi)相混淆。Sentinel-1的VV和VH雙極化單時(shí)相數(shù)據(jù)在不同的物候期,水稻田與其他地類(lèi)J-M距離無(wú)法全部達(dá)到1.4以上。
2)通過(guò)增加時(shí)相數(shù)據(jù)可以增加地物的可分離性,選擇最優(yōu)時(shí)相數(shù)據(jù)不但可以降低成本、提升效率,還能降低數(shù)據(jù)冗余、提升數(shù)據(jù)解譯精度。早稻物候期中采用三葉期、移栽期、孕穗期和二季晚稻移栽期SAR數(shù)據(jù)組合水稻田與蓮田、林地、人工表面和水體的J-M距離分別可達(dá)到1.832,1.979,1.890和1.975。解譯結(jié)果上來(lái)看,時(shí)相優(yōu)選后,解譯精度普遍得到了提升。
3)隨機(jī)森林法、最大似然法、支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)法在水稻田識(shí)別的潛力不同,其中無(wú)論是時(shí)相優(yōu)選前還是時(shí)相優(yōu)選后,隨機(jī)森林分類(lèi)方法的總體精度最高,時(shí)相優(yōu)選后采用隨機(jī)森林方法解譯總體精度達(dá)到0.943,Kappa系數(shù)為0.932。
本文對(duì)比研究了隨機(jī)森林、最大似然法、支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)方法對(duì)水稻田進(jìn)行提取,結(jié)果表明,隨機(jī)森林方法提取異質(zhì)性較強(qiáng)的水稻田具有較高的精度。但是在實(shí)際使用過(guò)程中不可避免地存在一些局限,如Sentinel-1 數(shù)據(jù)處理后的空間分辨率為20 m,在小尺度上可能難以滿足應(yīng)用需求,因此后續(xù)如果需要提取更加精細(xì)的地類(lèi)分布范圍,可以考慮將SAR數(shù)據(jù)與高空間分辨率數(shù)據(jù)進(jìn)行融合再對(duì)數(shù)據(jù)進(jìn)行提取。