王 镕,趙紅莉,蔣云鐘,何 毅,段 浩
(1.中國(guó)水利水電科學(xué)研究院,北京 100038;2.蘭州交通大學(xué)測(cè)繪與地理信息學(xué)院,蘭州 730070)
農(nóng)作物種植結(jié)構(gòu)反映了人類(lèi)農(nóng)業(yè)生產(chǎn)在空間范圍內(nèi)利用農(nóng)業(yè)生產(chǎn)資源的狀況[1],是農(nóng)作物種類(lèi)、數(shù)量結(jié)構(gòu)和空間分布特征等的信息組合,也是農(nóng)業(yè)科學(xué)灌溉的基礎(chǔ)。目前基于遙感的農(nóng)作物種植結(jié)構(gòu)提取多采用影像的光譜特征與紋理特征,光譜特征一般用于中低分辨率數(shù)據(jù),如TM,SPOT,HJ等或NOAA,MODIS等[2]。中低分辨率的遙感數(shù)據(jù)獲取來(lái)源較多,且影像覆蓋范圍廣,但是一般適合大面積單一作物的識(shí)別[3]。針對(duì)復(fù)雜的地物類(lèi)型,僅光譜特征難以準(zhǔn)確的區(qū)分各類(lèi)作物,最終影響其分類(lèi)精度。如部分研究利用Landsat8[4],HJ-1A/B[5],MODIS-EVI[6]影像光譜信息構(gòu)建小麥、水稻等作物的長(zhǎng)時(shí)間序列變化特征,并提取相應(yīng)地物的空間分布信息,精度可達(dá)到85%以上;而紋理特征一般用于高分辨率的遙感影像識(shí)別過(guò)程,如QuickBird,SPOT[7],SAR,SuperView-1等。高分辨率影像擁有豐富的紋理、色調(diào)、形狀和幾何結(jié)構(gòu)等特征信息,地物內(nèi)部細(xì)節(jié)信息明顯,邊緣突出,具有較高的分辨精度與目標(biāo)識(shí)別可靠性。如研究人員利用灰度共生矩陣[8]計(jì)算QuickBird,SPOT,SAR[9]等影像的紋理特征,實(shí)現(xiàn)植被類(lèi)型的分布并實(shí)現(xiàn)長(zhǎng)期的監(jiān)測(cè),精度均在90%以上。但是由于重訪周期長(zhǎng)、獲取最佳時(shí)相困難、且價(jià)格高昂等缺點(diǎn),難以滿足農(nóng)作物動(dòng)態(tài)管理監(jiān)測(cè)的需求。中高分辨率高分一號(hào)(GF-1)作為我國(guó)自主研發(fā)的衛(wèi)星,因其重訪周期短,分辨率高等特點(diǎn),自發(fā)射以來(lái),已開(kāi)始應(yīng)用于我國(guó)林業(yè)、農(nóng)業(yè)、自然災(zāi)害、土地利用、定量化應(yīng)用等眾多領(lǐng)域。如黃健熙等[10]利用大豆等作物的最佳生長(zhǎng)期與影像光譜信息的之間的變化規(guī)律實(shí)現(xiàn)了集中作物的分類(lèi),精度最高達(dá)到85%;王利民等[11]從不同的分類(lèi)方法入手實(shí)現(xiàn)冬小麥等大面積作物的提取,進(jìn)而對(duì)比面向?qū)ο?、決策樹(shù)等分類(lèi)方法的提取精度[12]。同時(shí),也有部分研究通過(guò)多種衛(wèi)星影像數(shù)據(jù)的對(duì)比,從而分析GF-1在分類(lèi)中的優(yōu)勢(shì)。如歐陽(yáng)玲[13]等等利用Landsat8,HJ-1A/B與GF-1數(shù)據(jù),采用農(nóng)作物遙感反演方法實(shí)現(xiàn)地物空間分布信息的提取,并基于影像的時(shí)效性與分類(lèi)精度等多個(gè)方面分析GF-1影像的優(yōu)勢(shì),最終推廣國(guó)產(chǎn)衛(wèi)星的應(yīng)用范圍[14]。
經(jīng)過(guò)對(duì)文獻(xiàn)的閱讀與整理可知,目前針對(duì)GF-1分類(lèi)研究大多基于影像的光譜特征[15],卻忽略了GF-1自身所表現(xiàn)出來(lái)的紋理特征。針對(duì)大面積單一作物,利用光譜特征的分類(lèi)識(shí)別精度要優(yōu)于中低分辨率影像,但是在作物相對(duì)復(fù)雜的區(qū)域,僅光譜特征難以表征各類(lèi)別之間的差異,進(jìn)而導(dǎo)致分類(lèi)過(guò)程中出現(xiàn)大量的誤差[16]?;诖?,本文以河北省石津灌區(qū)主要作物冬小麥、棉花和玉米為例,利用國(guó)產(chǎn)衛(wèi)星GF-1的光學(xué)遙感數(shù)據(jù)產(chǎn)品以及現(xiàn)場(chǎng)調(diào)查和實(shí)測(cè)數(shù)據(jù),提取各類(lèi)作物在影像中的紋理特征;并采用隨機(jī)森林分類(lèi)算法對(duì)研究區(qū)種植結(jié)構(gòu)進(jìn)行識(shí)別分類(lèi),最終驗(yàn)證GF-1WFV紋理特征在農(nóng)作物提取中的應(yīng)用。
石津灌區(qū)位于河北省中南部[16],是一座大型灌區(qū),為我國(guó)的糧食產(chǎn)量提供了大量的支持。種植作物以冬小麥、玉米為主,還有少量的蔬菜、果樹(shù)和棉花。本文以石津灌區(qū)為中心區(qū)域,研究其周邊包括石家莊、衡水、邢臺(tái)、保定、滄州5個(gè)市的22個(gè)縣(市、區(qū)),具體如圖1所示,圖1為研究區(qū)位置及GF-1 2019年5月份標(biāo)準(zhǔn)假彩色合成影像。
圖1 研究區(qū)位置示意圖Fig.1 The location of research area and the spectral characteristics of sample
1)試驗(yàn)設(shè)計(jì)。利用光譜信息識(shí)別農(nóng)作物,需要依賴(lài)作物的最佳窗口期,無(wú)法實(shí)現(xiàn)農(nóng)作物的動(dòng)態(tài)監(jiān)測(cè)。為實(shí)現(xiàn)不依賴(lài)作物最佳窗口期的前提下動(dòng)態(tài)獲取農(nóng)作物的變化特征,本文以2019年GF-1WFV多期影像為主,提出利用紋理特征以及光譜輔助紋理等兩組實(shí)驗(yàn)提取農(nóng)作物,通過(guò)對(duì)比農(nóng)作物空間分布信息與精度評(píng)價(jià)結(jié)果,分析紋理特征在農(nóng)作物種植結(jié)構(gòu)識(shí)別中的能力。
2)遙感數(shù)據(jù)。GF-1搭載了4臺(tái)WFV相機(jī),幅寬可達(dá)到800 km,重訪周期為4 d,空間分辨率可達(dá)到16 m。根據(jù)對(duì)冬小麥[17]、夏玉米、棉花等作物的生長(zhǎng)物候期分析以及本文對(duì)紋理特征在農(nóng)作物識(shí)別效應(yīng)的分析需求,選取2019年4月—2019年9月共計(jì)14景 GF-1WFV作物混雜程度不同的影像數(shù)據(jù),實(shí)現(xiàn)了研究區(qū)內(nèi)6期的全覆蓋。對(duì)影像進(jìn)行了輻射校正、大氣校正、正射校正以及圖像拼接裁剪等預(yù)處理。
3)實(shí)測(cè)樣本庫(kù)構(gòu)建。冬小麥的生長(zhǎng)期為每年的10月份—次年的6月份[18];蔬菜主要分為春蔬和秋蔬,分別在4—8月、9—11月;棉花是4—10月;夏玉米為6—10月;經(jīng)濟(jì)園林為3—11月;為保證樣本選取的代表性和隨機(jī)性[19],制作研究區(qū)10 km×10 km的規(guī)則格網(wǎng),獲取每個(gè)格網(wǎng)內(nèi)的樣方點(diǎn)(不少于3個(gè))。最后根據(jù)上述要求對(duì)各個(gè)格網(wǎng)進(jìn)行外業(yè)調(diào)查定位。之后利用ArcGIS等相關(guān)專(zhuān)業(yè)軟件構(gòu)建各類(lèi)農(nóng)作物的樣本庫(kù),為后期作物分類(lèi)提供有效的參考。經(jīng)過(guò)大量的實(shí)測(cè)采樣,最終獲取樣方位置283個(gè),其中訓(xùn)練189個(gè),驗(yàn)證94個(gè),具體如圖2所示。
圖2 研究區(qū)樣本點(diǎn)分布示意圖Fig.2 Location of sampling points in study area
紋理特征[20]是遙感解譯的一個(gè)重要判讀標(biāo)志,可以反映影像的色調(diào)變化頻率、清晰度等等以及地物的空間分布等重要信息,因而在農(nóng)作物較為復(fù)雜的區(qū)域內(nèi),紋理可以提供更多有效的信息[21]。紋理分析統(tǒng)計(jì)最常用的方法是灰度共生矩陣(GLCM)[22],通過(guò)計(jì)算在一定距離的兩個(gè)像素點(diǎn)之間灰度相關(guān)系數(shù)來(lái)表示灰度重復(fù)出現(xiàn)的概率分布[23]。設(shè)像素灰度值為i和j,記作(i,j);d表示距離像素點(diǎn)的距離;兩像素連線向量的角度即為θ,通常取0°,45°,90°和135°;共生矩陣P(i,j)則表示在距離和方向確定的情況下出現(xiàn)相同像素對(duì)的頻率[24]。具體計(jì)算公式為:
P(i,j)=[p(i,j,d,θ)],
(2)
GLCM通過(guò)兩點(diǎn)之間的相關(guān)性表達(dá)了影像灰度在方向、間隔和變化幅度上的空間信息[25],但是在進(jìn)行紋理分析時(shí),還不能直接作為特征變量用于區(qū)別不同地物,需要通過(guò)在此基礎(chǔ)上計(jì)算紋理特征量。常用的特征量一般有8種[26],通過(guò)不同角度刻畫(huà)不同的空間紋理信息。具體如表1。表中,i,j為以影像左上角為坐標(biāo)原點(diǎn)的各個(gè)像元的行列號(hào);p(i,j)為像元的灰度值;μ是p(i,j)的均值;n為像元行列號(hào)差值的絕對(duì)值;L為影像的行或列的總數(shù)。其中考慮到窗口大小、距離d以及方向θ等對(duì)GLCM計(jì)算的影響,通過(guò)多組窗口的提取試驗(yàn),并結(jié)合文獻(xiàn)中關(guān)于紋理計(jì)算的研究,本文將移動(dòng)窗口確定為5×5,同時(shí)默認(rèn)θ=0,d=1對(duì)紋理進(jìn)行計(jì)算。
表1 紋理特征量Tab.1 Texture feature
針對(duì)遙感影像的農(nóng)作物種植結(jié)構(gòu)識(shí)別,較為常用的方法有決策樹(shù)、面向?qū)ο?、神?jīng)網(wǎng)絡(luò)、隨機(jī)森林等[27]。如大量研究基于決策樹(shù)實(shí)現(xiàn)研究區(qū)內(nèi)的作物分布統(tǒng)計(jì),但是該分類(lèi)方法完全依賴(lài)人工操作,且需要操作人員具有較強(qiáng)的專(zhuān)業(yè)知識(shí)以及大量的經(jīng)驗(yàn)積累;還有部分研究基于面向?qū)ο髮?shí)現(xiàn)土地利用六大類(lèi)的提取,結(jié)果表明面向?qū)ο蠓椒ㄍㄟ^(guò)合適的分割尺度可以減少分類(lèi)中的破碎斑塊現(xiàn)象,但是無(wú)法實(shí)現(xiàn)自動(dòng)化,后期需要大量的人為操作;神經(jīng)網(wǎng)絡(luò)方法也常常用于影像的分類(lèi)過(guò)程,該方法對(duì)專(zhuān)業(yè)性的要求不高,但是泛化性較差[28];而隨機(jī)森林是一個(gè)較為完善的分類(lèi)方法,由于參數(shù)較少、方法簡(jiǎn)單而被廣泛使用。其本質(zhì)上是對(duì)決策樹(shù)的改進(jìn)以達(dá)到分類(lèi)精度提高的目的,是通過(guò)集成學(xué)習(xí)的思想將多棵CART決策樹(shù)集成的機(jī)器學(xué)習(xí)方法,減少了大量的人為干預(yù);同時(shí)該方法也實(shí)現(xiàn)了樣本與特征兩者的隨機(jī)性,從而避免了訓(xùn)練的過(guò)擬合現(xiàn)象,增強(qiáng)了方法的泛化能力[29]。利用隨機(jī)森林方法可以有效的克服傳統(tǒng)方法在分類(lèi)中不足,具有較高的精確度。
在不考慮農(nóng)作物時(shí)間序列最佳窗口期的影響,檢驗(yàn)每期影像獨(dú)立提取種植結(jié)構(gòu)的精度,從而驗(yàn)證GF-1紋理特征在各期數(shù)據(jù)中的識(shí)別能力。首先利用紋理特征對(duì)2019年4—9月的6期影像進(jìn)行分類(lèi),獲取研究區(qū)內(nèi)的農(nóng)作物種植結(jié)構(gòu),分類(lèi)結(jié)果統(tǒng)計(jì)如表2。
表2 紋理特征分類(lèi)結(jié)果統(tǒng)計(jì)Tab.2 The statistic of texture (km2)
各時(shí)相內(nèi)的作物面積變化幅度均在2%~35%以內(nèi),如冬小麥在2期面積變化為12%,棉花6期相差3%~35%;夏玉米3期面積相差3%~15%;蔬菜5期面積相差3%~21%;經(jīng)濟(jì)園林6期面積變化范圍在2%~10%。與實(shí)際調(diào)查的作物面積統(tǒng)計(jì)數(shù)據(jù)相對(duì)保持一致,表明紋理可以為影像分類(lèi)提供有效的信息,具有一定的應(yīng)用價(jià)值。
利用紋理特征的分類(lèi)結(jié)果具體如圖3所示??梢园l(fā)現(xiàn),冬小麥、夏玉米種植較為集中,地塊相對(duì)完整,主要集中在東部和南部,兩者的空間分布基本一致;北部和西部經(jīng)濟(jì)園林面積相對(duì)較大;蔬菜等主要分布在城區(qū)周邊;棉花主要分布在東北部,基本符合實(shí)際的種植情況。六期數(shù)據(jù)中4月和8月2個(gè)月的分類(lèi)結(jié)果較好,而其他月份隨著作物類(lèi)別增加與作物生長(zhǎng)特征不明顯等原因,大大增加了遙感分類(lèi)的難度。如標(biāo)注內(nèi)5月份林地和冬小麥大面積混淆,7月份易混淆的是林地和蔬菜;這也是由于兩月份內(nèi)幾者的生長(zhǎng)狀態(tài)相似,紋理特征差異較??;6月份影像有大片云層干擾,忽略云層影響,棉花和蔬菜出現(xiàn)大量的錯(cuò)分,這是由于棉花和蔬菜較為分散,且六月份均處于苗期,16 m的分辨率很難表達(dá)兩者的差異;而9月份的分類(lèi)結(jié)果破碎斑塊明顯增加,夏玉米等作物錯(cuò)分現(xiàn)象明顯。這4個(gè)月的結(jié)果也表明了單獨(dú)紋理特征無(wú)法滿足各個(gè)時(shí)相的分類(lèi)需求。
(a)4月 (b)5月 (c)6月
根據(jù)上述的結(jié)論分析,可以得知基于紋理的分類(lèi)結(jié)果在5月、6月、7月、9月等月份存在大量的錯(cuò)分誤分現(xiàn)象。考慮到植被指數(shù)作物的分布及生長(zhǎng)狀態(tài)呈線性關(guān)系,是作物生長(zhǎng)狀態(tài)監(jiān)測(cè)的最佳指標(biāo)。在紋理特征相對(duì)較弱的時(shí)相內(nèi)引入植被指數(shù),最終確定適合不同月份的最佳分類(lèi)特征。將光譜與紋理組合后的結(jié)果與訓(xùn)練樣本作為隨機(jī)森林分類(lèi)器的輸入,利用隨機(jī)森林的回歸分析并訓(xùn)練分類(lèi)模型,獲取組合后的分類(lèi)結(jié)果面積統(tǒng)計(jì)如表3所示,各類(lèi)作物的面積統(tǒng)計(jì)與年鑒統(tǒng)計(jì)調(diào)查結(jié)果高度一致。與單一的紋理特征相比,各類(lèi)作物面積變化幅度相對(duì)較小,均保持在150 km2以內(nèi)。根據(jù)實(shí)測(cè)樣本對(duì)2種分類(lèi)結(jié)果進(jìn)行精度評(píng)價(jià),結(jié)果如表4所示。綜合6期分類(lèi)結(jié)果數(shù)據(jù),單獨(dú)紋理特征分類(lèi)結(jié)果總體精度最高可達(dá)到為92.95%,Kappa系數(shù)為0.91;將紋理與光譜組合之后的總體分類(lèi)精度最高可以達(dá)到95.22%,對(duì)應(yīng)的Kappa系數(shù)為0.93。組合后6期的分類(lèi)精度均在80%以上,分類(lèi)結(jié)果較為理想;而單獨(dú)紋理特征在不同時(shí)期出現(xiàn)了低值;如9月份的紋理特征信息較弱,大面積的林地減少,蔬菜等也出現(xiàn)了不同程度的破碎斑塊。總體而言,兩者組合后,分類(lèi)特征增加,使得誤分或錯(cuò)分的像元有所減少;與單獨(dú)紋理特征的分類(lèi)精度相比,提高6%~10%。更加驗(yàn)證了多特征組合的分類(lèi)結(jié)果要優(yōu)于單獨(dú)紋理的分類(lèi)結(jié)果。
表3 組合后分類(lèi)結(jié)果統(tǒng)計(jì)Tab.3 The statistic of combination (km2)
表4 分類(lèi)精度評(píng)價(jià)表Tab.4 Classification accuracy evaluation
在紋理的基礎(chǔ)上引入植被指數(shù)生成研究區(qū)的主要農(nóng)作物分布圖(圖4)。通過(guò)圖中標(biāo)注的區(qū)域與單獨(dú)紋理分類(lèi)結(jié)果中對(duì)應(yīng)位置的對(duì)比,5月、6月、7月和9月的分類(lèi)結(jié)果中各類(lèi)別的錯(cuò)分和誤分像元明顯減少,而4月、8月份兩組實(shí)驗(yàn)的結(jié)果相對(duì)一致,表明了光譜的引入大大提高了5月、6月、7月、9月份的分類(lèi)精度;尤其是9月份效果更加明顯,破碎斑塊明顯減少。
圖4 兩組實(shí)驗(yàn)分類(lèi)結(jié)果對(duì)比圖Fig.4 The classification results about experiments
通過(guò)對(duì)比兩組實(shí)驗(yàn),發(fā)現(xiàn)單獨(dú)紋理特征分類(lèi)更適合4月、8月2個(gè)月份的分類(lèi)。這是由于4月份作物結(jié)構(gòu)相對(duì)簡(jiǎn)單,各類(lèi)作物在影像上所呈現(xiàn)的紋理結(jié)構(gòu)相對(duì)完整,分類(lèi)過(guò)程中不會(huì)造成太大的干擾,更加有利于影像的識(shí)別;而8月份是由于各類(lèi)作物均處于最佳的生長(zhǎng)狀態(tài),作物的形狀、大小等差異也達(dá)到了最大化,在影像中紋理特征的區(qū)分度也有了很大的提升。因此,這2個(gè)月份內(nèi),單獨(dú)紋理特征不僅可以達(dá)到農(nóng)作物監(jiān)測(cè)的精度要求,而且可以有效地降低分類(lèi)的時(shí)間復(fù)雜度,極大程度地減少計(jì)算機(jī)的存儲(chǔ)量。而針對(duì)其他時(shí)段,使用特征組合的方法要遠(yuǎn)遠(yuǎn)優(yōu)于單獨(dú)紋理特征的分類(lèi)精度。這是由于5月、6月、7月、9月這4個(gè)月的作物大多處于萌芽階段,形狀及大小極為相近。作物區(qū)分難度增加,此時(shí)在紋理特征的基礎(chǔ)上引入光譜特征,利用光譜的吸收和反射差異,增強(qiáng)不同作物的生長(zhǎng)狀態(tài)信息,從而提高分類(lèi)特征的區(qū)分能力,精確的獲取作物的種植結(jié)構(gòu),實(shí)現(xiàn)逐月的農(nóng)作物動(dòng)態(tài)監(jiān)測(cè)。
本文基于GF-1WFV影像提取研究區(qū)主要種植農(nóng)作物的空間分布信息。根據(jù)農(nóng)作物由簡(jiǎn)單到復(fù)雜的生長(zhǎng)期變化特點(diǎn)以及特征量的不同選擇原則,選取2019年4月—2019年9月共6期影像進(jìn)行2組實(shí)驗(yàn),并利用實(shí)測(cè)樣本數(shù)據(jù)進(jìn)行驗(yàn)證,主要得到以下結(jié)論:
1)單獨(dú)紋理特征可以為WFV影像分類(lèi)提供許多有效的信息,如4月和8月份,分類(lèi)精度可以達(dá)到80%以上,充分說(shuō)明了GF-1WFV衛(wèi)星影像數(shù)據(jù)的紋理特征在農(nóng)作物識(shí)別過(guò)程中的可行性;但是在5月、6月、7月、9月等農(nóng)作物復(fù)雜的時(shí)間段內(nèi),分類(lèi)精度仍低于80%。
2)光譜與紋理組合使得各時(shí)相內(nèi)的分類(lèi)精度均超過(guò)80%,與紋理的分類(lèi)結(jié)果相比,精度提高2.27%~9.75%。
3)通過(guò)幾組實(shí)驗(yàn)對(duì)比,在滿足農(nóng)作物監(jiān)測(cè)的精度要求以及影像分類(lèi)效率等的基礎(chǔ)上,4月、8月采用單一紋理特征的識(shí)別方法,而5月、6月、7月、9月則采用紋理與光譜組合的提取方法。
GF-1衛(wèi)星以4 d的周期實(shí)現(xiàn)寬幅并且高精度的數(shù)據(jù),與SPOT,MODIS,Landsat等衛(wèi)星相比,滿足農(nóng)業(yè)遙感逐月監(jiān)測(cè)的需求,為農(nóng)業(yè)灌溉面積監(jiān)測(cè)以及農(nóng)作物估產(chǎn)等應(yīng)用提供了有力的支撐。但是本文在農(nóng)作物信息提取過(guò)程中,也存在著一定的缺陷。比如缺少對(duì)特征的篩選?;叶裙采仃囉?jì)算的紋理特征量較多,部分特征量之間存在一定的相關(guān)性,從而出現(xiàn)數(shù)據(jù)冗余,增加了分類(lèi)的時(shí)間復(fù)雜度,同時(shí)也影響了農(nóng)作物提取的精度;因此進(jìn)一步的研究可以圍繞特征的優(yōu)選算法展開(kāi),通過(guò)動(dòng)態(tài)的獲取信息量最優(yōu)的特征量并參與影像的分類(lèi),最終達(dá)到縮短分類(lèi)時(shí)間、提高分類(lèi)精度的目的。由于分類(lèi)樣本的不完整影響了分類(lèi)的精度,由于種植時(shí)間、灌溉水量以及氣候變化等存在差異,導(dǎo)致不同區(qū)域內(nèi)農(nóng)作物的長(zhǎng)勢(shì)存在差異,樣本點(diǎn)無(wú)法完全覆蓋作物的各個(gè)生長(zhǎng)階段,這在一定程度上影響了分類(lèi)的精度。因此在進(jìn)一步研究中,需要充分考慮各個(gè)時(shí)間段的農(nóng)作物生長(zhǎng)狀態(tài),盡可能的保證樣本點(diǎn)的充分覆蓋。