麥麗素,烏蘭吐雅
(1.山東農(nóng)業(yè)大學 資源與環(huán)境學院,山東 泰安 271000;2.內(nèi)蒙古自治區(qū)農(nóng)牧業(yè)科學院,內(nèi)蒙古 呼和浩特 010031)
水稻是世界主要糧食作物之一,而我國是世界上最大的稻米生產(chǎn)國和消費國。據(jù)國家統(tǒng)計局年鑒2017年,我國水稻播種面積為3 017.60 萬hm2,占全國糧食作物播種面積的26%;水稻產(chǎn)量為21 267.59 萬t,占全國糧食總產(chǎn)量的32%。近年來,由于世界人口的快速增長和全球變暖的影響,水稻產(chǎn)量需求大大提高,水稻種植區(qū)域由原來的低緯度地帶逐漸向中高緯度擴展,內(nèi)蒙古統(tǒng)計局年鑒從2002—2017年的15年內(nèi),內(nèi)蒙古水稻產(chǎn)量由每年生產(chǎn)55.99 萬t 增長到85.2 萬t,增長率為52.17%。面對我國中高緯度單季稻種植區(qū)域的高速擴張和產(chǎn)量迅猛增加的現(xiàn)狀,必須快速精準地獲得水稻空間分布及種植面積信息,為我國各級政府指導水稻生產(chǎn)、平衡區(qū)域供需提供重要依據(jù)。
近年來,新型遙感傳感器向著長時間、高分辨率、高光譜的方向不斷發(fā)展,極大地提高了水稻遙感監(jiān)測的精度和效率,遙感技術(shù)手段已成為獲取水稻種植面積的重要技術(shù)手段[1]。目前,國內(nèi)外通過遙感手段對水稻面積的提取研究多集中于低緯度雙季稻地區(qū)。許玉萍等[2]以長江中下游漢江平原為研究區(qū)域,建立NDVI 時序曲線形狀相似性模型提取水稻面積。CHEN 等[3]通過NDVI 時序數(shù)據(jù)使用線性混合模型對湄公河三角洲及越南的水稻耕作強度進行監(jiān)測。
目前,常用的研究水稻面積提取的光學遙感圖像由中分辨率遙感衛(wèi)星Landsat TM/ETM+、SPOT、CBERS-1 提供。中分辨率影像其特征為覆蓋范圍廣、時間分辨率高、衛(wèi)星類型多,可以滿足水稻種植監(jiān)測大范圍、多時相的特點。全璟等[4]利用Landsat 8衛(wèi)星數(shù)據(jù)采用非監(jiān)督分類方法提取大別山區(qū)水稻種植面積;朱曉禧等[5]利用1988年和1998年Landsat TM影像,獲取了黑龍江省西部地區(qū)的水稻和玉米種植圖;OKAMOTO[6]基于TM 數(shù)據(jù),以像元為單位,建立應(yīng)用模型,提取面積精度達97%以上。本次研究采用歐洲航天局發(fā)射的Sentinel-2 衛(wèi)星作為數(shù)據(jù)源。Sentinel-2 衛(wèi)星攜帶一枚多光譜成像儀(MSI),高度為786 km,可覆蓋13 個光譜波段,幅寬達290 km。地面分辨率分別為10,20,60 m,1 顆衛(wèi)星的重訪周期為10 d,2 顆互補,重訪周期為5 d。從可見光和近紅外到短波紅外,具有不同的空間分辨率,在光學數(shù)據(jù)中,Sentinel-2 衛(wèi)星數(shù)據(jù)是唯一一個在紅邊范圍含有3 個波段的遙感數(shù)據(jù),這對監(jiān)測植被健康信息非常有效。在近幾年的研究中,Sentinel-2 衛(wèi)星遙感數(shù)據(jù)在作物分類和面積提取方面較少被使用,可以免費獲取且具有經(jīng)濟實用性的Sentinel 衛(wèi)星數(shù)據(jù),在未來定會成為實現(xiàn)大范圍水稻種植監(jiān)測的常用數(shù)據(jù)源[7]。
相比傳統(tǒng)的水稻面積提取,遙感影像通過專業(yè)軟件的處理可以快速、有效、準確地獲取研究區(qū)的水稻種植面積。在眾多的自動分類方法中,選取哪種分類方法得到更高精度的水稻面積一直是國內(nèi)外學者的研究重點。許麗杰等[8]采用平行六面體、最小距離分類、最大似然分類等不同分類方法對同一研究區(qū)進行分類,分類后結(jié)果采用混淆矩陣進行精度評價。陳玲[9]以山西省大同市渾源縣為對象,采用最小距離分類、最大似然分類以及人機交互分類的方法進行土地利用分類的精度對比分析。本研究以水稻集中種植的烏蘭浩特市為研究區(qū),使用Sentinel-2 衛(wèi)星數(shù)據(jù)源基于提取水稻種植區(qū)域研究中常用的支持向量機法、最大似然法、面向?qū)ο蠓诸惙ǎY(jié)合單時相影像得到水稻的種植面積,通過混淆矩陣、地面樣方驗證的精度評價手段對分類結(jié)果進行比較分析,旨在得到適合中高緯度水稻種植面積自動化提取的最佳分類方法,從而為我國中高緯度地區(qū)水稻種植管理、預測水稻產(chǎn)量、監(jiān)測水稻動態(tài)變化提供參考[10]。
烏蘭浩特市位于內(nèi)蒙古自治區(qū)東北部,興安盟東南部,介于北緯45°22′~46°18′,東經(jīng)121°51′~122°20′,地處大興安嶺山脈的中段與松遼平原過渡地帶,屬低山丘陵地貌,平均海拔263.6 m,總面積為865 km2。該區(qū)域?qū)僦袦貛О敫珊导撅L氣候,四季分明,氣溫的年較差和日較差都較大,年平均氣溫5.0 ℃,年平均降水量442.6 mm,年平均日照2 875.8 h,無霜期134 d。
本研究獲取了2018年覆蓋烏蘭浩特地區(qū)的2 景Sentinel-2 Level-1C 產(chǎn)品圖像,獲取時間為9月9日。根據(jù)皮艷萍[11]有關(guān)烏蘭浩特市水稻的物候期(表1)以及遙感影像的云覆蓋狀況,本研究選取是處于水稻乳熟期的遙感影像。影像投影方式為UTM,坐標系統(tǒng)為WGS84。
歐空局(ESA)發(fā)布的Sentinel-2 Level-1C 級數(shù)據(jù)是經(jīng)過幾何精校正的正射影像,下載后的影像通過Sen2cor 工具進行了大氣校正,然后對圖像進行鑲嵌處理,通過烏蘭浩特市的矢量邊界線裁剪得到研究區(qū)域的影像,選取了B4、B3、B2 波段進行波段合成。將對影像進行目視解譯后得到的結(jié)果(2/3 作為解譯標志,1/3 作為精度驗證)作為對比依據(jù),進一步利用3 種分類方法提取水稻種植區(qū)域的數(shù)據(jù)。
表1 烏蘭浩特市水稻的物候期
在進行支持向量機法和最大似然法分類前,從目視解譯得到的分類結(jié)果中隨機選取其中的2/3 作為解譯標志,創(chuàng)建感興趣區(qū)域(ROI)訓練樣本。由于本研究的目的主要是提取水稻面積,所以將水稻以外的其他作物、建設(shè)用地、水體、裸地等歸為一類即非水稻用地,然后用Jeffries-Matusita 和轉(zhuǎn)換分離度(Transformed divergence)對訓練樣本的可分離性進行檢驗,計算后的值在0~2,數(shù)值越大說明可分離性越好。由表2可知,本次選取的訓練樣本可分離性指標>1.85,分類性符合標準,可以使用。
表2 訓練樣本的可分離性檢驗結(jié)果
本研究為了進一步對水稻面積提取精度進行評價,采用地面樣方數(shù)據(jù)驗證方法,在烏蘭浩特市水稻種植區(qū)域目視解譯結(jié)果中隨機選取5 個樣方(圖1)作為實際水稻面積,通過3 種分類方法提取的水稻種植區(qū)域結(jié)果中選擇相同位置大小的區(qū)域(圖2),并計算區(qū)域內(nèi)部的水稻面積,以此進行水稻面積的精度驗證。
本研究主要采用監(jiān)督分類方法中的支持向量機法和最大似然法及面向?qū)ο蠓诸惙ǖ腒 近鄰法(KNN)分別對2018年覆蓋烏蘭浩特市的單時相Sentinel-2 衛(wèi)星遙感圖像進行水稻種植區(qū)域提取,分類結(jié)果為水稻用地、非水稻用地2 種地物類型,并對3 種分類方法的結(jié)果進行分類后處理(Majority 分析法、聚類處理),以此消除分類過程中的“椒鹽”現(xiàn)象。通過對3 種分類方法的結(jié)果對比分析找到基于Sentinel-2 衛(wèi)星影像的水稻提取最佳分類算法,具體技術(shù)流程見圖3。
2.4.1 支持向量機法 支持向量機分類(SVM)是一種建立在統(tǒng)計學理論(Statistical learning theory,SLT)基礎(chǔ)上的機器學習方法。其基本思想是通過非線性函數(shù)將輸入的空間變換到高維特征空間,在變換后的空間中求取最優(yōu)線性分類面,保證最小的分類錯誤率,解決空間中線性不可分的問題。該方法是根據(jù)有限的樣本信息在模型的復雜性(對特點訓練樣本的學習精度)和學習能力(無錯誤地識別任意樣本的能力)之間尋求最佳折中,以期獲得最好的推廣能力。單捷等[12]運用SVM 分類法、CART 決策樹法和最大似然法進行分類提取水稻面積,結(jié)果表明,支持向量機法精度最高,為80.38%,Kappa 系數(shù)為0.74。鄔明權(quán)等[13]將不同影像數(shù)據(jù)進行空間融合,基于SVM分類法獲取水稻面積,獲得的分類精度高達93.00%。在水稻種植面積提取研究中,SVM 分類法較為常用,且提取精度較高。
圖1 樣方分布
圖2 3 種分類方法水稻面積提取效果對比
圖3 技術(shù)流程
2.4.2 最大似然法 最大似然分類法也是監(jiān)督分類方法里面用得較多的一種分類方法。它將遙感影像多波段數(shù)據(jù)的分布作為正態(tài)分布來構(gòu)造判別分類函數(shù),其基本思想是將各類已知像元的數(shù)據(jù)在平面或空間中構(gòu)成一定的點群;每一類的每一維數(shù)據(jù)都在自己的數(shù)軸上形成一個正態(tài)分布,該類的多維數(shù)據(jù)就構(gòu)成一個多維正態(tài)分布;各類的多維正態(tài)分布模型在位置、形態(tài)、密集或分散程度等方面不同。根據(jù)訓練樣本就可以構(gòu)造出各類的多維正態(tài)模型,對于未知類別的數(shù)據(jù)向量,通過貝葉斯公式計算它屬于各個類別的概率大小,比較這些概率后,將數(shù)據(jù)向量或像元進行歸類。單捷等[14]通過Radarsat-2 衛(wèi)星影像數(shù)據(jù),采用支持向量機法和最大似然法對江蘇省鹽城市水稻面積提取并進行精度評價。
2.4.3 面向?qū)ο蠓诸惙?面向?qū)ο蠓诸惙ㄔ谶M行水稻面積提取時進行處理的最小單元與監(jiān)督分類不同,該分類法不是以像元為最小單元,而是以集合鄰近像元為單元。該方法不同于傳統(tǒng)的只基于光譜的分類方法,它結(jié)合了幾何信息與結(jié)構(gòu)信息,使得分割后形成多個互不交疊的區(qū)域,減少了“椒鹽”現(xiàn)象,一定程度上解決了“同物異譜”和“同譜異物”現(xiàn)象,適合于中高分辨率多光譜和全色影像。陳燕麗等[15]利用多光譜數(shù)據(jù),應(yīng)用面向?qū)ο蠓诸惙ㄌ崛×藦V西玉林市晚稻種植面積,總計精度可達96.31%。湯傳勇等[16]利用面向?qū)ο蠓诸惙ɑ赟POT4 遙感數(shù)據(jù)提取廣西玉林市水稻面積,精度達95.40%。
在采用面向?qū)ο蠓诸惙ㄟM行研究區(qū)水稻面積提取時,初期對影像進行尺度分割的分割尺度對于分類結(jié)果精度有著重要影響,本研究通過多次嘗試選取了分割尺度參數(shù)分割值、合并值,其值分別為60 和80;然后輸入訓練樣本,基于K 近鄰法實現(xiàn)整個分類過程,最后對提取圖像進行分類后處理及精度驗證[17]。
圖4為基于支持向量機法、最大似然法以及面向?qū)ο蠓诸惙▽跆m浩特市水稻單時相影像的空間分布進行提取的結(jié)果。由圖4可知,支持向量機法與最大似然法提取區(qū)域較為松散,可以較清晰地分辨出分布在水稻種植區(qū)域內(nèi)部的道路及建筑用地,但與其他作物種植區(qū)域和城市用地的邊界比較模糊;而面向?qū)ο蠓诸惙ㄒ驗橛跋穹指畛叨鹊倪x擇,雖能明顯辨別出水稻種植區(qū)域與非水稻種植區(qū)域的界線,但內(nèi)部旱地和水稻區(qū)域發(fā)生混分現(xiàn)象。在區(qū)域南部的水稻種植區(qū)因被云層覆蓋,提取結(jié)果也多為分散的塊狀區(qū)域,從目視判斷結(jié)果來看,最大似然法對這一區(qū)域的分類結(jié)果較其他兩種分類法所得到的結(jié)果更為精準。
3.1.1 基于混淆矩陣的精度評價 為了比較3 種分類方法對水稻種植區(qū)域提取的準確度,研究基于混淆矩陣進行分類精度評價,該方法是目前普遍使用的分類精度檢驗方法[18-19]。通過對研究區(qū)域的目視解譯結(jié)果隨機取樣,在水稻種植區(qū)域隨機生成200 個樣方作為精度驗證樣本,最后所得到的分類精度見表3。由表3可知,最大似然法分類結(jié)果精度最佳,總體分類精度達89.35%,Kappa 系數(shù)為0.787 3,錯分誤差為0,漏分誤差為16.81%,用戶精度為100%;面向?qū)ο蠓诸惙ǚ诸惥茸畹?,總體分類精度為76.90%,Kappa 系數(shù)為0.560 2,錯分誤差為0.34%,漏分誤差為36.25%,用戶精度為99.66%。
圖4 基于3 種不同分類方法的水稻空間分布
表3 基于混淆矩陣的水稻面積遙感識別精度
3.1.2 基于地面樣方數(shù)據(jù)的精度評價 基于地面樣方數(shù)據(jù)驗證也是精度驗證的主要手段之一[20]。本研究只針對Sentinel-2 號衛(wèi)星影像對水稻的識別能力,評價3 種不同分類方法在水稻面積監(jiān)測中的精度,所以只以水稻區(qū)域進行精度評價,而不涉及非水稻區(qū)域。
在目視解譯得到的水稻種植區(qū)域中隨機選取了5 個樣方點,與3 種分類結(jié)果分別得到的水稻提取區(qū)域中相應(yīng)的樣方區(qū)域進行面積提取的精度驗證,得到基于Sentinel-2 衛(wèi)星影像上對應(yīng)的每塊樣方內(nèi)水稻種植面積監(jiān)測精度Pi和水稻種植面積監(jiān)測平均精度,其結(jié)果見表4。
式中:yi為影像目視解譯得到的樣方內(nèi)水稻面積,為通過自動化分類方法提取到的樣方內(nèi)水稻面積,n 為樣方數(shù)。
由表4可知,支持向量機法、面向?qū)ο蠓诸惙ǖ乃痉N植面積監(jiān)測平均精度分別為77.01%和73.30%,相差較??;最大似然法分類平均精度最高,為85.91%。
表4 基于地面樣方數(shù)據(jù)的水稻面積監(jiān)測精度評價結(jié)果
以Sentinel-2 衛(wèi)星為數(shù)據(jù)源,進行3 種不同分類方法的水稻面積提取,并對提取的水稻面積進行精度評價,得出以下結(jié)論:
通過比對目視解譯結(jié)果與3 種分類方法得到的結(jié)果,3 種分類方法提取的水稻種植面積都小于90.00%,主要原因是在烏蘭浩特市水稻乳熟期的8月下旬到9月下旬這一時間段,研究區(qū)域處于雨季,云層干擾嚴重,通過比對研究區(qū)域這一時間段所有影像云覆蓋狀況,最終選取了9月9日的Sentinel-2 衛(wèi)星影像,但通過影像目視解譯結(jié)果發(fā)現(xiàn),從9月上旬開始,研究區(qū)域從北部開始陸續(xù)收割水稻,北部水稻種植區(qū)域多為旱地與水稻種植區(qū)域的混合,所以導致提取結(jié)果多為分散不規(guī)則的塊狀和點狀區(qū)域,大大降低了水稻提取的精度。同時,在區(qū)域南部的水稻種植區(qū)域,有薄云覆蓋,通過目視解譯也很難區(qū)分水稻與其他作物種植區(qū)域的界線,這也降低了分類后的水稻面積提取的準確性。
本研究發(fā)現(xiàn),在對高緯度單季稻地區(qū)進行水稻面積提取時,基于混淆矩陣精度評價中最大似然法與支持向量機法、面向?qū)ο蠓诸惙ㄏ啾容^,總體分類精度分別高4.60,12.45 個百分點,表明這3 種分類方法中最大似然法的水稻提取精度是最好的。這與其他分類方法精度比較的研究中所得出的面向?qū)ο蠓诸惙ㄝ^監(jiān)督分類方法精度更高的結(jié)論不同,主要原因是該研究區(qū)域處于水稻收割期,水稻生長區(qū)域多為旱地與水稻的混合地物,提取的水稻多為破碎地塊[21]。農(nóng)作物種植田塊越破碎,面積估算會呈現(xiàn)增大的趨勢,遙感分類精度降低[22]。最大似然法是以單獨像元為識別單元,可以很好地識別破碎面積;支持向量機法可以自動尋找在間隔區(qū)邊緣的訓練樣本點,從而區(qū)分有較大區(qū)分能力的支持向量,可以將類與類之間的間隔最大化[23]。而面向?qū)ο蠓诸惙ㄍ黄埔詥蝹€像元為識別單元的局限,以大面積分割后的地塊為基本單元,避免了“異物同譜和同譜異物”“椒鹽”現(xiàn)象,分類后得到的結(jié)果可以很好地辨認水稻集中種植區(qū)域的界線,但并不適合正在進行收割的水稻區(qū)域面積提取。如果在后續(xù)研究中建立自動化最優(yōu)尺度分割算法,在分類初期很好的選取最佳分割尺度參數(shù)分割值、合并值,或者建立分層,將地物逐層進行分割,面向?qū)ο蠓诸惙ǖ木冗€能得到極大改善[17]。
面向?qū)ο蠓诸惙梢赃\用地物的光譜信息統(tǒng)計特征,有效利用圖像中的形狀、大小、紋理、相鄰因素信息等,通過定義分類規(guī)則提高了自動化程度,相比監(jiān)督分類方法可以節(jié)省大量時間和人力,后續(xù)研究中將對面向?qū)ο蠓诸惙ǖ囊?guī)則定義做進一步的分析研究,分類精度也會大幅度提高,在未來的研究中相比單純以像元為單位的監(jiān)督分類來說,面向?qū)ο蠓诸惙ǜ哂袃?yōu)勢性。
Sentinel-2 衛(wèi)星影像在水稻種植面積的提取數(shù)據(jù)源中以其空間分辨率高、時間分辨率高、成本低、處理方便的特點,可以作為未來水稻種植面積提取研究中優(yōu)選的數(shù)據(jù)源。通過該衛(wèi)星影像能夠準確地獲取小尺度水稻種植面積,實現(xiàn)各地農(nóng)業(yè)生產(chǎn)管理部門快速獲取農(nóng)情信息、準確預測水稻產(chǎn)量、隨時監(jiān)測水稻生長情況。
本研究是對單時相影像使用不同分類方法進行水稻面積提取,由于該研究區(qū)獲取的影像受云覆蓋影響,很難得到無云并處于水稻識別最佳時相的高質(zhì)量影像,若是在以后研究中進行云掩膜處理或?qū)⒏叻直媛实钠渌麛?shù)據(jù)作為輔助信息,可以更好地提高水稻種植分布精度,細化提取結(jié)果。所以,提高云和陰影的檢測精度、綜合利用多時相遙感影像,對不同時期的水稻光譜信息進行綜合分析將是下一步研究的重點,如何提高分類精度將是未來農(nóng)作物提取分類研究的重點和趨勢[24]。
在基于遙感技術(shù)的水稻種植面積自動提取中,雖然盡量對分類結(jié)果進行自動化優(yōu)化處理,但不可避免還有錯分、漏分,導致分類結(jié)果不準確。所以,結(jié)合人工干預來進行自動化處理,也可以大幅度提高分類的精度[25]。本研究中導致水稻分類的不準確,很大程度是由于收割期的研究區(qū)域處于旱地和水稻的混合地物,由于濕地和處于澆灌期或雨水期的旱地與水稻田的光譜特征相似,導致水稻分類的錯分和漏分。因此,選擇關(guān)鍵物候期并在水稻收割前獲取影像對于提高水稻面積提取精度的研究有很大幫助。本研究主要探討在中高緯度水稻種植區(qū)域內(nèi)利用3種常用的分類方法獲取水稻種植面積并進行精度的對比分析,研究的下一步會針對多時相遙感數(shù)據(jù)的融合,結(jié)合時序植被指數(shù),找出適合中高緯度地區(qū)分類方法的參數(shù)選擇,進一步提高水稻種植面積提取的精確度。