郭倩, 魏嘉豪, 張健, 葉章熙, 張厚喜,2,3*, 賴正清, 鄧輝
(1.福建農(nóng)林大學(xué)林學(xué)院,福州 350028; 2.南方紅壤區(qū)水土保持國家林業(yè)和草原局重點(diǎn)實(shí)驗(yàn)室,福州 350028;3.海峽兩岸紅壤區(qū)水土保持協(xié)同創(chuàng)新中心,福州 350028; 4.南京師范大學(xué)海洋科學(xué)與工程學(xué)院,南京 210023; 5.成都理工大學(xué)地球科學(xué)學(xué)院,成都 610059)
及時(shí)準(zhǔn)確的蔬菜種植信息(空間分布、面積等)是實(shí)現(xiàn)水肥精準(zhǔn)管理、優(yōu)化蔬菜生產(chǎn)及提升產(chǎn)量估算精度的重要基礎(chǔ)[1]。近年來,隨著空間信息技術(shù)的高速發(fā)展,遙感作為一種重要的對地觀測技術(shù),已被廣泛應(yīng)用于作物的不同參數(shù)監(jiān)測中,如作物長勢監(jiān)測、葉面積指數(shù)反演等[2]。然而,雖然傳統(tǒng)衛(wèi)星遙感在大面積、種類單一的作物參數(shù)監(jiān)測方面的應(yīng)用效果顯著,但由于衛(wèi)星影像時(shí)空分辨率較低,其在作物種植種類精準(zhǔn)識(shí)別方面具有一定的局限性。特別是在顏色相似、形態(tài)相近的蔬菜種類識(shí)別上,傳統(tǒng)衛(wèi)星遙感技術(shù)的局限性更加突出,加上蔬菜生長周期較短,在有限的時(shí)間內(nèi)精準(zhǔn)地識(shí)別蔬菜種植種類就要求遙感影像有更高的空間和時(shí)間分辨率。近年來興起的無人機(jī)遙感有超高的空間分辨率以及靈活可控的重訪時(shí)間[3],有效彌補(bǔ)了傳統(tǒng)衛(wèi)星遙感的不足,因此將其應(yīng)用于作物信息的監(jiān)測研究受到廣泛關(guān)注。此外,無人機(jī)能夠通過搭載多光譜等傳感器有效提高影像信息量,進(jìn)一步增大了無人機(jī)監(jiān)測蔬菜信息的優(yōu)勢。
面向像元和面向?qū)ο笫沁b感分類的2 種基本方法?;谙裨姆诸惙椒ㄔ谔幚砀叻直媛视跋駮r(shí)存在一定的局限性,如易出現(xiàn)椒鹽現(xiàn)象,即同種地物由于光譜變異較大而被分為不同類別,使得原本均一的地塊被打碎,而面向?qū)ο蟮姆诸惙椒▌t將影像分割成屬性相對均一的對象,讓對象代替像元作為分類的基本單位,這樣可以綜合利用每一對象的光譜、紋理、幾何特點(diǎn)以及上下文特征,從而有效提高分類精度與結(jié)果的可靠性[4]。但是,面向?qū)ο蠓诸惙椒ㄔ诔浞掷锰卣餍畔⒌耐瑫r(shí)也增加了特征維度,在引入多種特征信息時(shí)容易讓次要特征影響整體分類精度,近年興起的隨機(jī)森林方法有效規(guī)避了這樣的缺陷,隨機(jī)森林方法可以通過算法確定特征權(quán)重,優(yōu)化分類方案,從而提高分類精度[5]。作為一種數(shù)據(jù)驅(qū)動(dòng)的非參數(shù)分類方法,隨機(jī)森林方法通過有放回的自助抽樣方法構(gòu)建決策樹,采用投票方式得到最終分類結(jié)果[6-7],擅長處理高維數(shù)據(jù),并且抗過擬合能力強(qiáng)、計(jì)算速度快,近年來被廣泛應(yīng)用于生物學(xué)、醫(yī)學(xué)、遙感等領(lǐng)域。
由于面向?qū)ο蠛碗S機(jī)森林算法各自有著其他方法所不具備的優(yōu)點(diǎn),近年來不少學(xué)者嘗試將二者結(jié)合起來開展遙感影像分類。Lee 等[6]使用隨機(jī)森林及紋理特征建立了一套適用于無人機(jī)拍攝的大規(guī)模坡地影像自動(dòng)判讀程序,一定程度上解決了坡地地物識(shí)別困難的問題。Wang等[7]比較不同影像及不同分類方法(支持向量機(jī)、K-近鄰法和隨機(jī)森林)對同一地區(qū)土地分類的結(jié)果,發(fā)現(xiàn)隨機(jī)森林法得到的分類精度最高。為削弱多維特征對分類精度的負(fù)面影響,劉舒等[8]提出一種多目標(biāo)隨機(jī)森林組合式特征選擇算法進(jìn)行特征集優(yōu)化,進(jìn)一步提高了分類精度。
雖然基于面向?qū)ο蠛碗S機(jī)森林相結(jié)合的研究已經(jīng)取得了一些成果,但目前的研究主要集中于較大尺度范圍,而其在小尺度范圍的應(yīng)用,特別是蔬菜精準(zhǔn)識(shí)別的研究還十分有限。因此,本文以蔬菜種植園的無人機(jī)多光譜遙感影像為數(shù)據(jù)源,通過提取光譜、指數(shù)、紋理和幾何4 類特征形成不同特征子集構(gòu)建不同的分類方案,利用面向?qū)ο笈c隨機(jī)森林算法相結(jié)合的方法開展蔬菜種類識(shí)別研究,以期通過對分類方法的驗(yàn)證分析,獲得一種實(shí)用高效的蔬菜種植種類識(shí)別方法,為高精度農(nóng)作物遙感監(jiān)測提供借鑒。
研究區(qū)(26°03′N,119°19′E)位于福州市閩侯縣東南部,平均海拔約9 m,面積約956 m2(圖1)。該地處于亞熱帶季風(fēng)氣候區(qū),年降雨量900~2 100 mm,年均氣溫18~26 ℃。
圖1 研究區(qū)真彩色影像Fig. 1 RGB image of research area
為了減少陰影對分類結(jié)果的影響,選擇有云且光線較好的時(shí)段,利用大疆無人機(jī)(精靈4多光譜版,深圳市大疆創(chuàng)新科技有限公司)進(jìn)行航拍。該款無人機(jī)集成了5 個(gè)單波段相機(jī)鏡頭,藍(lán)光波段(blue,B)(450±16) nm;綠 光 波 段(green,G)(560±16) nm;紅光波段(red,R)(650±16) nm;紅邊波 段(red edge,RE)(730±16) nm;近 紅 外 波段(near infrared,NIR)(840±26) nm;定位精度為0.1~0.3 m。設(shè)定航高為20 m,航向、旁向重疊度均為70%,共獲取單波段影像250 張。影像尺寸為1 600像素×1 300像素,影像預(yù)處理主要包含影像拼接與重采樣,借助大疆Terra 軟件拼接并重采樣生成研究區(qū)多光譜影像(空間分辨率0.01 m×0.01 m)。
技術(shù)流程如圖2 所示。首先,對拼接生成的影像重采樣至0.01 m×0.01 m,然后進(jìn)行多尺度分割,并計(jì)算分割后每個(gè)對象的4類特征值,包括光譜特征(spectrum features, SPEC)、指數(shù)特征(index features,INDE)、紋理特征(grey-level co-occurrence matrix features,GLCM)和 幾 何 特 征(geometric features,GEOM);其次,以光譜特征為基礎(chǔ)分別加入其他3 類特征組合成為8 個(gè)特征子集,并形成8 個(gè)相應(yīng)的分類方案。通過特征選取、參數(shù)調(diào)整和模型訓(xùn)練3 個(gè)步驟構(gòu)建不同方案隨機(jī)森林模型;利用分層抽樣方法構(gòu)建每個(gè)類別的訓(xùn)練樣本和驗(yàn)證樣本,分別用于模型訓(xùn)練和精度評價(jià);最后,根據(jù)最佳模型預(yù)測生成整個(gè)研究區(qū)分類圖。
圖2 技術(shù)流程Fig. 2 Technical flow
1.3.1 影像分割 采用eCognition9.0 軟件對圖像進(jìn)行多尺度分割,為了得到最佳效果,在50~1 000 區(qū)間內(nèi)以50 為間距設(shè)置不同分割尺度,同時(shí)設(shè)置相應(yīng)的形狀因子和緊致度,然后逐個(gè)進(jìn)行影像分割。
1.3.2 對象特征提取 使用eCognition9.0 軟件選取對象的4大類共96個(gè)特征。
①光譜特征(SPEC):B、G、R、RE 和NIR 每個(gè)波段像元亮度值均值、標(biāo)準(zhǔn)差以及波段最大差異(max difference)和總體亮度值[9](brightness),共12個(gè)。
②指數(shù)特征(INDE):包含歸一化植被指數(shù)[10](normalized difference vegetation index,NDVI)、歸一化差異紅色邊緣指數(shù)[11](normalized difference red edge index,NDRE)、綠色歸一化植被指數(shù)[12](green normalized difference vegetation,GNDVI)、比值植被指數(shù)[13](ratio vegetation index ,RVI)、RVIGRE[14]、土壤調(diào)整植被指數(shù)[15](soil-adjusted vegetation index ,SAVI)、SAVIGRE[14]、差值植被指數(shù)[13](difference vegetation index,DVI)、DVIREG[14]、DVIGRE[14]、歸 一 化 差 異 水 指 數(shù)[16](normalized difference water index, NDWI)、改進(jìn)的陰影水體指數(shù)[17](modified shade water index ,MSWI)、綜合權(quán)重水體指數(shù)[17](comprehensive water weight index ,CWWI)的均值和標(biāo)準(zhǔn)差,共26個(gè)。
③紋理特征(GLCM):B、G、R、RE 和NIR 波段各對象全方位灰度共生矩陣的均值、標(biāo)準(zhǔn)差、熵(entropy)、同質(zhì)度(homogeneity)、對比度(contrast)、非相似性(dissimilarity)、角二階矩(angular second moment)和相關(guān)性(correlation),共40個(gè)。
④幾何特征(GEOM):對象的形狀和范圍特征,包括面積(area)、長寬比(length/width)、長度(length)、寬度(width)、邊界長(border length)、形狀指數(shù)(shape index)、密度(density)、主方向(main direction)、不對稱性(asymmetry)、圓度(roundness)、邊界指數(shù)(boundary index)、像素?cái)?shù)(number of pixels)、緊致度(compactness)、體積(volume)、橢圓擬合(ellipse fitting)、矩形擬合(rectangle fitting)、最 大 橢 圓 半 徑(maximum ellipse radius)、最小橢圓半徑(minimum ellipse radius),共18個(gè)。
1.3.3 分類方案構(gòu)建與樣本獲取 共設(shè)置8 個(gè)子特征集,并形成8 個(gè)相應(yīng)的分類方案(S1~S8),具體如表1所示。
表1 不同分類方案Table 1 Different classification schemes
基于高分辨率無人機(jī)影像采用目視解譯與實(shí)地核查的方式選取地物總樣本(包含訓(xùn)練和驗(yàn)證樣本)。根據(jù)影像中不同地物的大致面積,確定了11 類地物的總樣本數(shù)(表2)。為了保證訓(xùn)練和驗(yàn)證樣本中不同地物數(shù)目比例與總樣本中的一致,采用分層抽樣法進(jìn)行抽樣,即對每類樣本以6∶4的比例隨機(jī)抽取訓(xùn)練樣本和驗(yàn)證樣本。
表2 不同類別樣本Table 2 Samples for different categories
1.3.4 隨機(jī)森林算法原理和參數(shù)調(diào)試 隨機(jī)森林由眾多決策樹構(gòu)成,每棵決策樹獨(dú)立生長,在節(jié)點(diǎn)處隨機(jī)選擇特征變量參數(shù)進(jìn)行分叉,最終預(yù)測結(jié)果由決策樹投票產(chǎn)生[5]。其中有2 個(gè)重要參數(shù)—決策樹數(shù)目和每棵樹包含的特征數(shù)目,通常采用遍歷法來確定。首先,將決策樹數(shù)設(shè)置為1 000,依次遍歷特征參數(shù)數(shù)量(1~96),選取袋外誤差最小的特征數(shù)目作為其最佳值;然后,將特征數(shù)目固定為最佳值,遍歷決策樹數(shù)目(1~1 000),選取袋外誤差最小的決策樹數(shù)目作為其最佳值,通過上述方法來確定決策樹數(shù)目和特征數(shù)目的最佳組合。利用R 語言軟件的Random Forest 程輯包實(shí)現(xiàn)基于隨機(jī)森林算法的分類。
1.3.5 精度評價(jià) 采用基于混淆矩陣計(jì)算出的4個(gè)指標(biāo)(總體精度、Kappa系數(shù)、生產(chǎn)者精度和用戶精度)進(jìn)行模型精度評價(jià)。由于隨機(jī)森林每次運(yùn)行結(jié)果存在一定差異,因此每個(gè)方案將分別運(yùn)行2 000次后再進(jìn)行精度評價(jià)。
2.1.1 光譜可分性分析 從圖3 可知,非蔬菜地物的光譜曲線與蔬菜地物之間存在較大差異,特別是近紅外波段,非蔬菜地物的反射率明顯低于蔬菜地物(蔥除外)。各蔬菜地物的光譜曲線比較相似,綠光波段(560 nm)處各蔬菜的反射率增高,形成反射峰,但包菜和生菜在綠光波段處的亮度值較為相近,難以進(jìn)行有效區(qū)分。各種類蔬菜的亮度值在紅邊波段(730 nm)處反射率迅速增高,但其在紅邊波段處的亮度值高度相似,難以對其類別進(jìn)行區(qū)分。由上可知,通過光譜特征差異可以明確區(qū)分蔬菜與非蔬菜地物,但某些蔬菜地物的光譜曲線極其相似,僅依靠光譜特征難以進(jìn)行準(zhǔn)確區(qū)分,有必要綜合利用其他特征。
圖3 地物光譜圖Fig. 3 Object spectrum image
2.1.2 分割尺度選擇 影像分割結(jié)果如圖4 所示,通過比較發(fā)現(xiàn)分割尺度設(shè)置過大會(huì)導(dǎo)致影像欠分割,每個(gè)對象中會(huì)包含多種地物類型,即每個(gè)對象的純凈度較低;分割尺度設(shè)置過小則會(huì)使對象碎片化,難以吻合對象真實(shí)邊界,將加大識(shí)別難度及后續(xù)的計(jì)算量。當(dāng)分割尺度為100~300 時(shí),分割后的對象與地物實(shí)際邊界較為吻合,影像分割效果相對較佳,進(jìn)一步目視對比以100~300 作為尺度分割的影像,最終選擇150 作為影像的分割尺度。
圖4 不同分割尺度分割效果Fig. 4 Segmentation effect of different segmentation scales
2.1.3 隨機(jī)森林參數(shù)調(diào)試 由參數(shù)的調(diào)試結(jié)果(圖5)可知,當(dāng)決策樹數(shù)目設(shè)為1 000 時(shí),隨著特征數(shù)目增加,不同方案的袋外誤差均呈現(xiàn)先下降而后處于波動(dòng)的變化趨勢,此時(shí)每個(gè)方案袋外誤差最小時(shí)即為所對應(yīng)特征數(shù)目的最佳值;將特征數(shù)目設(shè)置為最佳值后,通過改變決策樹數(shù)目,不同方案的袋外誤差均呈先下降而后趨于平穩(wěn)的趨勢,此時(shí)每個(gè)方案袋外誤差最小時(shí)即為對應(yīng)決策樹數(shù)目的最佳值。8 個(gè)方案(S1~S8)特征數(shù)目與決策樹數(shù)目的最佳值組合分別為(4,161)、(12,848)、(12,365)、(15,203)、(19,197)、(38,731)、(25,708)和(41,165)。
圖5 不同方案不同特征個(gè)數(shù)與決策樹數(shù)量袋外誤差率Fig. 5 Out-of-bag error rate of different numbers of features and different numbers of decision trees for various schemes
2.2.1 總體精度與Kappa 系數(shù) 由圖6 箱式圖可知,所有方案的分類精度都較高,不同方案總體精度的均值均高于85.85%,Kappa 系數(shù)均值均大于0.84;其中,精度最高的為方案S5(SPEC+GLCM+INDE),其總體精度均值為92.75%,Kappa 系數(shù)均值為0.92;精度最低的是方案S7(SPEC+INDE+GEOM),其總體精度均值為85.85%,Kappa 系數(shù)均值為0.84。通過比較不同方案的總體精度可知,幾何特征的引入將會(huì)使分類精度出現(xiàn)不同程度的下降,例如S4(SPEC+GEOM)比S1(SPEC)降低了0.58%,S7 比S3(SPEC+INDE)下降了3.93%;而紋理特征和指數(shù)特征的引入則正好相反,例如S5(SPEC+GLCM+INDE)比S2(SPEC+GLCM)提高了2.60%,S6(SPEC+GLCM+GEOM)比S4(SPEC+GEOM)提高了1.69%。由上可知,不同特征對于分類精度的影響存在差異,其中幾何特征表現(xiàn)為負(fù)向影響,而指數(shù)特征和紋理特征則相反。
圖6 不同方案分類精度Fig. 6 Classification accuracy of different schemes
2.2.2 生產(chǎn)者精度與用戶精度 通過對比可知(圖7和8),非蔬菜地物的生產(chǎn)者精度與用戶精度都很高(大多接近100%),而大部分蔬菜的生產(chǎn)者精度與用戶精度都較高(大多>80%),但白菜和包菜這2 種蔬菜精度則相對較低,低于80%,尤其是白菜,在方案S2 和S4 中的生產(chǎn)者精度分別為(70.0±2.0)%和(66.3±2.1)%,顯著低于其他蔬菜,而包菜的生產(chǎn)者精度雖然略高于白菜,但其在不同方案中的生產(chǎn)者精度也大多低于80%,與其他類別蔬菜的精度仍存在差距。同種蔬菜在不同方案中的分類精度也存在差異,方案S5 的精度相對較高,如芥菜和油麥菜在所有分類方案中都是方案S5 的精度最高,其生產(chǎn)者精度分別為100%和(97.4±0.8)%,且蔥、花椰菜和生菜的用戶精度都高于90%,明顯高于其他方案。而包含幾何特征集的方案其精度相對較低,尤其是方案S4,其生產(chǎn)者精度顯著低于其他方案,如白菜、包菜及芥菜都是方案S4的生產(chǎn)者精度最低,尤其是芥菜,其方案S4的生產(chǎn)者精度僅為79.6%±2.6%,遠(yuǎn)遠(yuǎn)低于其他方案。
圖7 不同蔬菜類別不同方案生產(chǎn)者精度Fig. 7 Producer accuracy of different schemes for different vegetable categories
圖8 不同蔬菜類別不同方案用戶精度Fig. 8 User accuracy of different schemes for different vegetable categories
不同分類方案特征重要性排序結(jié)果如圖9 所示,其中S1 方案僅有的12 個(gè)特征全部顯示,其他方案則顯示前20 個(gè)。從圖9 可知,不同分類方案的特征排序存在差異。前20 個(gè)最重要特征中大多為光譜特征與指數(shù)特征,只有個(gè)別方案中出現(xiàn)紋理特征與幾何特征。除方案S2、S6 和S7 以外,所有方案前10 個(gè)最重要特征均為光譜特征與指數(shù)特征,其中方案S1 和S4 前10 個(gè)最重要特征均為光譜特征,S2 和S6 前10 個(gè)最重要特征中光譜特征占9 個(gè),可見在不同分類方案中光譜特征對于分類結(jié)果均起著重要作用。除光譜特征外,指數(shù)特征也非常重要,方案S3、S5、S7 和S8 前10 個(gè)最重要特征中比例最高的均是指數(shù)特征,且其排名也比較靠前。從前10 個(gè)最重要特征來看,光譜特征和指數(shù)特征的重要性差別不大,但從前5 個(gè)最重要特征中可發(fā)現(xiàn)光譜特征的重要性高于指數(shù)特征。方案S1、S2、S4 和S6 的前5 個(gè)都為光譜特征,方案S3、S7和S8的前5個(gè)中第1、3、5個(gè)都為光譜特征,光譜特征不論從數(shù)量上還是排序位置上都要優(yōu)于指數(shù)特征。在最佳分類方案S5中,前20個(gè)最重要特征中有8 個(gè)光譜特征、10 個(gè)指數(shù)特征和2 個(gè)幾何特征,光譜特征與指數(shù)特征仍占主導(dǎo),而紋理特征和幾何特征的作用則居次要位置。另外,由最重要特征排序圖可知,對于具體的特征而言,方案S1~S8 中排在第1 位的都是藍(lán)波段均值(Mean_B),而排在第2 位的為綠波段均值(Mean_G)或MSWI均值,但在方案S3中同時(shí)存在光譜特征與指數(shù)特征時(shí),排第2 位的為MSWI 均值,故MSWI 均值重要性高于綠波段均值??傮w而言,在光譜特征中波段均值的重要性排名高于最大差異(Max_diff),而波段方差和總體亮度值重要性排名要稍后于波段均值。
圖9 不同方案前20個(gè)最重要特征排序圖Fig. 9 The twenty most important features for different models
基于最佳方案S5 預(yù)測生成的研究區(qū)分類結(jié)果如圖10 所示,總體來說不同地物分類結(jié)果與實(shí)際情況比較一致。但白菜和包菜的錯(cuò)分情況較多,尤其是白菜,少許白菜被錯(cuò)分為生菜和包菜,也有相當(dāng)一部分番薯被錯(cuò)分為白菜;除白菜外,蔥的錯(cuò)分情況也較多,大多發(fā)生在蔬菜種植邊緣區(qū)域以及混植區(qū)域。從整體來看,菜地邊緣區(qū)域及蔬菜混植區(qū)域?yàn)殄e(cuò)分漏分頻發(fā)區(qū),而菜地中央?yún)^(qū)域錯(cuò)分情況較少,可能是邊緣區(qū)域存在較明顯的不同地物混雜現(xiàn)象,且邊緣區(qū)域影像質(zhì)量欠佳,導(dǎo)致像元純凈度相對較低,從而降低了分類精度。由于影像中大多蔬菜都處于生長期和成熟期,而幼苗期的蔬菜數(shù)量較少,訓(xùn)練樣本相對較少,故處于生長期和成熟期的蔬菜分類精度更高,本研究也更適合生長期及成熟期蔬菜。
圖10 基于最佳方案的分類結(jié)果Fig. 10 Classification result based on the best scheme
本研究表明,不同方案之間分類精度存在較大差異,其中包含光譜、紋理和指數(shù)特征的S5 方案總體精度最高,達(dá)到了92.75%,而包含光譜、指數(shù)和幾何特征的S7 方案總體精度最低,只有85.85%。通過對比發(fā)現(xiàn),引入幾何特征的方案分類精度均出現(xiàn)不同程度下降,說明幾何特征對于分類精度呈負(fù)向影響,這一點(diǎn)在劉舒等[9]使用超高空間分辨率影像進(jìn)行土地分類的研究中也有體現(xiàn),在光譜和指數(shù)特征構(gòu)成的數(shù)據(jù)集中引入幾何特征后總體精度由97.35%降到了96.93%。幾何特征包含面積、周長、寬度等幾何信息,這些信息一般更適用于城市空間以及地形方面的分類研究[18],而對蔬菜的識(shí)別不僅幫助不大,反而會(huì)因增加了特征數(shù)使得計(jì)算過程復(fù)雜化,導(dǎo)致處理速度和精度同時(shí)受到影響[19]。除了特征集選取外,分割尺度也是影響分類精度的重要因素。本研究使用手動(dòng)試錯(cuò)法得到的較優(yōu)分割尺度區(qū)間為100~300,但更精確的分割尺度難以通過目視解譯法得出,因而為了提高分類精度,后續(xù)研究有必要采用自動(dòng)確定分割尺度的方法,如采用ESP2工具[9]。
本研究顯示,不同類別蔬菜的精度存在差異,其中白菜和包菜的生產(chǎn)者精度相對較低。原因是這2 種蔬菜在形態(tài)、顏色等方面均較為相似,分類方案中引入的光譜、指數(shù)和紋理特征所起的作用還比較有限,因此后續(xù)研究應(yīng)考慮植株高度等其他特征。蔥、芥菜、番薯和油麥菜這4 種蔬菜的生產(chǎn)者精度較高,說明在本次分類方案中所選的特征能有效識(shí)別它們。非蔬菜地物(土壤、水體和地膜)的分類精度都很高,大多接近100%,總體上遠(yuǎn)高于蔬菜。究其原因主要有2 點(diǎn):一是樣本選擇,相對于蔬菜而言,非蔬菜地物的形態(tài)特征比較明顯,易于目視識(shí)別,且其分布較為集中,在進(jìn)行樣本選擇時(shí)不易被誤選為其他地物;二是地物本身特性,不同種蔬菜之間的光譜反射曲線差異較小,容易混淆,而非蔬菜地物的光譜反射曲線不僅彼此之間存在一定差異,且與蔬菜類別也有較大差別,再加上它們外部形態(tài)的較大差異,故不論僅基于光譜特征,還是加入指數(shù)、紋理等特征的分類方案,非蔬菜地物的可分性都較高,有著較高的分類精度。
本研究中對于蔬菜識(shí)別最重要的特征為光譜特征,其次為指數(shù)特征,紋理特征和幾何特征的作用相對次要,尤其是幾何特征,不僅在特征重要性排序中位置靠后,而且結(jié)果顯示多個(gè)方案都因幾何特征的引入使得分類總體精度出現(xiàn)一定程度的降低。夏盈等[20]的研究也取得了相似的結(jié)果,即在所有特征中重要性排在最前面的是光譜特征。本研究在光譜和指數(shù)特征基礎(chǔ)上加入紋理和幾何特征是為了加大影像信息量,得到更高的分類精度,然而分類結(jié)果顯示基于所有特征的方案S8 反而比基于部分特征的方案S5 精度低,Nguyen 等[21]的研究也發(fā)現(xiàn)了類似現(xiàn)象,只使用8 個(gè)最重要變量的精度比使用所有變量的略高,表明并不是數(shù)據(jù)集包含的特征數(shù)越多,精度就會(huì)越高。研究表明,當(dāng)使用少量特征時(shí),新特征的引入會(huì)使地物的可分性顯著增加,而當(dāng)特征數(shù)達(dá)到一定數(shù)量后再繼續(xù)加入特征,地物的可分性只有細(xì)微提升,特別當(dāng)達(dá)到飽和點(diǎn)后,總體精度不僅不會(huì)進(jìn)一步提升,反而有可能出現(xiàn)降低的情況[22]。過多的特征數(shù)量會(huì)導(dǎo)致模型冗余信息增多,使得運(yùn)行效率降低,進(jìn)而影響分類性能,而隨機(jī)森林的優(yōu)勢在于它能計(jì)算輸入特征的重要性,根據(jù)重要性排名構(gòu)建較優(yōu)方案,從而提高分類精度。研究發(fā)現(xiàn),在分類中使用隨機(jī)森林計(jì)算特征重要性,在減少80%不重要特征后得到了最高的Kappa 系數(shù)[23],另外比較隨機(jī)森林和Adaboost算法的運(yùn)行速度和運(yùn)行穩(wěn)定性后發(fā)現(xiàn)隨機(jī)森林更勝一籌[24]。不論是從分類結(jié)果還是運(yùn)行效率上來說,隨機(jī)森林都表現(xiàn)得更加出色,表明隨機(jī)森林對于處理多維或高維特征數(shù)據(jù)具有較大優(yōu)勢,它能夠識(shí)別特征重要性程度進(jìn)而幫助優(yōu)化方案,從而獲得更高的分類精度。
本文提出了一種基于無人機(jī)多光譜影像的蔬菜識(shí)別方法,主要通過提取影像光譜、指數(shù)、紋理和幾何特征,結(jié)合面向?qū)ο蠛碗S機(jī)森林算法來實(shí)現(xiàn)蔬菜識(shí)別,不足之處在于分割尺度的確定主要采用手動(dòng)試錯(cuò)法,主觀性較強(qiáng)且自動(dòng)化程度較低;白菜和包菜的生產(chǎn)者精度明顯低于其他類別,在后續(xù)研究中將進(jìn)一步探討能高精度識(shí)別白菜和包菜的試驗(yàn)方案(如引入植株高度等信息),以期得到精度更高的蔬菜識(shí)別方法,為實(shí)現(xiàn)蔬菜智能化管理奠定基礎(chǔ)。