虞佳佳 姬旭升 李曉麗
(1.浙江機(jī)電職業(yè)技術(shù)學(xué)院, 杭州 310053; 2.浙江大學(xué)生物系統(tǒng)工程與食品科學(xué)學(xué)院, 杭州 310058;3.浙江大學(xué)數(shù)字農(nóng)業(yè)與農(nóng)村信息化研究中心, 杭州 310058)
葉片是植物體最重要的營(yíng)養(yǎng)器官之一,它在光合、呼吸、蒸騰以及碳和養(yǎng)分循環(huán)等生理過(guò)程中發(fā)揮著決定性作用。以葉長(zhǎng)、葉寬和葉面積為代表的作物表型信息往往與品種和基因型密切相關(guān),此外抗病品種的篩選常以作物葉片感病程度為重要依據(jù)[1-2],以上葉片表型性狀的獲取又均以葉片形態(tài)和面積的準(zhǔn)確提取為前提,因此準(zhǔn)確、快速地獲取葉片形態(tài)和面積,對(duì)作物養(yǎng)分估測(cè)及新品種篩選均具有重要意義[3-4]。傳統(tǒng)葉片表型信息獲取均通過(guò)手動(dòng)測(cè)量的方式完成,此類(lèi)方法耗時(shí)費(fèi)力,且易受主觀因素的影響,已不能滿足現(xiàn)代作物性狀調(diào)查和表型組學(xué)研究的現(xiàn)實(shí)需求,因此尋找一種高效、準(zhǔn)確、自動(dòng)化的作物葉片提取方法,對(duì)未來(lái)大范圍的葉片表型信息調(diào)查、葉片尺度的養(yǎng)分估測(cè)及抗病新品種的篩選都大有裨益?;赗GB、多光譜或高光譜相機(jī)的近地面和低空遙感平臺(tái)作為一種新型的作物表型信息調(diào)查手段,具有靈活性高、可操作性強(qiáng)、探測(cè)效果好、成本低廉的特點(diǎn),現(xiàn)已廣泛應(yīng)用于作物病害早期監(jiān)測(cè)[5-6]、葉片尺度養(yǎng)分估測(cè)[7-9]等諸多領(lǐng)域,它們的出現(xiàn)為快速、準(zhǔn)確、實(shí)時(shí)地提取作物葉片提供了解決思路。
目前,基于近地面遙感影像的作物葉片提取主要通過(guò)閾值分割的方法(Threshold-based)來(lái)完成,大津法(OTSU)[10]、固定閾值(Fixed thresholds)[11]、直方圖熵(Histogram entropy)[12]等算法先后被應(yīng)用到此領(lǐng)域;有些學(xué)者通過(guò)加入歸一化植被指數(shù)(Normalized difference vegetation index,NDVI)[13]、過(guò)綠指數(shù)(Excess green index,ExG)等植被指數(shù)[14]來(lái)進(jìn)一步改進(jìn)閾值法的性能,取得了較好的應(yīng)用效果。此類(lèi)方法操作簡(jiǎn)便、影像處理效率高、結(jié)果較為準(zhǔn)確,但是常規(guī)閾值往往通過(guò)試錯(cuò)法確定,該過(guò)程需要大量的人機(jī)交互,加之閾值法自身性能的限制,使其在處理較大影像數(shù)據(jù)集時(shí),呈現(xiàn)出模型穩(wěn)定性不高、泛化能力弱、葉片邊緣定位不準(zhǔn)的劣勢(shì)。隨著計(jì)算機(jī)視覺(jué)技術(shù)的發(fā)展,基于分水嶺(Watershed)、標(biāo)記分水嶺(Marker-watershed)等數(shù)學(xué)形態(tài)學(xué)分割算法的葉片提取研究開(kāi)始出現(xiàn),這些探索不僅考慮了葉片邊緣的梯度變化信息,而且還加入了像素的空間分布特征,從而促進(jìn)了該領(lǐng)域的進(jìn)一步發(fā)展[15-16]。盡管此類(lèi)算法較閾值分割有了明顯進(jìn)步,但該過(guò)程依然需要一定的人機(jī)交互,且葉片提取精度易受遙感影像光照強(qiáng)度分布不均的影響,這對(duì)大規(guī)模、自動(dòng)化、高精度地葉片提取極為不利??紤]到監(jiān)督或非監(jiān)督機(jī)器學(xué)習(xí)算法在對(duì)象識(shí)別方面所表現(xiàn)出的巨大潛力,部分學(xué)者開(kāi)始嘗試運(yùn)用模糊聚類(lèi)(Fuzzy cluster)、均值漂移(Mean shift)、支持向量機(jī)(Support vector machine,SVM)等算法進(jìn)行作物葉片的提取,為作物葉片的快速提取提供了解決方案[17]。研究表明監(jiān)督學(xué)習(xí)算法的對(duì)象識(shí)別性能明顯優(yōu)于非監(jiān)督算法,但前者的實(shí)現(xiàn)必須依賴一定數(shù)量的訓(xùn)練樣本,使得此類(lèi)算法的自動(dòng)化性能受到了嚴(yán)重制約。近年來(lái),伴隨著大數(shù)據(jù)和人工智能技術(shù)的快速發(fā)展,相關(guān)學(xué)者開(kāi)始探索深度學(xué)習(xí)算法在作物葉片自動(dòng)化提取方面的應(yīng)用潛力,以LeafMASK為代表的植物葉片自動(dòng)化提取算法將該領(lǐng)域的相關(guān)研究提升到了一個(gè)新的高度[18]。深度學(xué)習(xí)算法的實(shí)現(xiàn)需立足于大量的影像數(shù)據(jù)和繁瑣人工標(biāo)記,還需占用大量的計(jì)算資源,使其在處理高維度葉片影像時(shí)常常具有較低的性價(jià)比。
長(zhǎng)期以來(lái),作物葉片提取的相關(guān)研究均將此類(lèi)問(wèn)題納入到計(jì)算機(jī)視覺(jué)的范疇,其目的只針對(duì)葉片提取和計(jì)數(shù)本身,但是作物葉片提取之后的養(yǎng)分、色素等生理生化指標(biāo)反演以及感病程度估算等植物和育種學(xué)家最為關(guān)注的核心問(wèn)題幾乎被選擇性忽略,致使現(xiàn)存的大多數(shù)植物葉片提取方法均以RGB影像為基本數(shù)據(jù)源[19]。因?yàn)镽GB影像自身具有較低的特征維度,所以針對(duì)此類(lèi)影像的葉片提取算法在處理高光譜等具有較高特征維度的影像時(shí),時(shí)常被“信息爆炸”的問(wèn)題所困擾,拖慢了影像處理速度,降低了方法的效率,這種問(wèn)題在基于深度學(xué)習(xí)的高光譜影像作物葉片提取研究中表現(xiàn)尤為明顯[13]。除此之外,先前的研究大多僅聚焦于算法的性能,缺乏對(duì)輸入特征的探究和深入分析,這對(duì)摸清植物葉片提取的內(nèi)部機(jī)理,進(jìn)一步提高作物葉片提取的效果和效率都極為不利[20]。從植物和育種學(xué)家的角度出發(fā),基于遙感影像的作物葉片提取是為后續(xù)葉片尺度的生理生化指標(biāo)反演和感病程度定量評(píng)估服務(wù)。作為一個(gè)影像處理的初始步驟,不應(yīng)投入過(guò)多的人力和計(jì)算資源,輸入少量的相關(guān)特征,在無(wú)人機(jī)交互的前提下,快速、準(zhǔn)確地提取出作物葉片才是該問(wèn)題的最優(yōu)解[21]。因此,開(kāi)發(fā)一種簡(jiǎn)單、快速、準(zhǔn)確、自動(dòng)化的作物葉片提取方法,對(duì)該問(wèn)題的本身及后續(xù)葉片尺度的生理生化指標(biāo)反演和感病程度精確評(píng)估均具有重要的意義。
本文立足于農(nóng)作物葉片提取算法現(xiàn)有的研究進(jìn)展,針對(duì)農(nóng)作物葉片提取的現(xiàn)實(shí)需求,以室內(nèi)高光譜影像以及其模擬的多光譜影像為基礎(chǔ)數(shù)據(jù)源,深入探究常用植被指數(shù)在葉片提取中的作用;并以此為基礎(chǔ),通過(guò)融合圖像分割、邊緣檢測(cè)、基于梯度的斷點(diǎn)連接等算法的優(yōu)勢(shì),以期提出一種快速、準(zhǔn)確、不需人機(jī)交互的作物葉片自動(dòng)提取方法。
在野外試驗(yàn)小區(qū)采集大量被病菌侵染的番茄葉片和茶葉葉片,然后立即轉(zhuǎn)運(yùn)至實(shí)驗(yàn)室內(nèi),通過(guò)室內(nèi)高光譜植物表型平臺(tái)(圖1)采集所需高光譜影像。該平臺(tái)由控制終端、交互式操作界面、光譜儀、暗箱、線光源、高度調(diào)整軸、移動(dòng)平臺(tái)等部分構(gòu)成,其中可見(jiàn)近紅外高光譜成像儀的型號(hào)為V10E(Specim,芬蘭)。該儀器光譜分辨率2.8 nm,光譜采樣間隔為0.65 nm,可一次性采集波長(zhǎng)400~1 000 nm之間512個(gè)通道的光譜影像,其高光譜影像的成像模式為推掃式。
圖1 室內(nèi)高光譜植物表型平臺(tái)Fig.1 Indoor hyperspectral plant phenotyping platform1.光譜儀 2.樣品 3.電源
在采集影像時(shí),分別將獲取到的樣品平放于移動(dòng)平臺(tái)之上,隨后設(shè)置合適的曝光時(shí)間和線掃描速度,在進(jìn)行標(biāo)準(zhǔn)白場(chǎng)校正和暗場(chǎng)校正之后即可采集波長(zhǎng)范圍為400~1 000 nm的高質(zhì)量光譜影像。高光譜圖像采集軟件為Spectral Image-V10E(ISUZU OPTICS)[22]??紤]到多光譜相機(jī)具有更大的應(yīng)用潛力及更高的性價(jià)比,且著眼于進(jìn)一步增加本文算法普適性,利用所采集到的高光譜影像對(duì)廣泛應(yīng)用的Airphen(Hiphen,法國(guó))[23]、Sequoia(Parrot,法國(guó))[24]、RedEdge-MX(Micasense,美國(guó))[25]多光譜影像進(jìn)行模擬,以進(jìn)一步明確本文算法對(duì)多種數(shù)據(jù)源的適用性。該模擬過(guò)程通過(guò)軟件ENVI 5.3(Exelis Visual Information Solutions, Boulder, 美國(guó))實(shí)現(xiàn),運(yùn)用ENVI軟件對(duì)原始高光譜影像進(jìn)行重采樣,保持其他參數(shù)不變,僅保留各多光譜相機(jī)所對(duì)應(yīng)波段信息,最終獲得高質(zhì)量的多光譜影像數(shù)據(jù)集。共獲得4組共320個(gè)(80×4)葉片及葉片分支影像集,每組包括729個(gè)葉片。本研究所涉及的高光譜及模擬多光譜影像的基本情況如表1所示。
表1 獲取或模擬的高/多光譜影像Tab.1 Acquired or simulated multispectral and hyperspectral images of crop leaves
本研究作物葉片實(shí)測(cè)數(shù)據(jù)通過(guò)目視解譯的方式獲取。將獲取到的高光譜影像分別導(dǎo)入到ENVI軟件之中,在遙感專(zhuān)家的協(xié)助下,運(yùn)用Vector模塊,沿葉片邊緣分別對(duì)各葉片進(jìn)行矢量化轉(zhuǎn)換,得到每幅影像所對(duì)應(yīng)的葉片多邊形,即Shapefile文件。此類(lèi)文件可以精確地記錄葉片邊緣位置,并計(jì)算葉片面積。在獲取到Shapefile文件之后,利用ENVI ROI工具將實(shí)測(cè)葉片數(shù)據(jù)轉(zhuǎn)換為ENVI classification格式,并以TIF影像的格式保存,備用。最終獲取到葉片邊緣定位誤差不超過(guò)一個(gè)像素的高質(zhì)量真實(shí)葉片影像集。
圖2為技術(shù)路線圖,該作物葉片提取方法主要包括以下步驟:①光譜特征轉(zhuǎn)換及篩選。選用代表性植被指數(shù)進(jìn)行特征轉(zhuǎn)換和壓縮,篩選出合適的光譜指數(shù)特征層。②特征影像分割及邊緣檢測(cè)。分割特征影像,并對(duì)特征影像進(jìn)行邊緣檢測(cè),綜合以上兩種結(jié)果,得到作物葉片邊緣特征。③葉片邊緣斷點(diǎn)連接。通過(guò)邊緣強(qiáng)度圖對(duì)作物葉片邊緣進(jìn)行重連,得到完全閉合的作物葉片邊緣。④邊緣填充及形態(tài)學(xué)后處理。對(duì)得到的作物葉片閉合邊緣進(jìn)行填充,運(yùn)用形態(tài)學(xué)方法去除噪聲,最終獲得精確的作物葉片前景影像。
圖2 作物葉片像素提取流程圖Fig.2 Flowchart of crop leaves pixels extraction
光譜指數(shù)是目前最常用的高光譜或多光譜數(shù)據(jù)轉(zhuǎn)換方法。光譜指數(shù)包括單波譜及其變換形式、歸一化光譜指數(shù)及其變換形式、比值光譜指數(shù)及其變換形式、多波段光譜指數(shù)4種類(lèi)型。為了大幅度壓縮高光譜和多光譜影像的特征維度,提高所構(gòu)建算法的運(yùn)算效率,且最大程度地增強(qiáng)葉片光譜信號(hào),抑制各類(lèi)背景特征,選用NDVI、GNDVI(Green normalized difference vegetation index)[26]、EVI(Enhance vegetation index)[27]、NDRE(Normalized difference red edge index)[28]和CIred-edge(Red edge chlorophyll index)[29]這5種較具代表性的植被指數(shù)對(duì)原始光譜影像進(jìn)行特征轉(zhuǎn)換,在提高數(shù)據(jù)一致性的同時(shí)深入分析各個(gè)特征波段對(duì)作物葉片像素提取的影響。該特征轉(zhuǎn)換過(guò)程均以原始高光譜影像為輸入層。需要強(qiáng)調(diào)的是,因?yàn)樵摬糠值哪康氖峭ㄟ^(guò)光譜指數(shù)比較各常用波段在葉片提取中的作用,單一類(lèi)型的光譜指數(shù)即可滿足此類(lèi)需求,所以本部分僅選用歸一化光譜指數(shù)及其變換形式作為光譜特征轉(zhuǎn)換的主要依據(jù)。
NDVI是植被遙感領(lǐng)域應(yīng)用最為廣泛的植被指數(shù),它可以有效地整合近紅外和紅光波段的光譜信息,增強(qiáng)圖像中植被特征,抑制非植被特征;并且它還可以很好地反映植被覆蓋度及植被的生長(zhǎng)狀態(tài)[30]。與NDVI作用類(lèi)似,GNDVI可以較好地反映植被信息,但因該指數(shù)中加入了綠波段的光譜特征,使得該指數(shù)可以更好地捕獲光合作用,從而對(duì)葉綠素更敏感[26]。EVI為NDVI的優(yōu)化指數(shù),它可以穩(wěn)定植被特征,減弱土壤和大氣因素的影響[27]。紅邊波段為植被所特有,它與植被生長(zhǎng)狀態(tài)、葉片結(jié)構(gòu)和生理生化參量息息相關(guān),使得NDRE和CIred-edge可以精確地反映植物葉片色素等成分的空間分布情況[28-29]。在系統(tǒng)性分析各指數(shù)在植物葉片提取中的作用之后,選取兩個(gè)最優(yōu)的指數(shù)作為后續(xù)算法的輸入變量。
在進(jìn)行光譜特征轉(zhuǎn)換之后,選取葉片與背景分離度最大的特征層作為局部自適應(yīng)閾值分割(Local adaptive thresholding segmentation,ATS)算法的輸入層來(lái)進(jìn)行葉片前景特征和非植被背景特征的分離。ATS是進(jìn)行圖像分割的一種有效算法[31-32],它可以將所輸入的特征影像分為若干個(gè)區(qū)塊,僅從局部像素確定最優(yōu)分割閾值。該算法的最大優(yōu)勢(shì)在于圖像分割過(guò)程中產(chǎn)生的二值化閾值不是固定不變的,不同區(qū)塊內(nèi)的最適閾值隨著區(qū)塊內(nèi)灰度的分布情況也會(huì)發(fā)生一定改變,使得該算法對(duì)光照不均勻的影像有著極佳的分割效果。由于大部分分割算法均存在邊緣定位不準(zhǔn)的弊端,所以在進(jìn)行閾值分割的同時(shí),通過(guò)Canny算子對(duì)選定的2個(gè)特征層中葉片邊緣較為清晰的特征層進(jìn)行邊緣檢測(cè),獲取影像中各對(duì)象的邊緣信息。在此基礎(chǔ)上,將葉片前景特征和對(duì)象的邊緣信息融合,以最大限度地消除非葉片邊緣特征對(duì)后續(xù)步驟的影響,最終僅獲取到準(zhǔn)確的作物葉片邊緣特征。
由于邊緣檢測(cè)算法自身性能的限制,植物葉片邊緣提取易受噪聲的干擾,使得所獲得的葉片邊緣往往不能閉合。本研究選用基于邊緣強(qiáng)度圖[33]的斷點(diǎn)連接策略,對(duì)葉片的真實(shí)邊界進(jìn)行還原,從而獲取到完全閉合的作物葉片邊界。從本質(zhì)上講葉片邊緣即為葉片像元與背景像元之間的光譜躍變區(qū),即邊緣強(qiáng)度圖在躍變區(qū)的局部最大值,通過(guò)開(kāi)發(fā)自動(dòng)化算法對(duì)邊緣斷點(diǎn)進(jìn)行捕獲,并以此為基礎(chǔ)獲取邊緣強(qiáng)度圖在躍變區(qū)的局部最大值,使邊緣斷點(diǎn)沿葉片邊緣真實(shí)的延伸方向增長(zhǎng),直至葉片邊緣斷點(diǎn)完全閉合為止。該策略可以克服腐蝕、膨脹等常規(guī)斷點(diǎn)延伸方法邊緣定位不準(zhǔn)的弊端,使最終所得到的作物葉片閉合邊緣可以最大程度地接近其實(shí)際像素。此后對(duì)植物葉片閉合邊緣進(jìn)行填充,再經(jīng)過(guò)數(shù)學(xué)形態(tài)學(xué)后處理,即可得到精確的作物葉片前景影像。
2.4.1葉片提取精度評(píng)價(jià)
目前,圖像分割的評(píng)價(jià)方法可分為:目視解譯、系統(tǒng)性評(píng)估、實(shí)例檢驗(yàn)、差異化驗(yàn)證4種[34]。其中,目視解譯最為常用,該方法雖可對(duì)分割結(jié)果進(jìn)行定性評(píng)價(jià),但也存在易受主觀因素干擾的弊端[35];相較而言,差異化驗(yàn)證對(duì)分割結(jié)果的驗(yàn)證最有效,它可以對(duì)分割結(jié)果的誤差進(jìn)行量化描述[36]。為了客觀、準(zhǔn)確地評(píng)價(jià)葉片提取精度,選用目視解譯和差異化驗(yàn)證相結(jié)合的方法對(duì)葉片提取的結(jié)果進(jìn)行系統(tǒng)化分析,其中選定的差異化驗(yàn)證的指標(biāo)包括準(zhǔn)確度(Precision)、召回率(Recall)、Dice系數(shù)、杰卡德相似系數(shù)(Jaccard)、曼哈頓距離(Manhanttan)5種,以便與現(xiàn)有研究進(jìn)行橫向?qū)Ρ取?/p>
2.4.2與現(xiàn)有經(jīng)典葉片提取方法對(duì)比
選取大津法(OTSU)、標(biāo)記分水嶺(Marked-watershed)和隨機(jī)森林(Random forests, RF)3種經(jīng)典算法作為對(duì)照,以5種指標(biāo)為依托,深入分析所涉及的4種算法在提取精度等方面的差異,明確本算法的優(yōu)缺點(diǎn),為該算法的進(jìn)一步完善提供理論依據(jù)。
為了對(duì)選定植被指數(shù)的葉片光譜特征增強(qiáng)效果進(jìn)行客觀比較,對(duì)所獲取的5種指數(shù)分別進(jìn)行線性拉伸,將它們的量綱統(tǒng)一轉(zhuǎn)換為1,以提高所涉及數(shù)據(jù)的一致性。圖3展示了任意5組作物葉片(其中番茄葉片2組,茶葉葉片3組)在5種不同植被指數(shù)(NDVI、GNDVI、EVI、NDRE、CIred-edge)空間中的特征強(qiáng)度分布狀況。通過(guò)目視解譯可知,NDVI對(duì)葉片信息有非常顯著的增強(qiáng)效果,但該指數(shù)對(duì)背景的抑制能力相對(duì)較弱,這種弱化的能力在葉片邊緣和陰影像素處較為顯著。GNDVI也可以突出葉片特征,但該指數(shù)對(duì)各類(lèi)背景信息也較為敏感,在增強(qiáng)葉片光譜特征的同時(shí)也會(huì)對(duì)各類(lèi)非植被背景信息的細(xì)節(jié)進(jìn)行有效地刻畫(huà);雖然該指數(shù)的能力有限,但對(duì)陰影和光暈的敏感性卻相對(duì)較低,使得基于該指數(shù)的葉片邊緣特征較為突出。EVI可對(duì)葉片光譜特征進(jìn)行大幅度增強(qiáng),同時(shí)還可對(duì)背景信息進(jìn)行有效地抑制,這種特征增強(qiáng)的有效性在處理葉片邊緣混合像素和陰影處像素時(shí)體現(xiàn)的尤為突出;該指數(shù)可以在增強(qiáng)葉片光譜特征和抑制背景信息之間達(dá)到有效的平衡。相較于基于近紅外波段的植被指數(shù),所選定的2種基于紅邊波段的植被指數(shù)NDRE和CIred-edge不能對(duì)葉片光譜特征進(jìn)行增強(qiáng),也不能對(duì)非植被背景特征進(jìn)行抑制,但此類(lèi)指數(shù)可以有效地捕獲葉片內(nèi)部的光譜變異(如作物病斑)。以上特征在不同作物(番茄和茶葉)及不同葉片組間所呈現(xiàn)出的規(guī)律基本一致,所以最終選取EVI(擁有藍(lán)波段)或NDVI(缺失藍(lán)波段)作為后續(xù)步驟的輸入層。
圖3 特定影像中5種植被指數(shù)的空間分布圖Fig.3 Spatial distributions of different vegetation indexes in selected hyperspectral or multispectral image
表2為本文方法、大津法(OTSU)、標(biāo)記分水嶺(Marker-watershed)、隨機(jī)森林(RF)這4種方法對(duì)2類(lèi)作物葉片數(shù)據(jù)集的平均提取精度。從所涉及算法的提取精度來(lái)看,除準(zhǔn)確度外,本文方法的各項(xiàng)評(píng)價(jià)指標(biāo)均有最優(yōu)的表現(xiàn),召回率、Dice系數(shù)、曼哈頓距離、杰卡德相似系數(shù)分別高達(dá)0.964 9~0.966 7、0.972 1~0.982 0、0.982 8~0.992 4、0.945 8~0.964 7,且包括準(zhǔn)確率(0.979 9~0.997 8)在內(nèi)的葉片像素提取精度均在0.95以上;以上評(píng)價(jià)指標(biāo)較其它3種方法分別提高了2%~700%,葉片像素提取效果得到了顯著改善。本文算法對(duì)不同的作物葉片和葉片背景均有較強(qiáng)的適應(yīng)性,番茄葉片和茶葉葉片所對(duì)應(yīng)的5個(gè)評(píng)價(jià)指標(biāo)均保持在較高的水平,且2組數(shù)據(jù)(番茄葉片提取平均精度和茶葉葉片提取平均精度)之間不存在顯著性差異。在另外3種葉片提取方法中,RF這種監(jiān)督算法也有較好的表現(xiàn),其各項(xiàng)指標(biāo)較經(jīng)典的無(wú)監(jiān)督OTSU方法分別提高了50%~600%,部分?jǐn)?shù)據(jù)集的各項(xiàng)指標(biāo)可穩(wěn)定在0.91以上;然而此種算法對(duì)番茄和茶葉葉片這2種不同數(shù)據(jù)集的提取精度呈現(xiàn)出一定差異,算法的遷移性相對(duì)較弱。在以上4種算法中,經(jīng)典的OTSU算法性能最差,茶葉葉片的各項(xiàng)評(píng)價(jià)指標(biāo)僅為0.09~0.39;且該方法對(duì)不同的數(shù)據(jù)集的適應(yīng)能力極弱,番茄葉片(準(zhǔn)確度、召回率、Dice系數(shù)、曼哈頓距離、杰卡德相似系數(shù)分別為0.981 0、0.630 6、0.766 2、0.825 1、0.623 0)和茶葉葉片(準(zhǔn)確度、召回率、Dice系數(shù)、曼哈頓距離、杰卡德相似系數(shù)分別為0.271 2、0.120 3、0.166 8、0.384 6、0.091 5)的識(shí)別效果之間差異巨大。
表2 不同方法的葉片提取平均精度及運(yùn)算效率Tab.2 Comparison of proposed method with typical methods in all hyperspectral image
圖4展示了4種不同方法對(duì)隨機(jī)選取的5組作物葉片(其中番茄葉片2組,茶葉葉片3組)的提取效果。從圖4可以看出,基于不同方法和不同作物/數(shù)據(jù)集的葉片提取效果呈現(xiàn)出較大的差異。通過(guò)目視解譯可知,本文方法所提取的作物葉片邊緣準(zhǔn)確、清晰,形態(tài)完整,其與背景像素分離準(zhǔn)確。此算法對(duì)番茄和茶葉兩類(lèi)作物葉片數(shù)據(jù)集均有較強(qiáng)的適應(yīng)性,葉片像素提取效果較好。相較而言,RF算法的表現(xiàn)雖優(yōu)于Marker-watershed和OTSU算法,且可對(duì)部分?jǐn)?shù)據(jù)(番茄葉片數(shù)據(jù)集)中的葉片像素及其邊緣進(jìn)行準(zhǔn)確捕獲,但這種能力在不同數(shù)據(jù)集(番茄和茶葉)之間差異較大,方法遷移性稍差,在處理光照不均勻和背景復(fù)雜的葉片時(shí)尤為突出。 Marker-watershed算法雖可對(duì)葉片邊緣進(jìn)行準(zhǔn)確地刻畫(huà),但此類(lèi)算法對(duì)葉片和背景像素的分離能力相對(duì)有限。OTSU對(duì)葉片和背景的識(shí)別能力較弱,在復(fù)雜的背景下該方法基本喪失了對(duì)葉片和背景的區(qū)分能力。
圖5為基于本文算法的4種不同影像集(ImSpector-V10E、Sequoia、Airphen、RedEdge-MX)的作物葉片提取平均精度。雖然以上4種影像集的近紅外波段(NIR)、紅波段(Red)和藍(lán)波段(Blue)的波長(zhǎng)范圍存在一定差異,但從圖5可以看出,除Sequoia影像外,基于其他3類(lèi)影像的葉片提取平均精度之間不存在明顯差異,每類(lèi)影像的準(zhǔn)確度、召回率、Dice系數(shù)、曼哈頓距離、杰卡德相似系數(shù)數(shù)值跨度較小,且均保持在極高的水平(0.947 8~0.989 6),本文算法對(duì)ImSpector-V10E、Airphen、RedEdge-MX這3種影像數(shù)據(jù)集中的葉片和背景像素實(shí)現(xiàn)了準(zhǔn)確分離,葉片像素提取效果良好?;赟equoia影像的作物葉片像素提取雖精確度較高,5個(gè)評(píng)價(jià)指標(biāo)穩(wěn)定在0.92以上(0.922 9~0.975 4),但此類(lèi)影像相較于其他3類(lèi)影像,這5種評(píng)價(jià)指標(biāo)的平均數(shù)值均呈現(xiàn)出一定的下降趨勢(shì),其數(shù)值分別下降了0.85%~3.54%,葉片像素提取效果變差,這種現(xiàn)象在召回率指標(biāo)上體現(xiàn)的尤為明顯。該類(lèi)影像的精確度和召回率之間的跨度較大,其跨度為0.038 7,且曼哈頓距離與杰卡德相似系數(shù)之間的差異呈現(xiàn)出逐漸增大的趨勢(shì),進(jìn)一步說(shuō)明本文算法對(duì)Sequoia影像中的葉片和背景像素的分離能力相較于其它3類(lèi)影像開(kāi)始逐漸減弱,葉片像素提取效果變差。
由于植物葉片內(nèi)部葉綠素、類(lèi)胡蘿卜素等光合色素的存在,使得高光譜或多光譜影像的紅光波段和藍(lán)光波段處呈現(xiàn)出明顯的吸收特征,從而形成反射率波谷;與此同時(shí),由于植物色素對(duì)綠光的低敏感性,使得該波段表現(xiàn)出較為明顯的反射特征,進(jìn)而形成反射峰[37]。植物近紅外波段的光譜特性與植物葉片的內(nèi)部結(jié)構(gòu)息息相關(guān),此處葉片反射率高(45%~50%),透射率高(45%~50%),吸收率低(0~5%)[38]。在可見(jiàn)光和近紅外之間,即“紅邊”波段,植物葉片的反射率會(huì)急劇上升,形成植物最標(biāo)志性的光譜特征,該波段對(duì)葉片內(nèi)部的生理變化極為敏感[39-40]。
本研究所選取的番茄和茶葉2類(lèi)作物葉片性質(zhì)差異較大,具有很強(qiáng)的代表性,尤其是數(shù)據(jù)集中的茶葉葉片具有較厚的角質(zhì)層(蠟質(zhì)層),部分區(qū)域鏡面反射強(qiáng)烈[41],可以在一定程度上模擬光照不均勻的情況。NDVI指數(shù)可以綜合近紅外(NIR)和紅波段(Red)的反射特征,其大小主要取決于兩者之間反射率強(qiáng)度的相對(duì)差異,兩者差異越大NDVI也越大,即使是葉片鏡面反射或光照不均勻區(qū)域也遵循此規(guī)律;考慮到植物葉片紅波段吸收峰的存在,葉片背景與葉片之間的光譜差異在NDVI特征空間中被進(jìn)一步放大,且葉片NDVI顯著高于背景,葉片特征被大幅度增強(qiáng)的同時(shí),非植被背景也被大幅度抑制,并在一定程度上緩解葉片光照的不均勻,降低鏡面反射對(duì)葉片像素的影響,使得該指數(shù)可以適應(yīng)不同類(lèi)型的作物葉片。受散射光的影響,陰影背景處的近紅外反射率顯著降低,致使陰影背景處的NDVI與葉片之間的差異減小,這也是NDVI對(duì)陰影像素較為敏感的一個(gè)重要原因[42]。與前者類(lèi)似,GNDVI也受近紅外波段反射率和綠光波段反射率之間相對(duì)差異的影響,盡管植物葉片綠波段存在反射峰,但其與特定色彩空間中的背景光譜差異較小,使得GNDVI雖可對(duì)作物葉片像素的光譜特征進(jìn)行一定增強(qiáng),但其對(duì)背景光譜的抑制能力相對(duì)有限。EVI在NDVI的基礎(chǔ)之上整合進(jìn)了藍(lán)波段光譜特征,增大了葉片光譜和背景光譜之間的差異,使得前者的信號(hào)更加突出。由于EVI衡量的近紅外、紅、藍(lán)3個(gè)波段反射率的相對(duì)差異,受這3個(gè)波段反射率絕對(duì)數(shù)值的影響不大,使得這種信號(hào)的增強(qiáng)對(duì)不同的作物均有很強(qiáng)的適應(yīng)性。隨著藍(lán)波段的加入,該指數(shù)對(duì)陰影像素的敏感性也進(jìn)一步降低,植物葉片邊緣更加清晰和明顯。與基于近紅外波段的植被指數(shù)不同,基于紅邊的指數(shù)(NDRE、CIred-edge)雖對(duì)葉片內(nèi)部生理變化較為敏感,然而受制于紅邊波段和近紅外波段反射率的相對(duì)差異,加上背景噪聲的影響,使得該指數(shù)對(duì)葉片的增強(qiáng)、背景的抑制效果極差[43]。
葉片像素提取算法的可靠性和可遷移性是衡量其性能的重要指標(biāo)[44],兩者可從葉片的提取精度、算法對(duì)輸入層的要求、超參數(shù)的適應(yīng)性等方面綜合評(píng)判。在本研究中利用4種不同波段、不同波長(zhǎng)、不同長(zhǎng)寬的320組番茄和茶葉葉片(其中番茄120組,茶葉200組)高光譜實(shí)測(cè)和多光譜模擬影像對(duì)本文算法進(jìn)行了系統(tǒng)性測(cè)試,均取得了較好的葉片像素提取效果,這5類(lèi)評(píng)價(jià)指標(biāo)的平均值均在0.92以上,其表現(xiàn)接近或超越最新的監(jiān)督分類(lèi)(Meanshift、Graphcut)、深度學(xué)習(xí)(FCN、GCA)葉片提取算法(表3)[45]。該算法對(duì)于不同類(lèi)型的數(shù)據(jù)集均有較好的適應(yīng)性,葉片像素提取精度較高,究其原因,是因?yàn)楸痉椒▽?duì)原始的光譜特征進(jìn)行了轉(zhuǎn)換和篩選,該過(guò)程不僅大幅度降低了原始影像的特征維度,而且還通過(guò)EVI或NDVI指數(shù)對(duì)葉片光譜特征進(jìn)行了大幅度增強(qiáng),由于這2種植被指數(shù)的分布受波段類(lèi)型影響極大,對(duì)具體波長(zhǎng)敏感性較低[46],加之植被指數(shù)受特定波段反射特征的相對(duì)差異影響極大,與相應(yīng)波段反射率的絕對(duì)數(shù)值關(guān)系較小,因此,該類(lèi)特征具有較高的穩(wěn)定性和可靠性。局部自適應(yīng)閾值分割算法的應(yīng)用也是保證葉片自動(dòng)提取算法可靠、穩(wěn)定的重要原因。此算法對(duì)輸入影像的尺寸無(wú)任何限制,且可適應(yīng)輸入影像光照不均勻的情況;該算法幾乎不存在輸入?yún)?shù)[31,47],使得本文葉片提取算法的有效性和穩(wěn)定性進(jìn)一步增強(qiáng)。盡管該算法在高光譜實(shí)測(cè)和多光譜模擬影像中取得了較好的葉片提取效果,但因本研究是為了方便開(kāi)展后續(xù)葉片尺度的生理生化指標(biāo)反演和感病程度精確評(píng)估,所以該算法在RGB影像上的通用性目前還未加以考慮,使得該方法仍存在較大的改進(jìn)空間。
表3 本文方法與最新葉片提取方法的性能對(duì)比Tab.3 Comparison of proposed method with the latest methods
作物葉片像素提取是開(kāi)展葉片尺度生理生化指標(biāo)反演、感病程度精確評(píng)估等研究的先決條件和決定性步驟[51]。在相當(dāng)長(zhǎng)的一段時(shí)間內(nèi),葉片像素提取的相關(guān)研究都被納入到計(jì)算機(jī)視覺(jué)的范疇[52],標(biāo)記分水嶺(Marker-watershed)、全卷積神經(jīng)網(wǎng)絡(luò)(FCN)、LeafMask等算法先后被應(yīng)用于這一領(lǐng)域,取得了較好的應(yīng)用效果[18]。以上算法的實(shí)現(xiàn)均需適當(dāng)?shù)娜藱C(jī)交互和實(shí)測(cè)樣本輸入,由于機(jī)器學(xué)習(xí)或深度學(xué)習(xí)過(guò)程中的樣本標(biāo)記需要耗費(fèi)大量的人力和時(shí)間成本[53],且FCN、LeafMask等深度學(xué)習(xí)算法需要占用較多的計(jì)算資源,所以此類(lèi)算法均不能滿足植物表型研究中準(zhǔn)確、快速、高效提取作物葉片的現(xiàn)實(shí)需求,這也使得自動(dòng)化提取葉片像素的相關(guān)研究應(yīng)運(yùn)而生。具體而言,大幅度提高葉片像素提取的精度及效率是此類(lèi)算法出現(xiàn)的根本原因[54-55]。對(duì)于本文方法而言,它省去了大量復(fù)雜且耗時(shí)的樣本標(biāo)記活動(dòng),降低了大量的人工成本,可在無(wú)實(shí)測(cè)樣本參與的情況下實(shí)現(xiàn)葉片的快速、準(zhǔn)確提取,這種優(yōu)勢(shì)在未來(lái)高通量、實(shí)時(shí)植物表型平臺(tái)的搭建中顯得尤為重要。除此之外,還通過(guò)特征轉(zhuǎn)換的方法,對(duì)葉片和背景的光譜響應(yīng)機(jī)理進(jìn)行了深入地分析,對(duì)深入了解葉片提取的內(nèi)在機(jī)理,進(jìn)一步提高作物葉片像素提取的效率都大有裨益。
隨著影像采集終端的普及,海量的葉片影像數(shù)據(jù)集在短時(shí)間內(nèi)被迅速釋放,以卷積神經(jīng)網(wǎng)絡(luò)為代表的人工智能算法在處理大數(shù)據(jù)集時(shí)具有獨(dú)特的優(yōu)勢(shì)。本研究的葉片自動(dòng)提取方法可與這些人工智能算法優(yōu)勢(shì)互補(bǔ),其運(yùn)算結(jié)果可以直接作為人工智能算法的標(biāo)記集,從而節(jié)省大量的人力和時(shí)間成本,這對(duì)進(jìn)一步提高葉片自動(dòng)提取算法的效率、精度和普適性都具有重要意義。盡管本方法以基于高光譜和多光譜影像中葉片的提取為目的,但該算法運(yùn)算簡(jiǎn)單、操作方便,在經(jīng)過(guò)一定改進(jìn)之后可以適應(yīng)RGB影像的處理,具有轉(zhuǎn)化為計(jì)算機(jī)軟件或手機(jī)APP的潛力,使農(nóng)戶、專(zhuān)家等在田間地頭即可完成葉片的提取,應(yīng)用前景廣闊。
(1)EVI指數(shù)在葉片特征增強(qiáng)和背景抑制方面表現(xiàn)最好,NDVI次之,CIred-edge和NDRE效果最差。
(2)本文方法在葉片提取方面表現(xiàn)優(yōu)異,其各項(xiàng)精度評(píng)價(jià)指標(biāo)均在0.94以上,顯著高于OTSU、標(biāo)記分水嶺等算法,且該方法可適應(yīng)不同的相機(jī)。
(3)通過(guò)整合特征轉(zhuǎn)換、局部自適應(yīng)閾值、邊緣檢測(cè)等方法,可以實(shí)現(xiàn)對(duì)葉片的快速、準(zhǔn)確、自動(dòng)提取。該方法的運(yùn)算效率相較于RF算法可提高80%以上。