代秋芳, 廖臣龍, 李 震*, 宋淑然, 薛秀云, 熊詩路
1. 華南農(nóng)業(yè)大學電子工程學院(人工智能學院), 廣東 廣州 510642 2. 國家柑橘產(chǎn)業(yè)技術(shù)體系機械化研究室, 廣東 廣州 510642 3. 廣東省農(nóng)情信息監(jiān)測工程技術(shù)研究中心, 廣東 廣州 510642
水分是影響柑橘生長發(fā)育的主要因素之一。 調(diào)虧灌溉(regulated deficit irrigation, RDI)是近年來發(fā)展起來的一種新型節(jié)水灌溉技術(shù)[1]。 RDI的作用是利用作物生長的特定階段實施水分脅迫來調(diào)節(jié)光合作用產(chǎn)物在不同器官中的分布情況, 防止其營養(yǎng)過盛并促進其生長。 柑橘葉片是植株水分脅迫的最明顯的特征之一, 是光合作用最重要的地方, 葉片含水率會影響葉片的活性, 進而影響果實的生長和產(chǎn)量。 研究表明, 在果實的抽梢開花期和幼果期應(yīng)用輕度至中度虧水處理可顯著提高作物的水分利用率, 然而在柑橘果實膨大期應(yīng)用虧水處理, 會顯著降低柑橘果實的產(chǎn)量。 因此, 檢測柑橘葉片的含水率對于柑橘生長和水分利用是非常重要的[2-4]。 傳統(tǒng)的作物水分測量方法有烘干法、 蒸餾法等, 雖然精度高, 但是過程繁瑣且測量時間長, 對作物具有破壞性。 高光譜成像技術(shù)可同時采集樣品的空間及光譜信息, 實現(xiàn)對樣品的快速無損檢測。 Murphy等發(fā)現(xiàn)萵苣葉片與NDWI, MSI和IA指數(shù)之間具有相關(guān)性, 可以用于預(yù)測萵苣葉片的含水率[5]。 Zhen利用偏最小二乘法結(jié)合特征波段提取的方法預(yù)測冬小麥葉片的含水率[6]。
近幾年, 卷積神經(jīng)網(wǎng)絡(luò)(convolution neural network, CNN)由于具有權(quán)值共享和自動提取特征等優(yōu)點, 被廣泛應(yīng)用于生物學、 食品學、 醫(yī)學等多個領(lǐng)域[7-9]。 鐘亮利用不同的卷積神經(jīng)網(wǎng)絡(luò)模型預(yù)測土壤有機質(zhì), 結(jié)果表明卷積神經(jīng)網(wǎng)絡(luò)在土壤高光譜樣本建模中具備可行性[10]。 Jie結(jié)合卷積神經(jīng)網(wǎng)絡(luò)測定柚子果實顆?;?, 結(jié)果表明卷積神經(jīng)網(wǎng)絡(luò)模型可以有效提高分類的準確性[11]。
本工作結(jié)合高光譜與卷積神經(jīng)網(wǎng)絡(luò), 研究柑橘葉片的含水率。 首先利用烘干法測出柑橘葉片的含水率作為實際含水率, 然后結(jié)合不同的預(yù)處理和特征波段選擇的方法, 將數(shù)據(jù)導(dǎo)入不同的檢測模型中, 得到最佳的預(yù)測模型。 最后, 將葉片所有像素導(dǎo)入到最佳的預(yù)測模型中, 得到每個像素的含水率預(yù)測值, 應(yīng)用偽彩色處理實現(xiàn)柑橘葉片的含水率分布的可視化。
2021年5月, 在華南農(nóng)業(yè)大學工程學院六樓天臺, 在柑橘水分管理的關(guān)鍵時期隨機均勻地摘取100片柑橘葉片; 為了提高研究的泛化性和得到更多的不同含水率的葉片, 摘取不同大小、 營養(yǎng)狀況和顏色的葉片, 并立即將樣品帶回工程學院302實驗室。 使用電子天平測量每個葉片的質(zhì)量記為G1, 隨后拍攝高光譜圖像, 然后使用恒溫鼓風干燥箱在50 ℃下烘干葉片, 50 min后取出放入裝有干燥劑的密閉玻璃缸內(nèi)冷卻至室溫, 取出稱其質(zhì)量記為G2, 再次拍攝高光譜圖像, 重復(fù)測量5次, 每次烘干的溫度和時間均為50 ℃和50 min, 得到質(zhì)量為G2,G3,G4和G5的葉片, 最后再將葉片放入85 ℃的干燥箱內(nèi)烘干至恒重, 恒重葉片記為G0。 柑橘葉片的含水率計算公式如式(1)所示。
(1)
式(1)中,Mn為第n次測量的葉片含水率;Gn為第n次測量的質(zhì)量(g); n的取值為1~5;G0為葉片干重(g)。 對采集的葉片烘干4次, 一共獲得了鮮葉和烘干葉片500個樣本。 樣本的含水率分布統(tǒng)計如表1所示, 含水率在19.59%~83.05%之間, 平均值為62.22%, 方差為0.93%。
表1 柑橘葉片的含水率分布統(tǒng)計(%)
所有的樣本均使用實驗室的高光譜成像儀(HyperSIS Zolix, China)拍攝掃描, 該儀器主要由4個鹵光燈、 CCD相機(Gilden Photonics Ltd, UK)、 樣品移動臺、 計算機等組成。 成像儀的光譜波長范圍為369~988 nm, CCD相機曝光時間設(shè)置為8.96 ms, 平臺移動速度為0.8 cm·s-1, 光譜分辨率為1.2 nm。 高光譜成像儀控制及圖像校正軟件為SpectraVIEW。 后續(xù)數(shù)據(jù)處理采用ENVI5.3軟件, Anaconda中的Spyder, 版本為Python3.6。
為了減少光照和探測器靈敏度對原始高光譜圖像的影響, 在與柑橘葉片圖像采集相同的實驗條件下, 通過拍攝白色校正圖像和黑色校正圖像對原始圖像進行黑白校正。 最終校正圖像由式(2)所示。
(2)
式(2)中,R為校正后的高光譜圖像,I為原始高光譜圖像,W為白色校正圖像,B為黑色校正圖像。 使用ENⅥ5.3軟件提取整個柑橘葉片作為感興趣區(qū)域, 得到葉片的平均反射率值, 一共500個樣本×256個波段, 數(shù)據(jù)用于后續(xù)數(shù)據(jù)分析和建模。
不同含水率葉片的光譜曲線如圖1所示。 圖1(a)中為同一葉片在四次烘干后的不同含水率的光譜反射率, 在其他條件不變的情況, 每次烘干葉片的含水率逐次減少, 含水率與光譜曲線成負相關(guān)變化趨勢, 這與前人研究的結(jié)果相一致; 圖1(b)為不同葉片的含水率的光譜反射率, 其中三個不同葉片的含水率均為70%, 但是光譜反射率卻不盡相同, 由于葉片的大小、 顏色、 營養(yǎng)狀況等因素均會影響葉片的光譜反射率, 因此不同葉片的含水率與光譜反射率并非呈簡單的線性相關(guān)趨勢。
圖1 不同含水率葉片的光譜曲線
數(shù)據(jù)包括原始光譜數(shù)據(jù)和卷積平滑(savitzky golay, SG)、 多元散射校正(multiplicative scatter correction, MSC)、 標準正態(tài)變量變換(standard normalized variate, SNV)3種預(yù)處理后的光譜數(shù)據(jù)。 不同預(yù)處理后的光譜曲線如圖2所示。
2.2.1 CARS篩選特征波長
競爭性自適應(yīng)重加權(quán)(competitive adaptive reweighted sampling, CARS)是基于蒙特卡羅采樣和偏最小二乘回歸(partial least squares regression, PLSR)模型中回歸系數(shù)的一種特征波長選擇方法[12-13], 旨在篩選最具有競爭力的波數(shù)組合。 CARS算法通過自適應(yīng)加權(quán)采樣計算回歸系數(shù)中絕對值權(quán)重, 去掉權(quán)值較小的點, 權(quán)值較大的點會作為新的子集, 然后基于新的子集建立PLSR模型, 選取交互驗證均方根誤差(root mean square error of cross validation, RMSECV)最小的PLSR模型所對應(yīng)的波長作為特征波長。 結(jié)果如圖3所示, 最終最佳迭代次數(shù)為23次, 此時的RMSECV值最小, 得到493, 498, 508, 522, 589, 592, 601, 627, 635, 658, 678, 685, 736, 752, 788, 790, 826, 835, 845, 862, 874, 888, 914, 917, 938, 943, 962, 967和969 nm共29個特征波段。
圖2 不同預(yù)處理后的光譜曲線
圖3 CARS篩選特征波段
2.2.2 PCA提取特征波長
主成分分析(principle component analysis, PCA), PCA是將多個變量通過線性變換轉(zhuǎn)換為相互正交、 信息不重疊的新變量[14], PCA概念簡單、 運算簡潔, 能夠在保留有效信息的同時解決變量之間的多重共線性問題, 在高光譜數(shù)據(jù)降維、 特征提取、 消除噪聲、 去相關(guān)性等方面得到廣泛應(yīng)用。 采用PCA算法對全部樣本的高光譜數(shù)據(jù)進行降維, 前10個主成分(principle component, PC)累積貢獻率達到99.83%, 因此選擇前10個主成分。
2.3.1 卷積神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)是深度學習的典型模型之一, 具有卷積計算和深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò), 基本結(jié)構(gòu)由輸入層、 卷積層、 激活層、 池化層和全連接層組成。 卷積層能夠自動提取光譜樣本的特征波段, 卷積之后通常會加入偏置, 并引入非線性激活函數(shù), 經(jīng)過激活函數(shù)激活后, 得到結(jié)果, 如式(3)所示
(3)
2.3.2 模型建立
卷積神經(jīng)網(wǎng)絡(luò)模型的參數(shù)如表2所示, 模型一共采用三個卷積池化層, 卷積核的大小均設(shè)置為1×3, 步長為1, 卷積核個數(shù)分別為16, 32和64個, 對于經(jīng)過特征波段選擇的光譜數(shù)據(jù), 最大池化層設(shè)置為1×1, 步長為1, 而全波段數(shù)據(jù)導(dǎo)入模型, 為了減少數(shù)據(jù)維度、 提取有效特征, 最大池化層設(shè)置為1×2, 步長為1。 在每個卷積層設(shè)置一個線性整流(rectified linear unit, RELU)激活函數(shù), 數(shù)據(jù)輸入后, 經(jīng)過三層卷積池化, 再將數(shù)據(jù)展開, 將得到的一維數(shù)據(jù)輸入到全連接層, 全連接層有兩個隱藏層, 隱含層1的神經(jīng)元個數(shù)為32個, 激活函數(shù)設(shè)置為RELU函數(shù), 隱含層2的神經(jīng)元個數(shù)為1個, 激活函數(shù)設(shè)置為linear, 用于回歸預(yù)測。 模型訓(xùn)練使用均方誤差(mean squared error, mse)作為損失函數(shù), 采用nadam算法對模型進行優(yōu)化更新, epoch設(shè)置為1 000輪, batch size設(shè)置為10。 整個網(wǎng)絡(luò)模型的基本架構(gòu)如圖4所示。
表2 CNN模型參數(shù)設(shè)置
圖4 CNN模型結(jié)構(gòu)圖
將500個樣本按7∶3的比例劃分成訓(xùn)練集和測試集。 350個樣本被選為訓(xùn)練集, 150個樣本被選為測試集, 模型使用決定系數(shù)(coefficient of determination,R2)和均方根誤差(root mean square error, RMSE)來評估,R2越大、 RMSE越小, 則模型的預(yù)測效果越好。 將原始數(shù)據(jù)和不同預(yù)處理后的光譜數(shù)據(jù)經(jīng)過不同特征波段選擇后導(dǎo)入到CNN模型中, 結(jié)果如表3所示。
表3 不同模型預(yù)測結(jié)果
2.3.3 不同模型比較
表4 不同模型的預(yù)測效果對比
圖5分別為不同模型的訓(xùn)練集和測試集中的預(yù)測值和實際測量值的三點擬合圖, 其中藍色的點代表訓(xùn)練集, 紅色的點代表測試集, 由圖可以明顯觀察到CARS-CNN模型的擬合效果最佳, 優(yōu)于其他三個模型。 而其他的三個模型均有明顯的離散數(shù)據(jù), SNV+PCA+SVR最差, SVR模型整體預(yù)測的誤差相對較大, 因此出現(xiàn)明顯的偏移現(xiàn)象。
圖5 不同模型回歸曲線圖
每個葉片樣本僅使用對應(yīng)感興趣區(qū)域提取的平均光譜表示, 然而高光譜圖像中存在豐富的空間分布信息未被充分研究。 因此本研究中利用最佳模型CARS-CNN預(yù)測高光譜圖像中各個像素點的含水率, 以實現(xiàn)其分布可視化。 首先通過ENVI5.3軟件去除葉片的背景, 將提取葉片的光譜反射率值導(dǎo)入到訓(xùn)練好的CARS-CNN模型中, 得到每個像素的含水率預(yù)測值, 轉(zhuǎn)換為灰度圖, 再應(yīng)用偽彩色技術(shù)將灰度圖轉(zhuǎn)為偽彩色圖。 柑橘葉片的不同含水率分布圖如圖6所示。
圖6 不同含水率分布圖
圖6從左到右的含水率分別為81%, 63%, 42%和19%。 從圖中可以看到, 含水率越高, 葉片圖像素越接近紅色, 含水率越低, 葉片圖像素越接近藍色。 柑橘葉片水分分布圖的可視化為每個像素的水分含量提供了更直觀、 更全面的評估, 并提供了一種評估植物灌溉策略優(yōu)劣的新方法。
(2)同時對比了不同預(yù)處理和特征波長提取選擇的PLSR, RF和SVR模型組合的最佳結(jié)果, 將最佳組合模型(原始光譜數(shù)據(jù)+CARS+PLSR, NV+PCA+RF, SNV+PCA+SVR)與原始光譜數(shù)據(jù)的CARS-CNN對比, 結(jié)果依然是CARS-CNN模型預(yù)測效果最佳;
(3)使用訓(xùn)練好的CNN模型計算葉片每個像素點的含水率, 得到81%, 63%, 42%和19%不同梯度的含水率偽彩色圖, 為檢測和評估柑橘生長和葉片含水率提供了一種全新的方法。
(4)在其他條件不變的情況下, 同一葉片的含水率與光譜反射率呈負相關(guān)趨勢, 而在自然條件下, 由于葉片的光譜反射率受葉片的大小、 顏色、 營養(yǎng)狀況、 種類等多種因素的影響, 葉片的含水率與其他因素會共同影響葉片的光譜反射率, 因此葉片的含水率與光譜反射率并非呈簡單的線性關(guān)系, 具體的因素仍需進一步研究。