張 凡, 王文秀, 王春山, 周 冀, 潘 陽, 孫劍鋒*
1. 河北農(nóng)業(yè)大學食品科技學院, 河北 保定 071000 2. 河北農(nóng)業(yè)大學信息科學與技術(shù)學院, 河北 保定 071000 3. 河北農(nóng)業(yè)大學植物保護學院, 河北 保定 071000
馬鈴薯是主要糧食作物之一, 中國的馬鈴薯種植面積和產(chǎn)量位于世界第一位。 然而, 馬鈴薯屬于生鮮食品, 容易感染干腐病, 造成巨大的經(jīng)濟損失。 在貯藏過程中, 馬鈴薯常被多種鐮刀真菌侵染, 首先病原菌附著在馬鈴薯表面, 經(jīng)歷潛育期后不斷生長繁殖, 病癥從隱性變?yōu)轱@性, 最終導致馬鈴薯外部和內(nèi)部發(fā)生病變。 該病害易感染周邊正常個體, 造成極大的經(jīng)濟損失。 因此, 實現(xiàn)馬鈴薯干腐病的快速檢測和早期識別具有重要意義。
目前, 馬鈴薯干腐病檢測方法主要包括人工目測或?qū)嶒炇疑瘷z測, 人工目測存在主觀性強、 準確率低等問題, 生化檢測方法存在滯后、 效率低等問題。 此外, 早期馬鈴薯干腐病癥狀較輕, 肉眼難以觀察和識別, 因此急需一種快速實時的檢測方法對馬鈴薯干腐病進行早期識別。 高光譜成像(hyperspectral imaging, HSI)技術(shù)可有效利用圖像和光譜信息, 在果蔬病害檢測方面具有明顯優(yōu)勢[1-3], 目前已在桃子根霉軟腐病[4]、 馬鈴薯環(huán)腐病[5]、 庫爾勒香梨黑斑病[6]等病害檢測方面上取得了有效的進展, 證實了該方法的可行性。 但大部分文獻僅僅對果蔬病害的顯性病癥進行診斷, 對染病未發(fā)病的潛育期研究仍需要深入。
化學計量學算法是高光譜分析技術(shù)中不可或缺的組成部分, 定性模型的建立是實現(xiàn)病害程度判別的關(guān)鍵。 常規(guī)算法包括最小二乘支持向量機(least squares-support vector machines, LS-SVM)、 K-近鄰算法(K-nearest neighbor algorithm, KNN)、 隨機森林(random forest, RF)和線性判別分析(linear discriminant analysis, LDA)等。 深度學習是近些年備受關(guān)注的機器學習算法, 與常規(guī)方法相比, 其自主學習的能力較強, 可以處理大量的數(shù)據(jù), 獲得更好的性能和更高的精度。 其中卷積神經(jīng)網(wǎng)絡(convolutional neural network, CNN)可以自動學習輸入信息的深度特征, 進而用于后續(xù)的分類和回歸任務。 將CNN與光譜技術(shù)結(jié)合, 可用于食品品質(zhì)分析與評價。 孫海霞等[7]結(jié)合CNN與HSI對鮮棗黑斑病進行無損檢測, 模型的準確率為90%。 Zhang等[8]以CNN作為監(jiān)督特征提取方法, 建立了枸杞干中營養(yǎng)成分含量的高光譜預測模型, 預測相關(guān)系數(shù)均達到90%以上。 研究表明CNN的特征表達和集成學習能力較高, 能夠充分挖掘高光譜圖像中的深度特征信息, 將其與HSI技術(shù)結(jié)合有望實現(xiàn)馬鈴薯潛育期干腐病樣品的正確識別。
以健康和不同病害程度的干腐病馬鈴薯為研究對象, 結(jié)合HSI和深度卷積神經(jīng)網(wǎng)絡方法, 構(gòu)建干腐病早期診斷模型。 此外, 還構(gòu)建了LS-SVM、 RF、 KNN和LDA模型, 對比分析進一步驗證CNN模型的預測性能。 研究結(jié)果為深度學習結(jié)合高光譜成像技術(shù)在果蔬病害早期識別方面提供參考方法。
實驗用馬鈴薯購于河北省保定市農(nóng)貿(mào)市場。 挑選149個成熟度、 大小相近且無明顯缺陷、 疾病的新鮮馬鈴薯, 立即運輸至河北農(nóng)業(yè)大學實驗室, 用2%(v/v)次氯酸鈉溶液洗滌5 min, 用自來水沖洗, 自然風干后備用。
接骨木鐮刀菌種購買于中國微生物菌種保藏中心。 將購買的真菌接種于PDA培養(yǎng)基上培養(yǎng)7天, 待三代培養(yǎng)結(jié)束后, 將真菌孢子從PDA培養(yǎng)基表面去除, 懸浮在無菌生理鹽水中, 最后將孢子濃度調(diào)整至1×106個·mL-1左右。
制備干腐病馬鈴薯樣品時, 先用75%的酒精擦拭表面, 再用無菌水淋洗3次。 待表面干燥后, 使用注射器注射20 μL孢子懸浮液進行真菌侵染, 每個樣品選取3個位置進行接種, 另注射20 μL無菌生理鹽水作為對照樣品。 接種后的果實放入人工氣候箱中, 保證環(huán)境濕度為90%, 溫度為(25±2) ℃。 為獲得不同腐敗程度的馬鈴薯樣品, 每天接種6個樣品, 整個試驗持續(xù)21 d, 最終獲得126個不同腐敗程度的馬鈴薯樣品和23個健康樣品進行后續(xù)實驗。 培養(yǎng)過程中, 采用十字交叉法記錄每個薯塊的病斑直徑, 結(jié)合馬鈴薯平均表面積, 根據(jù)馬鈴薯干腐病分級標準[9]將全部馬鈴薯樣品劃分為4個等級, 如表1所示。
采用的高光譜成像系統(tǒng)由CCD相機(GEV-B162M)、 成像光譜儀(ImSpector V25E)、 鏡頭、 位移平臺、 光源、 計算機及暗箱組成。 光譜范圍為920~2 528 nm, 分辨率為8 nm, 共288個波段。 相機分辨率為320×256, 光源選用一對150 W鹵鎢燈面光源。 經(jīng)過前期實驗, 將位移平臺移動速度、 相機曝光時間和樣品采集距離分別設置為7.5 mm·s-1, 10 ms和300 mm。 將樣品按病斑朝上的方式放置在位移平臺上, 相機連續(xù)線掃描進行圖像的采集。 為了消除CCD相機暗電流和光源不均勻亮度造成的影響, 原始高光譜圖像需進行黑白板校正, 得到校正后的圖像。
感興趣區(qū)域(region of interest, ROI)的選取是一個關(guān)鍵步驟, 可以減少處理時間, 增加模型精度, 提高模型的預測性能。 如圖1所示, 以馬鈴薯三個損傷接種點為中心, 分別選擇方形感興趣區(qū)域(總像素點在10 000~12 000), 然后計算ROI內(nèi)所有像素的平均光譜, 將其作為該樣品的光譜信息。 利用ROI內(nèi)多個點的平均光譜代替單個點的光譜能夠減少偶然性和差異性, 從而提高模型的準確率和穩(wěn)定性。 由于光譜的后端波段噪音較大, 對2 014~2 528 nm部分進行了截取, 將920~2 013 nm波段(196個)的光譜數(shù)據(jù)作為模型輸入變量。 以上操作均在ENVI classic 5.2軟件中進行。
圖1 感興趣區(qū)域選取示意圖
1.4.1 光譜數(shù)據(jù)增強
深度卷積神經(jīng)網(wǎng)絡中嵌入了大量的參數(shù), 因此需要大量數(shù)據(jù)學習, 進而對神經(jīng)網(wǎng)絡進行充分的訓練。 然而, 受樣本數(shù)量、 采集環(huán)境、 設備等限制, 一般較難獲取大量帶有標簽的樣品光譜數(shù)據(jù), 故采用數(shù)據(jù)增強的方式擴充樣本[10]。 參照專利[11]所述方法, 對原始數(shù)據(jù)增加一定范圍內(nèi)的光譜擾動, 在此基礎上添加噪聲模擬數(shù)據(jù)。 將光照模擬添加的擾動程度分別設置為0.8、 0.9、 1.0、 1.1、 1.2, 將添加的噪聲等級分別設置為-0.25、 -0.5、 0、 0.25、 0.5、 0.75, 由此得到擴增30倍后的高光譜數(shù)據(jù)。 經(jīng)過數(shù)據(jù)增強, 得到包含四類樣品光譜的數(shù)據(jù)集共4470條。
1.4.2 光譜預處理
由于原始光譜中不可避免地存在一些干擾如: 光的散射、 隨機噪聲等因素, 造成光譜不重復及基線漂移。 預處理可以在一定程度上降低噪聲等冗余信息, 并對基線進行修正, 提高模型的魯棒性和可預測性。 二階導數(shù)可以消除高頻噪音及組份間的相互干擾, 利用二階導數(shù)(second derivative, SD)方法對原始光譜進行預處理, 但導數(shù)處理也會引入不必要的噪聲降低信噪比, 因此先經(jīng)Savizkg-Golay平滑濾除隨機噪聲再進行了二階導數(shù)預處理。
1.4.3 常規(guī)方法建模
利用Kennard-Stone(KS)方法將數(shù)據(jù)按3∶1分為訓練集(3 353)和測試集(1 117), 其中訓練集中四個等級樣品分別包括518、 405、 2 205和225個, 測試集包括172、 135、 735和75個。 以LS-SVM、 RF、 KNN和LDA作為分類器構(gòu)建干腐病馬鈴薯的診斷模型。 其中, LS-SVM是對經(jīng)典支持向量機算法的改進, 具有線性和非線性多元校正的能力。 RF是機器學習研究中常用的決策樹方法之一, 不容易過度擬合, 計算需求較低, RF中隨機樹的數(shù)目設置為500。 KNN算法計算未知樣本與所有已知樣本之間的距離, 根據(jù)多數(shù)表決的方法, 將未知樣本和k個近鄰樣本歸為一類,k值設置為9。 LDA通過確定特征的線性組合, 將一個組合劃分為兩個或多個組合, 這種多變量方法有效地使兩組間的比例最大化, 使組內(nèi)的比例最小化。
1.4.4 卷積神經(jīng)網(wǎng)絡建模
CNN是人工神經(jīng)網(wǎng)絡的衍生產(chǎn)物, 旨在建立一個類似于人腦的特征學習網(wǎng)絡, 對海量數(shù)據(jù)進行分析和處理, 可以自動從原始數(shù)據(jù)中提取線性和非線性特征, 實現(xiàn)端到端建模方法。 采用經(jīng)典的LeNet作為CNN的結(jié)構(gòu), 可以理解為輸入層、 卷積層、 池化層、 全連接層和輸出層的串聯(lián)。 卷積層主要用于通過過濾器以特征映射的形式提取和保存有用的特征。 池化層對卷積層提取的特征進行選擇, 最終實現(xiàn)降維。 全連接層將池化層的所有特征矩陣轉(zhuǎn)化為一維特征向量, 作為“分類器”對特征信息進行有效分類。
1.4.4.1 卷積神經(jīng)網(wǎng)絡框架
搭建的卷積神經(jīng)網(wǎng)絡為Pytorch中nn.Conv2d, 模型結(jié)構(gòu)如圖2所示, 包括1個輸入層, 3個卷積層(C1、 C2、 C3), 3個池化層(P1、 P2、 P3), 3個全連接層(F1、 F2、 F3)和1個輸出層。 首先給定原始馬鈴薯高光譜圖像, 利用ENVI進行ROI分割和多個波長處反射率信息的提取; 然后對原始光譜數(shù)據(jù)進行平滑+SD處理得到Td, 一維CNN的處理分析往往難以挖掘光譜數(shù)據(jù)的深度特征信息, 因此將一維數(shù)據(jù)重組為14×14維度的二維數(shù)據(jù), 如圖3所示。 并且復制四次后得到網(wǎng)絡的輸入變量Ti, 其維度為14×14×4。 最后將人工標記的標簽Li(樣品等級)作為輸出變量建立CNN訓練模型。 利用卷積神經(jīng)網(wǎng)絡C進行分類的過程如式(1), 其中分類的結(jié)果為輸出類別的概率值P。
圖2 CNN模型的基本結(jié)構(gòu)
圖3 二維矩陣轉(zhuǎn)換圖
P=Softmax(C(Ti),Li)=
(1)
由于在網(wǎng)絡前向傳輸過程中, 每一層卷積的卷積核是隨機產(chǎn)生的, 導致最后一層卷積層的特征輸出并不相同, 經(jīng)過全連接層后得到的最終分類概率值并不能實現(xiàn)準確的預測。 因此在訓練過程中整個網(wǎng)絡需要不斷迭代, 根據(jù)網(wǎng)絡的預測值與標簽值之間的損失優(yōu)化訓練過程中的隨機量, 最終達到模型擬合, 并保存最優(yōu)的模型參數(shù)。 采用交叉熵損失函數(shù)作為模型更新的衡量指標, 如式(2)所示。
(2)
1.4.4.2 網(wǎng)絡層數(shù)選擇及優(yōu)化
在卷積神經(jīng)網(wǎng)絡訓練中, 不同網(wǎng)絡層結(jié)構(gòu)對模型識別效果有巨大影響。 設計了9種實驗方案, 即: 卷積層數(shù)設置為1、 2、 3, 全連接層數(shù)設置為1, 2, 3, 在此基礎上進行不同層數(shù)之間的組合, 包括: Model_1_1、 Model_1_2、 Mode_1_3、 Model_2_1、 Model_2_2、 Model_2_3、 Mode_3_1、 Mode_3_2、 Mode_3_3。 對不同層數(shù)網(wǎng)絡結(jié)構(gòu)進行訓練, 然后對測試集進行預測得到模型識別率, 從而確定最優(yōu)模型結(jié)構(gòu), 此時學習率設置為0.000 1。
1.4.4.3 超參數(shù)選擇及優(yōu)化
在深度學習建模過程中需設定一些超參數(shù), 包括學習率、 批大小、 激活函數(shù)、 迭代次數(shù)、 卷積核大小、 種子大小、 填充值、 步長、 丟棄率等。 其中學習率是最重要的一個超參數(shù), 具有加快模型收斂和避免陷入局部最優(yōu)的優(yōu)點。 選擇0.000 1、 0.000 5、 0.001、 0.005、 0.01共5個學習率進行優(yōu)化選擇。 表2為CNN模型的參數(shù)設置。 對于卷積層來說, 卷積核大小為1, 步長為1, 填充大小為0。 對于池化層, 采用了Pytorch中的AdaptiveAvgPool2d, 其在參數(shù)中只指定了輸出的大小為1×1, 使得池化后的每個通道上的大小為1, 即每個通道上只有一個像素點。 對于全連接層, 神經(jīng)元個數(shù)分別設置為3 136、 1 152和288。 最后, eropout層的丟棄率設置為0.1, 代表隨機丟棄全連接層的神經(jīng)元個數(shù)占總個數(shù)的10%。 對于激活層和池化層, 采用Relu激活函數(shù)。 模型訓練的批大小設定為32。 上述模型訓練所用計算機的配置如下: Ubuntu18.04環(huán)境、 Intel core i9 9820X處理器、 64 G內(nèi)存、 GeForce RTX 2080Ti 11G DDR6顯卡、 Pytorch學習框架。
表2 CNN模型網(wǎng)絡參數(shù)
1.4.5 模型評價
為準確地評價模型, 綜合運用準確率、 精度、 靈敏度和特異性對模型性能進行分析。 表3為4種評價指標的公式及意義, 其中正例代表目標預測類別(positive,P), 負例代表其他非目標預測類別(negative,N)。TP為實際為正例但被分類器劃分為正例的實例數(shù);FN為實際為正例但被分類器劃分為負例的實例數(shù);FP為實際為負例但被分類器劃分為正例的實例數(shù);TN為實際為負例且被分類器劃分為負例的實例數(shù)。
表3 模型評價指標的公式及意義
健康和接骨木鐮刀菌侵染不同時間的馬鈴薯及病斑面積如圖3和表4所示。 病原菌起初侵染馬鈴薯塊莖時, 分泌了一系列細胞壁降解酶如多聚半乳糖醛酸酶、 果膠甲基半乳糖醛酸酶、 纖維素酶、 β-葡萄糖苷酶等造成寄主細胞壁溶解和質(zhì)壁分離[12], 此時塊莖表面與健康樣品無差別, 并未出現(xiàn)明顯的可見癥[圖4(a1)、 (b1)]。 接著病原菌進入寄主細胞, 釋放特異性毒素破壞寄主的防御系統(tǒng), 擾亂寄主正常的生理活動, 造成塊莖淀粉、 直鏈淀粉、 支鏈淀粉、 還原糖、 蔗糖和總可溶性糖等碳水化合物含量的變化[13], 最終影響其品質(zhì)屬性, 此時塊莖表面和內(nèi)部出現(xiàn)肉眼可見的褐色圓形小斑點[圖4(c1)、 (c2)], 斑點呈水浸樣或皺狀。 隨著侵染時間的延長, 馬鈴薯塊莖的病斑逐漸擴大并干癟, 且發(fā)生下陷, 此時薯皮成同心圈狀折疊, 菌絲體緊密的交匯在腐爛部位, 并著生了白色的孢子團, 且病部薯肉壞死變褐, 并向四周擴展, 較老的死亡組織中出現(xiàn)真菌孢子, 空腔內(nèi)長滿菌絲[圖4(d1)、 (d2)]。 表4為不同腐敗程度馬鈴薯病斑面積統(tǒng)計數(shù)據(jù), 病斑面積范圍為0.22~15.40 cm2, 占整個馬鈴薯表面積比例為0.14~10.20%。
圖4 不同病害程度馬鈴薯
表4 不同病害程度馬鈴薯病斑面積統(tǒng)計信息
健康和不同病害等級馬鈴薯的平均光譜如圖5(a)所示, 其中紫色、 黃色、 紅色和藍色線條分別代表等級3、 2、 1和健康樣品。 在整個波段范圍內(nèi), 健康薯與干腐病薯的反射光譜在光譜形態(tài)特征方面相似, 但反射率值存在明顯差異。 在1 020、 1 223和1 582 nm左右處出現(xiàn)了最強的局部吸收峰, 其中1 020 nm源于N—H基團的第二倍頻伸縮振動吸收、 1 223 nm代表馬鈴薯水分的O—H鍵合頻吸收, 1 584 nm與N—H基團的一級倍頻有關(guān)。 位于1 370和1 820 nm附近的波谷主要源于C—H的二級倍頻和一級倍頻。 在920~1 810 nm波段范圍內(nèi), 病害馬鈴薯光譜反射率顯著高于健康馬鈴薯。 其中潛育期樣品與健康樣品反射率值較為相似, 主要源于潛育期樣品的腐敗程度較低, 光譜上未有明顯變化。 與健康馬鈴薯相比, 干腐病馬鈴薯組織變黑, 細胞組織失水, 等級2、 3樣品可能會出現(xiàn)粉狀的皮質(zhì)組織, 導致馬鈴薯顏色加深, 組織對光的吸收隨之增大, 并且樣品組織水分減少也會導致光散射增強, 最終使吸光度升高。 預處理光譜如圖5(b)所示, SD處理強化了原始光譜中隱藏在較寬吸收頻帶的微小特征峰, 提高了分辨率和靈敏度。
圖5 不同等級馬鈴薯樣品光譜
2.3.1 網(wǎng)絡層數(shù)尋優(yōu)分析
網(wǎng)絡層的優(yōu)化對獲得理想的分類性能起著至關(guān)重要的作用。 采用Model_1_1、 Model_1_2、 Mode_1_3、 Model_2_1、 Model_2_2、 Model_2_3、 Mode_3_1、 Mode_3_2、 Mode_3_3進行網(wǎng)絡結(jié)構(gòu)優(yōu)化。 圖6表示準確率[圖6(a)]和損失值[圖6(b)]隨不同層數(shù)組合和迭代次數(shù)的變化, 隨著模型的訓練, 其準確率均呈增加趨勢, 損失值呈下降趨勢。 隨著網(wǎng)絡層數(shù)的增加, 準確率增強的斜率越來越大, 即增大速度越快。 當?shù)螖?shù)為25時, 準確率變化趨于平穩(wěn)且逐步達到最高值, 損失值達到最小值。 這是因為在網(wǎng)絡操作開始時, 由于損失值最初很高, 網(wǎng)絡必須通過APN模塊來學習ROI。 但隨著APN模塊參數(shù)的重新更新, ROI精度逐漸提高, 損失值急劇下降, 最終達到最低水平。 不同層數(shù)組合之間準確率和損失值有所差異。 所有模型的準確率大小順序為: Model_3_3>Model_3_2>Model_2_2>Model_2_3>Model_2_1>Model_1_3>Model_1_2>Model_1_1>Model_3_1。 在所有模型中, Model_3_1訓練準確率最低, Loss值最高, 可能是由于卷積層較多, 全連接層較少。 Model_3_3訓練準確率最高, Loss值最低, 因此, 在卷積層為3層的情況下, 采用3層全連接層能更好地提升模型的性能。
圖6 訓練準確率與損失變化
為進一步評價模型的穩(wěn)健性和泛化性, 利用測試集對深度模型進行評估。 將測試數(shù)據(jù)分別代入9個CNN模型中進行測試, 結(jié)果如表5所示。 除了Model_3_1預測準確率較低以外, 其他模型預測準確率均達到80%以上, 且Model3_3模型的分類效果最好, 與上述模型訓練結(jié)果一致。
表5 基于不同網(wǎng)絡層的測試集預測結(jié)果
2.3.2 學習率參數(shù)尋優(yōu)分析
基于以上最優(yōu)網(wǎng)絡結(jié)構(gòu)Model3_3, 設計了5種學習率優(yōu)化實驗方案, 并分別命名為Model_0.0001、 Model_0.0005、 Model_0.001、 Model_0.005和Model_0.01。 隨著迭代次數(shù)的增加, 訓練模型的準確率和損失值變化如圖7所示, 隨著訓練運行, 準確率呈一定趨勢增加, 損失值不斷下降。 此外, 學習率越大準確率越低, 損失值越大, 主要由于學習率越小學得越仔細, 從而模型識別率越高。 因此, 確定0.000 1為最優(yōu)的學習率。
圖7 訓練準確率與損失變化
利用測試集對訓練模型進行評估, 結(jié)果如表6所示。 隨著學習率的降低, 測試集準確率顯著增加, Model_0.0001模型預測準確率達到98.12%, 精度、 靈敏度和特異性分別為91.88%、 94.99%和98.78%。 而Model_0.01預測準確率僅為76.77%, 說明學習率過大導致模型學習粗糙, 最終造成準確率較低。
表6 不同學習率模型的預測結(jié)果
為了進一步分析Model_0.0001模型的分類性能, 計算最優(yōu)模型的混淆矩陣。 如圖8所示, (a)、 (b)分別代表訓練集和測試集的預測結(jié)果, 其中對等級0(健康)樣品預測準確率分別為99.94%和99.73%, 表明此模型可以對健康和干腐病馬鈴薯進行較好的區(qū)分。 0級和1級分類過程中出現(xiàn)一些錯分現(xiàn)象, 其中1級樣品屬于潛育期階段, 感染腐敗菌但表面未出現(xiàn)病斑, 樣品表面與健康樣品相似, 因此很容易發(fā)生誤判。 此外, 對2級樣品和3級樣品預測準確率分別達到了99.97%、 99.97%和100%、 100%, 主要源于隨著貯藏時間的延長, 腐敗程度越大, 病斑部位顏色變化明顯, 誤判次數(shù)也減少。 綜上所述, 使用CNN模型能夠精確地對馬鈴薯干腐病進行早期識別, 對馬鈴薯干腐病的及時防治具有重要意義。
圖8 Model_0.0001混淆矩陣
為進一步驗證CNN模型的有效性, 利用LS-SVM、 RF、 KNN和LDA四種算法建立干腐病馬鈴薯不同腐敗程度的定性分類模型, 測試集預測結(jié)果如表7所示。 四種方法所建立模型的總體準確率均達到90%以上, 表明模型分類效果較好。 為了進一步分析常規(guī)模型的分類性能, 計算其混淆矩陣, 結(jié)果如圖9所示。 四種模型存在較多對1級樣品的預測錯誤, 分類準確率分別為91.00%、 85.58%、 94.18%和90.33%, 相較于CNN模型結(jié)果來說較低。 這可能是由于馬鈴薯被真菌侵染后, 在儲存時間較短的情況下, 外觀變化不明顯, 從而導致被誤判為健康樣品的次數(shù)較多。 此外, 存在2級樣品和3級樣品之間的誤判現(xiàn)象, 可能由部分馬鈴薯個體差異造成。 總得來說, 常規(guī)方法所建模型總體識別效果較好, 能實現(xiàn)馬鈴薯干腐病腐敗程度的分類, 但對潛育期樣品的識別能力有待提高。
圖9 常規(guī)方法的混淆矩陣
表7 LS-SVM、 RF、 KNN和LDA分類模型結(jié)果比較
綜合比較, CNN所建定性模型的預測性能優(yōu)于其他分類模型, 尤其對1級(潛育期)樣品的識別準確率達到99.73%, 較好地實現(xiàn)了馬鈴薯干腐病的早期檢測。 CNN算法通過優(yōu)化每個濾波器的權(quán)值參數(shù), 在預處理和特征選擇過程中減少了人為的工作量, 完全探索了特征信息。 同時, 最大池化策略、 退出策略和批處理歸一化策略的共同作用有效減少了特征維數(shù), 將可能出現(xiàn)的過擬合問題規(guī)避。 因此, 高光譜與深度學習相結(jié)合能更好的實現(xiàn)馬鈴薯干腐病潛育期樣品的識別。
采用高光譜成像技術(shù)結(jié)合CNN實現(xiàn)馬鈴薯干腐病潛育期樣品識別分類。 分別建立了CNN、 LS-SVM、 RF、 KNN和LDA分類模型, 并比較其分類結(jié)果。 結(jié)果可得, 五種算法分類模型的總體準確率分別為99.68%、 90.77%、 92.30%、 93.10%和92.34%, 其中CNN建立的模型最優(yōu), 其精度、 靈敏度、 特異性達到99.76%、 98.82%、 99.54%, 對潛育期樣品識別率高達99.73%, 較幾種常規(guī)方法提高了5.55%~14.15%。 該結(jié)果表明, CNN更有利于提取和挖掘光譜數(shù)據(jù)深層信息, 進一步提高了馬鈴薯干腐病腐敗程度分類精度。 本研究為馬鈴薯干腐病早期防治、 精準施藥及檢測儀器開發(fā)提供科學依據(jù), 后續(xù)可利用CNN提取更多的高光譜圖像信息加以利用, 進一步提高建模預測結(jié)果。