孫傳亮,馬 攀,劉澤厚,鄭建敏,梁萬杰,曹 靜,王 琴,李 俊,楊武云,萬洪深*,張文宇,5*
(1.江蘇省農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所/種質(zhì)資源創(chuàng)新與信息化利用聯(lián)合實(shí)驗(yàn)室、農(nóng)業(yè)數(shù)字孿生聯(lián)合實(shí)驗(yàn)室,南京 210014;2.四川省農(nóng)業(yè)科學(xué)院作物研究所/農(nóng)業(yè)農(nóng)村部西南地區(qū)小麥生物學(xué)與遺傳育種重點(diǎn)實(shí)驗(yàn)室,成都 610066;3.四川農(nóng)業(yè)大學(xué)小麥研究所,成都 611130;4.糧油作物綠色種質(zhì)創(chuàng)新與遺傳改良四川省重點(diǎn)實(shí)驗(yàn)室,成都 610066;5.江蘇大學(xué)農(nóng)業(yè)工程學(xué)院,江蘇 鎮(zhèn)江 212013)
小麥?zhǔn)俏覈匾募Z食作物,在我國作物種植結(jié)構(gòu)中占有主要地位,種植面積僅次于水稻。種子是農(nóng)業(yè)發(fā)展的基礎(chǔ),種子質(zhì)量的高低影響著農(nóng)作物的產(chǎn)量和品質(zhì),因此小麥生產(chǎn)上種子的質(zhì)量對增產(chǎn)增收至關(guān)重要。生產(chǎn)上種子質(zhì)量通常包括“活力”“凈度”“發(fā)芽率”等。小麥穗發(fā)芽是指在小麥?zhǔn)斋@前籽粒直接在麥穗上出現(xiàn)發(fā)芽的現(xiàn)象[1]。冬小麥?zhǔn)斋@期,時常會遇有連續(xù)陰雨天氣或潮濕的環(huán)境,經(jīng)常出現(xiàn)穗發(fā)芽[2-3],即使在沒有降雨的小麥成熟期,如溫度和濕度達(dá)到一定條件也可發(fā)生穗發(fā)芽,其不僅影響籽粒品質(zhì)[8],同時影響小麥貯存及下一季的播種質(zhì)量,對小麥生產(chǎn)造成較大經(jīng)濟(jì)損失[4-6]。
目前,穗發(fā)芽檢測的技術(shù)手段或指標(biāo)主要分為3類:生化測定法、分子檢測法、目測法[9-10]。生化測定法主要是通過監(jiān)測蛋白質(zhì)水平,主要包括降落值法、α-淀粉酶測定法、黏度參數(shù)法等。分子檢測法是直接對與穗發(fā)芽抗性相關(guān)的基因或QTL的檢測。目測法以籽粒胚部種皮破裂與否為指標(biāo),人工目測調(diào)查發(fā)芽率,根據(jù)發(fā)芽率衡量抗性大小,是廣泛采用的檢測穗發(fā)芽抗性的手段,其鑒定的最佳時期是在田間蠟熟期、黃熟期,而對于收獲后干燥種子的穗發(fā)芽的目測相對較為困難??偟膩碚f,目前盡管針對小麥穗發(fā)芽特性檢測的方法多樣,但主要還是依靠人工方法和化學(xué)方法來進(jìn)行檢測,不僅操作比較繁瑣,而且工作量大,耗時耗力,因此研究識別小麥穗發(fā)芽種子的方法對于準(zhǔn)確檢測小麥籽粒穗發(fā)芽具有極其重要的作用。
近年來,高光譜成像技術(shù)迅速發(fā)展,為作物快速無損監(jiān)測提供了一種便捷的技術(shù)手段[9-10]。成像技術(shù)則能夠獲得物體的外部影像,進(jìn)而分析物體的外在空間信息。高光譜成像技術(shù)同時融合光譜和圖像信息的優(yōu)勢,能夠同時獲取反映待測樣本外部特征的圖像信息和反映內(nèi)部物理結(jié)構(gòu)及化學(xué)成分的光譜信息,目前已被廣泛應(yīng)用于作物無損監(jiān)測的研究,比如農(nóng)作物生長狀況監(jiān)測診斷、農(nóng)產(chǎn)品成熟度、品質(zhì)預(yù)測等[11-12]。在小麥籽粒屬性檢測方面,有學(xué)者利用高光譜成像技術(shù)檢測小麥籽粒赤霉病、發(fā)芽程度、品種鑒別、蛋白含量等等[13-15]。但通過高光譜成像技術(shù)對不同倍性、不同籽粒顏色的小麥進(jìn)行識別穗發(fā)芽后干燥籽粒的識別相關(guān)的研究還比較少,本研究通過提出一種融合高光譜成像技術(shù)與智能算法的小麥種子穗發(fā)芽識別模型,為穗發(fā)芽自動化識別與篩選提供技術(shù)支持,可以提高穗發(fā)芽品種的選育效率。
1.1.1 小麥測試樣本
本研究選用具有不同粒重、不同籽粒顏色、不同基因組倍性的3 個小麥品種為鑒定材料(如表1所示),分別為:(1)圓網(wǎng)(C1),四倍體圓錐小麥(T.turgidum),四川圓錐小麥地方品種,千粒重42.6 g,白皮小麥;(2)川麥104(C2),六倍體普通小麥(T.aestivum),四川省農(nóng)業(yè)科學(xué)院作物研究所育成品種,千粒重49.9 g,紅皮小麥;(3)川麥98(C3),六倍體普通小麥(T.aestivum),四川省農(nóng)業(yè)科學(xué)院作物研究所育成品種,千粒重42.5 g,白皮小麥。
表1 高光譜分析所用小麥品種籽粒特性Table 1 Grain characteristics of wheat varieties used in the hyperspectral analysis
小麥材料2020—2021年種植于四川省農(nóng)業(yè)科學(xué)院郫縣試驗(yàn)基地,收獲保存3個月后,將一半種子吸脹吸水后進(jìn)行發(fā)芽處理(B1),在黑暗處待種子露白后吸干水分,并將進(jìn)行B1 處理的和未經(jīng)B1 處理的種子一同在38 ℃的烘箱內(nèi)烘干至恒重;通過發(fā)芽處理并低溫烘干模擬穗發(fā)芽的種子,其發(fā)芽率小于5%,未經(jīng)過發(fā)芽處理的種子發(fā)芽率為99%。
1.1.2 高光譜成像采集系統(tǒng)
研究利用搭載Resonon PIKA CX 高光譜成像系統(tǒng)(如圖1所示)采集小麥籽粒高光譜影像數(shù)據(jù),傳感器成像方式為掃推成像,光譜范圍為400~1 000 nm。設(shè)置高光譜成像儀與小麥樣品平臺的距離為30 cm。在采集圖像時,為了避免傳送裝置反光形成噪聲干擾,以及掃描過程中造成小麥籽粒抖動,將小麥擺放在純黑色長方形布藝材料上。試驗(yàn)共采集3個品種、每個品種分為發(fā)芽處理和未經(jīng)發(fā)芽處理,6個樣品的60幅高光譜圖像(每個樣品掃描10幅影像,每幅影像100粒種子)。由于實(shí)驗(yàn)環(huán)境為室內(nèi)暗室,采用人工光源(鹵素?zé)艄猓?,光源?qiáng)度分布不均勻?qū)е麓嬖诎惦娏髟肼?,首先需要進(jìn)行高光譜成像儀白板標(biāo)定以提高獲取高光譜圖像的信噪比。
圖1 高光譜成像系統(tǒng)Figure 1 Hyperspectral imaging system
1.3.1 高光譜數(shù)據(jù)預(yù)處理
本研究獲取供試驗(yàn)小麥樣品的60 幅高光譜圖像,每幅高光譜圖像含有100 粒小麥種子高光譜信息。通過高光譜圖像預(yù)處理方法,將圖像數(shù)據(jù)進(jìn)行輻射定標(biāo)、噪聲去除和降維處理等,提取感興趣區(qū)域,計(jì)算感興趣區(qū)域的均值光譜,選擇特征波段并重組高光譜圖像。
(1) 輻射定標(biāo)
采用輻射定標(biāo)計(jì)算公式進(jìn)行輻射定標(biāo)處理,公式如下:
其中:Reftarget為待測樣品目標(biāo)反射率;Refpanel為標(biāo)準(zhǔn)參考反射率;DNtarget為原始高光譜影像中目標(biāo)物的數(shù)值;DNpanel為原始高光譜影像中標(biāo)準(zhǔn)參考板的數(shù)值;DNdark為成像光譜儀系統(tǒng)誤差。
(2) 去除噪聲
本文采用最小噪聲分離方法(minimum noise fraction,MNF)去除高光譜圖像的噪聲,主要通過最小噪聲分離工具判定圖像數(shù)據(jù)內(nèi)在的波段,進(jìn)而分離數(shù)據(jù)噪聲,減少后期數(shù)據(jù)處理的計(jì)算量,主要進(jìn)行兩次層疊的主成分變換方法[16-17]。運(yùn)用分離方法重新調(diào)節(jié)數(shù)據(jù)中的噪聲,這步操作使變換后的噪聲數(shù)據(jù)只有最小的方差,波段間不相關(guān)[18]。最后對噪聲白化(noise-whitened)數(shù)據(jù)標(biāo)準(zhǔn)化主成分變換(如圖3所示)。
圖3 利用最小噪聲分離方法對高光譜影像反射率進(jìn)行噪聲處理Figure 3 Removing noise from the hyperspectral image reflectance by the minimum noise fraction method
1.3.2 高光譜圖像特征提取
高光譜成像具有圖譜合一的性質(zhì),其不但具有豐富的光譜信息,還具有豐富的圖像信息,因此本文在獲取光譜特征的同時也獲取了圖像特征[19]。圖像特征參數(shù)主要包括形態(tài)、顏色、紋理等方面,而本文中所獲取的是小麥籽粒光譜在400~1 000 nm 波段圖像信息,通過小麥的紋理和顏色特征以及形態(tài)特征方面來獲取小麥品種分類建模數(shù)據(jù)[20]。本文采用圖像變換、分割等相關(guān)處理方法獲取小麥籽粒的二值圖像,從而提取小麥籽粒的形態(tài)特征。
為提取小麥籽粒圖像特征參數(shù),首先需要去除高光譜圖像的背景信息。通過截取小麥籽粒區(qū)域的高光譜成像數(shù)據(jù),利用小麥籽粒與背景圖像和光譜差異性,采用圖像分割方法去除背景信息,提取純小麥籽粒圖像。采用特征變換方法,分別運(yùn)用主成分分析法(principal component analysis,PCA)、獨(dú)立成分分析法(independent component analysis,ICA)和HSV色彩變換方法,對經(jīng)預(yù)處理后的高光譜數(shù)據(jù)進(jìn)行特征變換分析,去除冗余的波段信息、將多波段的圖像信息進(jìn)行壓縮,轉(zhuǎn)換為比原波段更有效的少數(shù)幾個波段。第一主成分主要包含了光譜波段中80%的方差信息,且所有波段的中95%以上的信息量匯集到前三個主成分[21-22]。ICA 變換是將混合信號分解為相互獨(dú)立的成分[23-24]。HSV顏色變換是將RGB圖像進(jìn)行色彩變換為色相、飽和度和明度。
1.3.3 分類建模與驗(yàn)證
本研究采用最小距離法、最大似然法和支持向量機(jī)分別建立3 種小麥籽粒發(fā)芽識別模型,基于最小距離算法進(jìn)行識別分類,通過每個分類模型的最佳主成分?jǐn)?shù)交互驗(yàn)證來確定,選擇預(yù)測殘存平方和(PRESS)不再顯著降低時對應(yīng)的主成分?jǐn)?shù)[13]?;谧畲笏迫凰惴ㄟM(jìn)行識別分類,根據(jù)交互驗(yàn)證進(jìn)行隱變量的選取?;谥С窒蛄繖C(jī)進(jìn)行分類時,核函數(shù)作為重要的分類參數(shù),本研究通過多次實(shí)驗(yàn),驗(yàn)證了利用高斯核函數(shù)進(jìn)行分類,具有較好的分類效果。因此本研究采用高斯核作為支持向量機(jī)進(jìn)行識別分類的核函數(shù)。
將分類識別模型針對100 粒小麥種子進(jìn)行識別,其中50粒發(fā)芽種子,50粒未發(fā)芽種子。將實(shí)驗(yàn)樣本分為訓(xùn)練集和測試集,通過訓(xùn)練集建立分類識別模型,測試集用于評估模型的分類性能。將3 個品種不同處理的小麥籽粒中按照2︰1的比例隨機(jī)選取模型的訓(xùn)練集和測試集,最后采用識別準(zhǔn)確度評價模型分類效果。
本文采用Kappa 系數(shù)分類進(jìn)行結(jié)果檢驗(yàn),針對分類結(jié)果精度進(jìn)行評價。
通過提取400~1 000 nm 波長范圍內(nèi)小麥發(fā)芽與正常籽粒的光譜反射率并進(jìn)行比較分析,結(jié)果顯示,3 個小麥品種C1、C2 和C3 的發(fā)芽籽粒在400~1 000 nm波長范圍內(nèi)的光譜反射率要顯著高于其正常籽粒(圖4),其中在470~620 nm 波長范圍內(nèi)發(fā)芽籽粒與正常籽粒的平均光譜反射率差異大于0.300(圖5),在520 nm 波長處差異達(dá)到最大為0.375,且達(dá)到極顯著水平(P≤0.01)。
圖4 不同品種正常籽粒和發(fā)芽籽粒的平均光譜反射率Figure 4 Average spectral reflectance of normal and germinated grains from different cultivars
圖5 470~620 nm波長范圍內(nèi)3個品種發(fā)芽籽粒與正常籽粒的平均光譜反射率均值比較Figure 5 Mean comparison of the average spectral reflectance between germinated and normal grains of the three cultivars in the wavelength range from 470 to 620 nm
同時3個品種發(fā)芽籽粒的平均光譜曲線重合區(qū)域較多,而正常小麥籽粒的曲線在品種C1、C2、C3之間的重合區(qū)域很少,說明不同品種之間的發(fā)芽籽粒的光譜差異較小,而正常籽粒的光譜差異較大,具體表現(xiàn)為,在480~560 nm 波長范圍內(nèi),白皮小麥圓網(wǎng)(C1)、川麥98(C3)正常籽粒的光譜反射率要顯著大于紅皮小麥川麥104(C2),在560~640 nm波長范圍內(nèi),C1正常籽粒>C3正常籽粒>C2正常籽粒,在640 nm波長以上,正常籽粒的光譜反射率在不同品種間的差異逐漸變小。
在560~720 nm 波長之間3 個品種發(fā)芽籽粒出現(xiàn)顯著的反射吸收谷(675 nm),而正常籽粒不存在顯著的吸收谷的光譜特征。
利用PCA、ICA、HSV 3 種變換方法進(jìn)行圖像分析。結(jié)果如圖6,PCA和HSV變換結(jié)果顯示,同一品種的小麥籽粒,PCA變換檢測的結(jié)果并不能明顯區(qū)分穗發(fā)芽小麥籽粒和未發(fā)芽小麥籽粒,采用SPSS進(jìn)行顯著性檢驗(yàn)表明(如圖7所示),變換結(jié)果并不顯著。而經(jīng)過ICA變換的穗發(fā)芽小麥籽粒和未發(fā)芽小麥籽粒更顯著,發(fā)芽的小麥籽??傮w顏色也呈規(guī)律變化。
圖6 小麥穗發(fā)芽和正常籽粒高光譜圖像變換特征分析Figure 6 Characteristic analysis of hyperspectral image transformation for germinated and normal grains
圖7 3種變換特征的發(fā)芽和正常籽粒顯著性比較Figure 7 The significance comparison between germinated and normal grains under three transformation characteristics
將光譜特征和圖像特征進(jìn)行數(shù)據(jù)融合,分別采用最小距離法、最大似然法和支持向量機(jī)學(xué)習(xí)算法進(jìn)行識別分類。通過與實(shí)際結(jié)果比較,得出3種學(xué)習(xí)算法的識別分類精度分別為85.5%、92.5%和96%,并進(jìn)行Kappa分類精度評價,得到的Kappa系數(shù)分別為0.74、0.91和0.93(表2)。上述結(jié)果表明,通過光譜和圖像特征差異,結(jié)合支持向量機(jī)算法進(jìn)行識別得到的分類結(jié)果精度更高;最終輸出得到小麥發(fā)芽籽粒高光譜圖像識別分類結(jié)果(如圖8所示)。
圖8 小麥發(fā)芽籽粒的高光譜圖像識別分類Figure 8 Classification of wheat germinated grains based on hyperspectral image recognition
表2 不同算法的小麥發(fā)芽籽粒識別分類精度Table 2 Classification accuracy of wheat germinated grain recognition by different algorithms
就基因組倍性而言,市場上大約95%的小麥?zhǔn)橇扼w普通小麥,其次是四倍體杜倫麥(durumwheat)占比5%左右[25],同時紅皮與白皮小麥并存,粒重作為小麥一個重要的商品屬性也存在不同的差異。在本研究涉及的這3 個屬性中,紅皮小麥的穗發(fā)芽抗性往往要大于白皮小麥,這是因?yàn)樵谛←?D 染色體上控制籽粒顏色的基因與抗穗發(fā)芽抗性緊密相關(guān)[26],同時不同的籽粒顏色對光譜的反射率有一定影響,在本研究中大多數(shù)波長范圍內(nèi)紅皮小麥的反射率要小于白皮小麥(如圖5所示)。此外,穗發(fā)芽往往會導(dǎo)致小麥粒重的損失[27]。為了讓本研究所用材料具有不同屬性的代表性,選用由不同基因組倍性、籽粒顏色、粒重組成的3 個品種作為重復(fù),在消除籽粒顏色、基因組倍性以及粒重給高光譜分析帶來的可能影響后,提取更為通用的波長特征,以期獲得更好的應(yīng)用。在本研究中,穗發(fā)芽無活力的小麥籽粒的光譜反射率要顯著高于正常有活力的小麥籽粒,梁琨等[14]發(fā)現(xiàn)感染赤霉病的小麥籽粒的高光譜反射率顯著高于正常健康小麥籽粒,而赤霉病感染率越高,小麥發(fā)芽率就越低,嚴(yán)重時可能導(dǎo)致種子無法發(fā)芽,因此無活力小麥籽粒的光譜反射率要顯著高于正常籽粒,本文中在520 nm波長處差異達(dá)到最大為0.375。
在小麥籽粒發(fā)芽檢測方面,由于發(fā)芽的小麥內(nèi)部伴隨一系列生理性狀發(fā)生改變,從而引起該性狀對光的吸收、透射和反射的變化,因此利用高光譜成像技術(shù)進(jìn)行小麥籽粒識別研究,甚至有望實(shí)現(xiàn)小麥籽粒發(fā)芽程度的快速判別。研究表明小麥籽粒發(fā)芽程度不同,小麥光譜反射率具有一定差異性。波段范圍在400~500 nm 內(nèi)小麥籽粒光譜反射率值最低。而波段范圍在550~900 nm的近紅外區(qū)域,小麥發(fā)芽籽粒光譜反射率要明顯高于未發(fā)芽小麥的反射率,這個變化趨勢與可見光區(qū)域相反。這種光譜反射率曲線變化趨勢與植物光譜反射率一致,與張東彥等研究結(jié)果的小麥中后期脅迫狀態(tài)下的高光譜反射率曲線變化規(guī)律類似[28]。有可能是由于發(fā)芽過程中的籽粒濕度有關(guān),長出來的幼芽也含有部分葉綠素,葉綠素對光的吸收產(chǎn)生的光譜形態(tài)[29]。與這些小麥籽粒相比較,干燥的或者長期浸泡的小麥基本不發(fā)芽,可見光區(qū)域反射率較高,近紅外區(qū)域則呈相反趨勢。
在建模方面,最小距離法、最大似然法和支持向量機(jī)建立小麥籽粒發(fā)芽識別模型,其中支持向量機(jī)的學(xué)習(xí)算法識別精度最高。潘運(yùn)宇[30]還發(fā)現(xiàn)利用支持向量機(jī)算法基于全光譜信息、圖像信息進(jìn)行分別建模時,對發(fā)芽籽粒的識別精度最高,其中基于光譜信息的發(fā)芽籽粒識別精度要大于基于圖像信息識別的準(zhǔn)確率。本研究同時融合了光譜、圖像信息獲得了96%的識別精度。
和傳統(tǒng)ASD光譜儀相比,高光譜成像儀既可獲取圖像數(shù)據(jù),又可獲取像元尺度的純光譜曲線,具有準(zhǔn)確獲取被測樣本光譜數(shù)據(jù)的優(yōu)勢,有利于混合光譜分析和參數(shù)反演模型的建立,在光譜和空間分辨率上均滿足監(jiān)測要求。本研究初步探究了利用Resonon 高光譜成像儀獲取小麥籽粒高光譜圖像,提取不同品種小麥籽粒的圖像和光譜特征,可區(qū)分小麥籽粒發(fā)芽情況,識別精度達(dá)到96%。因此,成像高光譜在小麥籽粒發(fā)芽識別方面具有應(yīng)用潛力。
四川農(nóng)業(yè)大學(xué)學(xué)報(bào)2023年6期