杜建軍 李大壯 廖生進(jìn) 盧憲菊 郭新宇 趙春江
(1.國家農(nóng)業(yè)信息化工程技術(shù)研究中心, 北京 100097; 2.數(shù)字植物北京市重點(diǎn)實(shí)驗(yàn)室, 北京 100097;3.華中農(nóng)業(yè)大學(xué)植物科學(xué)技術(shù)學(xué)院, 武漢 430070)
玉米產(chǎn)量和品質(zhì)與籽粒構(gòu)成和相對比例直接相關(guān)[1]。玉米籽粒包含表皮、胚、胚乳和空腔等結(jié)構(gòu),這些結(jié)構(gòu)和成分通常無法直接獲取,只能通過破壞性方式觀察內(nèi)部結(jié)構(gòu),獲取定性描述和有限的定量指標(biāo)。一種直接的人工測量方式,是利用刀片來分離籽粒胚和胚乳,然后測量質(zhì)量、體積等參數(shù)[2],該方式人工成本高、耗時(shí)長、精度低、主觀性強(qiáng)。另一種破壞性測量方式,是僅切割出籽粒的特征斷面,然后利用可見光成像方式獲得斷面圖像,進(jìn)而提取和分析該斷面上籽粒胚和胚乳信息[3]。然而,這種方式只能獲取二維指標(biāo),且對籽粒切割位置非常敏感,無法準(zhǔn)確反映籽粒真實(shí)三維結(jié)構(gòu)。另外,籽??涨灰彩欠从匙蚜N锢砗蜕硖匦缘闹匾誀睿c籽粒耐破碎性、爆裂性和硬度等緊密相關(guān)[4-5],上述方式均無法測量。
目前,CT無損成像技術(shù)已在植物表型組學(xué)研究中逐漸推廣應(yīng)用[5-13],在玉米籽粒內(nèi)部結(jié)構(gòu)和成分的研究已有相關(guān)應(yīng)用[14]。相關(guān)研究[4,15-17]大多使用Micro-CT進(jìn)行單粒掃描來獲取上百幅CT圖像,然后通過人工逐層勾選目標(biāo)輪廓,或者借助商業(yè)化軟件進(jìn)行半自動(dòng)化分析,不僅耗時(shí)耗力,而且交互過程具有極大主觀性??梢钥闯?,CT成像已成為研究籽粒精細(xì)結(jié)構(gòu)和成分的最重要手段,但迫切需要解決掃描成像效率低、表型測量自動(dòng)化程度低和魯棒性差等問題。
就CT掃描效率而言,對批量籽粒一次性掃描成像不僅可成倍提高掃描通量,而且保證了成像參數(shù)和環(huán)境條件一致性。因此,將獲取的批量籽粒CT圖像處理問題轉(zhuǎn)化為單顆籽粒(實(shí)例)分割問題,即從粘連籽粒中準(zhǔn)確拆分出高質(zhì)量的單顆籽粒。就籽粒表型測量方法而言,對單顆籽粒成分分析也可轉(zhuǎn)化為對籽粒內(nèi)部特征最顯著的胚和空腔成分的語義分割問題。目前,已涌現(xiàn)了大量基于卷積網(wǎng)絡(luò)的二維分割網(wǎng)絡(luò)(UNet[18]、SegNet[19]等)和三維分割網(wǎng)絡(luò)(UNet-3D[20]、VNet[21]等),在植物學(xué)和醫(yī)學(xué)的CT圖像分析中取得了成功。如SOLTANINEJAD等[22]設(shè)計(jì)了多損失多尺度的3D卷積網(wǎng)絡(luò),能不需要交互地完全自動(dòng)分割根系CT數(shù)據(jù),GHAFFARI等[23]使用改進(jìn)的級聯(lián)密集連接UNet-3D從腦CT中自動(dòng)分割出腫瘤。因此,訓(xùn)練、評估基于卷積神經(jīng)網(wǎng)絡(luò)的語義分割模型,構(gòu)建全自動(dòng)玉米籽粒表型分析管道,無損、高效、準(zhǔn)確提取籽粒內(nèi)部結(jié)構(gòu)和成分,在玉米籽粒品種和品質(zhì)精準(zhǔn)鑒定以及表型-基因型的關(guān)聯(lián)分析[24-25]方面均具有重要應(yīng)用價(jià)值。
本文使用Micro-CT批量籽粒掃描方式獲取CT圖像,使用分水嶺算法自動(dòng)提取單顆籽粒,利用改進(jìn)的UNet-3D網(wǎng)絡(luò)提取籽粒胚,并整合為自動(dòng)化表型分析管道,快速提取23項(xiàng)籽粒結(jié)構(gòu)和成分性狀,并用于不同玉米品種籽粒性狀統(tǒng)計(jì)分析和表型鑒定。
試驗(yàn)選取的玉米品種包括:登海605(DH605)、京科968(JK968)、先正達(dá)408(XZD408)和農(nóng)華5號(NH5)。挑選表面無破損的120顆玉米籽粒,使用Micro-CT設(shè)備(SkyScan 1172,美國Bruker公司)獲取籽粒CT圖像。
使用批量掃描的方式提高籽粒成像效率。由于籽粒大小不同,每次在泡沫圓盤(直徑30 mm)上放置6~8顆籽粒,用雙面膠固定(圖1a),并且籽粒之間盡可能保持分離,便于后續(xù)圖像處理。在Mirco-CT掃描過程中,在每個(gè)旋轉(zhuǎn)角度均可獲得投影圖(圖1b),使用配套的重構(gòu)軟件CT Scan NRecon(美國Bruker 公司,版本1.6.9.4)進(jìn)行斷層圖像重構(gòu)和圖像導(dǎo)出。本試驗(yàn)采用的掃描和重建參數(shù)如表1所示,對120顆玉米籽粒分批次掃描20次,每次可導(dǎo)出500幅1 000像素×1 000像素的8位BMP格式的圖像序列(圖1c)。平均單粒CT掃描成像時(shí)間為1 min。
圖1 Micro-CT圖像獲取與三維可視化Fig.1 Image acquisition and 3D visualization based on Micro-CT
CT圖像中包含有多顆籽粒,本文使用三維分水嶺算法[26]直接提取出每顆籽粒的三維CT圖像。然而,直接在原始尺寸的籽粒三維圖像上應(yīng)用三維分水嶺算法對內(nèi)存要求太高,因此首先對原始圖像2倍下采樣,下采樣后的三維圖像尺寸為250像素×500像素×500像素。通過大津算法[27]自動(dòng)確定閾值并二值化,并通過形態(tài)學(xué)操作移除籽粒內(nèi)部的孔洞獲得圖像掩碼(圖1e),進(jìn)而通過距離變換,將每個(gè)連通域標(biāo)記為一個(gè)種子點(diǎn),在圖像掩碼上實(shí)現(xiàn)三維分水嶺分割(圖1f)。分割結(jié)果與原圖像進(jìn)行“與”運(yùn)算即可提取出單顆籽粒CT圖像。120個(gè)單籽粒CT圖像中最大籽粒尺寸為150像素×200像素×200像素,因此使用該尺寸從原圖像中分別裁剪出籽粒圖像(圖1g)。使用光線投射算法[28]對單籽粒CT圖像序列進(jìn)行體繪制三維重建(圖1h),可以觀察到籽粒胚和胚乳間具有較明顯的結(jié)構(gòu)和形態(tài)差異。
表1 Micro-CT掃描與重建參數(shù)Tab.1 Scanning and reconstruction parameters of Micro-CT
基于單籽粒CT圖像構(gòu)建的玉米籽粒表型分析管道如圖2所示,依次提取出籽粒、籽粒胚、胚乳和空腔結(jié)構(gòu),并計(jì)算其性狀。在單顆籽粒CT圖像中,胚的像素灰度較大,特征明顯,易于識別和標(biāo)注;胚乳和胚緊密相連,胚乳可通過胚來計(jì)算;而空腔為籽粒內(nèi)部像素灰度極低的連通區(qū)域,可以設(shè)置閾值直接分割。因此,提出一種基于殘差連接和注意力機(jī)制的三維分割網(wǎng)絡(luò)Residual_ Attention_Unet-3D(RAUNet-3D),基于標(biāo)注的少量籽粒胚數(shù)據(jù),訓(xùn)練出較高精度的籽粒胚分割模型。進(jìn)而,使用圖像算術(shù)和形態(tài)學(xué)運(yùn)算將單顆籽粒分解為胚、胚乳和空腔等語義的三維圖像。最后,基于目標(biāo)掩碼圖像和基于Marching Cube(MC)[29]算法表面重建后的目標(biāo)表面模型,實(shí)現(xiàn)籽粒各語義對象的性狀提取。
圖2 籽粒表型管道主要流程圖Fig.2 Main flow chart of corn kernel pipeline
2.1.1數(shù)據(jù)標(biāo)注
在120顆籽粒CT圖像中,使用開源軟件ITK-SNAP(3.6.0)對50顆籽粒圖像中的胚進(jìn)行人工交互式標(biāo)注。標(biāo)注流程如下:首先,人工選取胚所在區(qū)域(圖3a中的紅框),調(diào)整二值化閾值初步提取出胚(圖3b);然后人工選擇種子點(diǎn)進(jìn)行區(qū)域增長,保證胚的完整性(圖3c、3d);在此基礎(chǔ)上,使用筆刷、形態(tài)學(xué)運(yùn)算等工具逐層精細(xì)調(diào)整掩碼(圖3e);最后,導(dǎo)出籽粒CT圖像(圖3f)對應(yīng)的胚標(biāo)簽(圖3g)。使用隨機(jī)旋轉(zhuǎn)操作對標(biāo)注好的50個(gè)籽粒CT及其標(biāo)簽圖像進(jìn)行數(shù)據(jù)增廣,將數(shù)據(jù)集擴(kuò)充至100個(gè),并按照比例8∶2隨機(jī)劃分為訓(xùn)練集和測試集。
圖3 使用ITK-SNAP數(shù)據(jù)標(biāo)注過程Fig.3 Data annotation process using ITK-SNAP
2.1.2網(wǎng)絡(luò)結(jié)構(gòu)
圖4 RAUNet-3D架構(gòu)Fig.4 RAUNet-3D architecture
UNet-2D和UNet-3D是經(jīng)典的基于UNet的二維和三維語義分割模型,均由編碼器和解碼器組成,通過在解碼階段合并相應(yīng)的編碼特征,有效提高語義分割精度,并且基于較少的訓(xùn)練樣本數(shù)據(jù)集也能訓(xùn)練出精度較高的語義分割模型。UNet-2D和UNet-3D的區(qū)別主要在于特征抽取過程中是否利用了目標(biāo)的圖像層間信息。UNet-3D實(shí)現(xiàn)三維圖像的端到端分割,使用3D卷積充分捕獲目標(biāo)空間信息,有效提高語義分割精度。本文提出的RAUNet-3D三維分割網(wǎng)絡(luò),主要是在原始UNet-3D網(wǎng)絡(luò)基礎(chǔ)上添加殘差連接和注意力機(jī)制,網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示。該端到端網(wǎng)絡(luò)由編碼器和解碼器組成,輸入32×96×96的CT圖像,輸出32×96×96的胚掩碼。網(wǎng)絡(luò)分為4層,在編碼階段進(jìn)行3次下采樣,在解碼階段進(jìn)行3次上采樣,每層由通過殘差相連接的兩個(gè)Conv3D-BN-ReLU模塊構(gòu)成(圖4中Residual Convolution模塊),該殘差模塊能有效防止網(wǎng)絡(luò)退化和加速網(wǎng)絡(luò)收斂。每層卷積核數(shù)目分別為32、64、96和128。
在解碼階段中嵌入注意力模塊,用于從合并過來的下采樣特征中提取對恢復(fù)胚掩碼較重要的特征。圖4中的Attention Gate為注意力模塊,g為解碼階段上采樣的特征,x為編碼階段產(chǎn)生的需要合并至上采樣過程中的特征。首先,對g和x應(yīng)用1×1×1的卷積,將通道數(shù)調(diào)整一致(設(shè)置為32);然后,將張量對應(yīng)位置元素相加,并通過ReLU激活;最后,利用1×1×1卷積為下采樣特征x的每個(gè)通道訓(xùn)練一個(gè)權(quán)重,經(jīng)過張量相乘后得到注意力模塊輸出的下采樣特征。
RAUNet-3D中的基本運(yùn)算包括3D卷積、Batch Normalization和ReLU。其中,3D卷積可以同時(shí)對連續(xù)多層CT圖像進(jìn)行特征提??;Batch Normalization在一個(gè)Batch的每個(gè)通道上對3D卷積后的數(shù)據(jù)進(jìn)行歸一化,避免數(shù)據(jù)分布過于分散;ReLU激活函數(shù)能增加網(wǎng)絡(luò)的非線性擬合能力,相較于sigmod函數(shù)與tanh函數(shù),ReLU計(jì)算簡單且克服了梯度消失問題。下采樣和上采樣分別采用3D最大值池化(MaxPool3d)和逆卷積(ConvTranspose3d)的方式。
2.1.3網(wǎng)絡(luò)訓(xùn)練
計(jì)算環(huán)境CPU為Intel(R) Xeon(R) E5-2699,256GB RAM,操作系統(tǒng)為Ubuntu 20.04.2,顯卡為RTX2080Ti(11GB顯存),深度學(xué)習(xí)框架為pytorch-gpu1.7,Python版本為3.8.8。Epoch設(shè)置為300,學(xué)習(xí)率設(shè)置為0.000 1,Batch_size為8,采用適應(yīng)性矩估計(jì)(Adaptive momentum estimation,Adam)優(yōu)化算法進(jìn)行訓(xùn)練,損失函數(shù)采用Dice_Loss,公式為
(1)
式中X——預(yù)測像素點(diǎn)集
Y——真實(shí)像素點(diǎn)集
LDice——Dice_Loss函數(shù)
利用骰子系數(shù)(Dice similarity coefficient,DICE)和交并比(Intersection over union,IoU)評估網(wǎng)絡(luò)精度,計(jì)算公式分別為
(2)
(3)
式中DICE——骰子系數(shù)IoU——交并比
圖5 訓(xùn)練和測試的數(shù)據(jù)處理Fig.5 Data processing for training and testing
在模型訓(xùn)練和推理階段,均采用分塊方式處理輸入圖像。在模型訓(xùn)練階段,從原始CT圖像和其標(biāo)簽中隨機(jī)采樣32×96×96的體數(shù)據(jù)輸入網(wǎng)絡(luò)(圖5a)。在模型推理階段,以(32,64,64)為步長從輸入CT體數(shù)據(jù)中依次提取出32×96×96的體數(shù)據(jù),輸入分割網(wǎng)絡(luò)進(jìn)行推理,最后將分割結(jié)果按照實(shí)際位置合并,得到籽粒胚的掩碼圖像(圖5b)。
圖6為從單顆籽粒中提取玉米內(nèi)部成分和結(jié)構(gòu)的流程圖,圖中紅色、藍(lán)色、紫色和綠色箭頭分別表示胚、胚乳、空腔和籽粒的分割和表面重建流程。首先將單顆籽粒CT圖像輸入到RAUNet-3D網(wǎng)絡(luò),自動(dòng)分割出胚掩碼。然后,對單顆籽粒CT圖像進(jìn)行灰度直方圖分析,利用大津算法確定二值化閾值并獲得籽粒掩碼圖像,進(jìn)而生成籽粒外輪廓包圍的掩碼圖像。最后,通過上述掩碼間算術(shù)運(yùn)算分別得到胚乳和空腔的掩碼圖像。在當(dāng)前圖像分辨率條件下,籽粒表皮與胚乳幾乎融為一體,經(jīng)過多次實(shí)驗(yàn),將籽粒腐蝕2個(gè)像素可去除表皮。
圖6 籽粒三維性狀提取管道Fig.6 3D structural analysis pipeline of corn kernel
基于CT圖像計(jì)算的籽粒及其內(nèi)部結(jié)構(gòu)的性狀主要分為2類:像素灰度和幾何形態(tài)。像素灰度反映物質(zhì)對X射線的吸收特性[30],可使用灰度均值和灰度標(biāo)準(zhǔn)差表示。籽粒胚和胚乳的掩碼分別與原始圖像進(jìn)行“與”運(yùn)算,可以得到籽粒胚和胚乳圖像。用于計(jì)算灰度均值和標(biāo)準(zhǔn)差?;叶染礕M和灰度標(biāo)準(zhǔn)差GSD計(jì)算公式分別為
(4)
(5)
式中g(shù)(i)——第i個(gè)體素的灰度
n——體素個(gè)數(shù)
幾何形態(tài)性狀包括表面積、體積以及粒長、粒寬和粒厚等??梢苑謩e利用MC算法重建后的三維表面模型或者掩碼的三維圖像來計(jì)算。其中,籽粒、胚、胚乳和空腔的三維表面模型(圖6l、6k、6j、6i)分別是掩碼(圖6g、6c、6d、6h)重建的結(jié)果,可用于計(jì)算表面積。計(jì)算過程為:設(shè)表面模型上單個(gè)三角形的頂點(diǎn)坐標(biāo)分別為A1(x1,y1,z1)、A2(x2,y2,z2)、A3(x3,y3,z3),根據(jù)歐幾里德公式計(jì)算三角形的邊長為a、b和c,再由海倫公式計(jì)算三角形面積為s。三維表面模型的表面積為所有三角形面積之和S。計(jì)算式為
(6)
根據(jù)目標(biāo)掩碼三維圖像直接計(jì)算目標(biāo)體積,計(jì)算公式為
V=CobjVvoxel
(7)
式中Cobj——掩碼體素?cái)?shù)
V——目標(biāo)體積
Vvoxel——單個(gè)體素體積,本文是27 μm×27 μm×27 μm
另外,矩形度和球形度分別用于衡量籽粒與球體、立方體的接近程度。粒長、粒寬和粒厚用籽粒表面模型的三維方向包圍盒的3個(gè)邊長表示(圖6i),即最長邊為粒長、次長邊為粒寬、最短邊為粒厚。本文籽粒表型提取效率為10 s/粒,可以獲得23項(xiàng)表型參數(shù),如表2所示。
表2 籽粒及其內(nèi)部結(jié)構(gòu)表型Tab.2 Phenotypic traits of corn kernel and its inner structure
獲得4個(gè)品種籽粒的23個(gè)表型指標(biāo)后,使用描述性統(tǒng)計(jì)方法調(diào)查各籽粒品種間的表型指標(biāo)分布和差異情況;使用主成分分析(Principal component analysis,PCA)算法提取表型指標(biāo)的前兩個(gè)主成分,并進(jìn)行聚類分析;利用經(jīng)典的機(jī)器學(xué)習(xí)分類模型,包括K近鄰(K-nearest neighbor,KNN)、支持向量機(jī)(Support vector machines,SVM)和隨機(jī)森林(Random forest,RF)進(jìn)行籽粒品種鑒定。上述分析分別使用R語言(4.1.1)和Python(3.8.8)實(shí)現(xiàn),其中PCA分析使用prcomp函數(shù),繪圖使用ggplot2包,機(jī)器學(xué)習(xí)算法使用sklearn包。
3.1.1語義分割網(wǎng)絡(luò)精度評估
籽粒胚的分割精度至關(guān)重要,直接影響籽粒內(nèi)胚乳和空腔量化。首先在訓(xùn)練集上評估UNet-2D、UNet-3D和RAUNet-3D的語義分割模型精度。不同模型的訓(xùn)練損失值和訓(xùn)練精度如圖7所示。三維語義分割模型(UNet-3D和RAUNet-3D)的訓(xùn)練精度均高于二維語義分割模型(UNet-2D),說明3D網(wǎng)絡(luò)利用CT圖像層間關(guān)系,有利于提高模型分割精度。另外,經(jīng)典的三維語義分割模型(UNet-3D)收斂速度較慢,而改進(jìn)后的RAUNet-3D模型能夠更快收斂且精度更高。
圖7 訓(xùn)練集上不同模型的損失值和精確率曲線Fig.7 Loss and accuracy curves of different models on training sets
在測試集上評估3個(gè)模型的語義分割精度,分別采用DICE和IoU作為評價(jià)指標(biāo),結(jié)果如表3所示。整體上,三維語義分割模型比二維分割模型獲得更高精度,RAUNet-3D、UNet-3D和UNet-2D模型的DICE和IoU依次增大。圖8比較了UNet-2D、UNet-3D和RAUNet-3D語義分割結(jié)果,圖中上3行分別表示一個(gè)籽粒CT不同的層,第4行表示三維可視化結(jié)果,紅圈表示Unet-3D和RAUNet-3D胚邊緣部分分割效果對比。可以看出,由于UNet-2D語義分割模型僅考慮了單層CT圖像特征,某些層上的分割結(jié)果容易出現(xiàn)過分割和欠分割現(xiàn)象。將逐層分割結(jié)果合并為三維分割掩碼并進(jìn)行三維渲染,可以發(fā)現(xiàn)存在大量噪點(diǎn)或孤島。
表3 測試集上不同深度學(xué)習(xí)模型的精度對比Tab.3 Accuracy comparison of different depth learning models on test set
由于UNet-3D和RAUNet-3D語義分割模型利用了圖像層間關(guān)系,極大抑制了過分割和欠分割現(xiàn)象。RAUNet-3D在特征合并時(shí)引入了注意力機(jī)制,相較于UNet-3D,對目標(biāo)的邊緣部分分割得更加精準(zhǔn)。因此,本文在籽粒表型管道中集成RAUNet-3D模型用于提取籽粒胚。
圖8 不同模型分割結(jié)果比較Fig.8 Comparison of segmentation results of different models
3.1.2管道測量一致性評估
利用圖6提出的表型計(jì)算管道,計(jì)算4個(gè)品種共120顆籽粒的23個(gè)表型指標(biāo)。使用游標(biāo)卡尺人工測量所有籽粒的粒長、粒寬和粒厚數(shù)據(jù),采用決定系數(shù)R2和均方根誤差(Root mean square error,RMSE)進(jìn)行評估。
圖9顯示了粒長、粒寬和粒厚的本文方法測量值與人工測量值的關(guān)系。其中,粒長、粒寬和粒厚的R2分別為0.902、0.926和0.904,RMSE分別為0.325、0.253、0.258 mm。表明本文方法測量結(jié)果與人工測量值具有較好的一致性。
圖9 管道計(jì)算值與人工測量值比較(粒長、粒寬和粒厚)Fig.9 Comparison between computed and manual measured values of kernel length, width and thickness
對4個(gè)品種120顆籽粒的所有表型指標(biāo)進(jìn)行初步統(tǒng)計(jì)分析,計(jì)算出各項(xiàng)指標(biāo)的均值、標(biāo)準(zhǔn)差、最小值、中位數(shù)和最大值,如表4所示。4個(gè)玉米品種籽粒的23項(xiàng)性狀經(jīng)過Z-score歸一化處理,利用箱線圖顯示各個(gè)品種籽粒表型的分布差異(圖10),圖中灰色、黃色、藍(lán)色和紅色分別表示空腔、胚乳、胚和籽粒表型指標(biāo)。從每個(gè)品種中選擇2顆典型籽粒,分別顯示籽粒及其內(nèi)部結(jié)構(gòu)的三維形態(tài)差異(圖11),可以看出:①品種間籽??涨徊町愝^大,XZD408和DH605的籽粒空腔要遠(yuǎn)大于JK968和NH5品種的籽??涨?。②品種間籽粒、胚、胚乳和體積表面積差異較大,XZD408和NH5的籽粒個(gè)體、胚和胚乳的體積和表面積均較大,而JK968和DH605的籽粒個(gè)體、胚和胚乳的體積和表面積均較小。③DH605的胚和胚乳的灰度均值比其它3個(gè)品種小,表明該品種籽粒的密度較小,對X射線的吸收較弱。④從粒形上看,JK968和NH5偏扁平一些,球形度較小、矩形度較大。而DH605和XZD408偏圓一些,球形度較大、矩形度較小。⑤扁平籽粒的比表面積通常要大于圓形籽粒,相比于DH605和XZD408,扁平的NH5和JK968的比表面積較大。
表4 籽粒表型的統(tǒng)計(jì)描述Tab.4 Statistical description of kernel phenotypes
圖10 4個(gè)品種的玉米籽粒表型箱線圖Fig.10 Phenotypic boxplots of corn kernel of four varieties
圖11 不同品種的玉米籽粒三維結(jié)構(gòu)Fig.11 3D structures of corn kernels of different varieties
為了考察不同玉米品種籽粒表型間區(qū)分度,在所有籽粒的表型數(shù)據(jù)上進(jìn)行PCA分析(圖12),得到的前兩個(gè)主成分分別解釋了38%和21.5%的表型變異。從圖12a可以看出,第1個(gè)主成分和第2個(gè)主成分能很大程度上區(qū)分出DH605、JK968、XZD408和NH5品種的籽粒。從圖12b可知,第1個(gè)主成分與籽粒的幾何形態(tài)特征相關(guān)(比如粒長、粒寬、籽粒體積、胚體積、空腔體積、籽粒表面積、胚乳表面積和胚表面積),第2個(gè)主成分主要與籽粒胚和胚乳的CT灰度性狀相關(guān)。
圖12 籽粒主成分分析Fig.12 PCA analysis of corn kernel
進(jìn)一步利用KNN、RF和SVM訓(xùn)練4類玉米品種的籽粒分類器。采用5折交叉驗(yàn)證來優(yōu)選分類模型,3類模型精度及平均精度如表5所示。其中SVM 的平均識別精度最高,可達(dá)90.4%。這表明,基于本文方法提取出的籽粒及其內(nèi)部結(jié)構(gòu)表型對不同品種籽粒的分類和鑒定具有價(jià)值。
表5 不同機(jī)器學(xué)習(xí)模型的分類精度Tab.5 Classification accuracy of different machine learning models %
(1)針對基于Micro-CT的玉米籽粒表型分析中存在的掃描成像效率低、表型測量自動(dòng)化和魯棒性差等問題,提出了自動(dòng)化玉米籽粒三維表型分析方法,快速解析玉米籽粒及其內(nèi)部結(jié)構(gòu)的23項(xiàng)表型,粒長、粒寬和粒厚的R2分別為0.902、0.926和0.904。對4個(gè)品種共120顆玉米籽粒進(jìn)行測試,籽粒表型提取效率為10 s/粒。
(2)對批量籽粒進(jìn)行掃描成像,使用Watershed算法從批量籽粒CT圖像中拆分出每顆籽粒,提高了Micro-CT對籽粒的掃描通量。
(3)基于殘差連接和注意力機(jī)制的三維分割網(wǎng)絡(luò)(RAUNet-3D)對籽粒胚的分割精度可達(dá)93.4%,為計(jì)算籽粒胚和胚乳等內(nèi)部結(jié)構(gòu)性狀提供依據(jù)。
(4)籽粒及其內(nèi)部結(jié)構(gòu)的23項(xiàng)性狀具有明顯品種區(qū)分度,可用于玉米籽粒品種分類和鑒定。
農(nóng)業(yè)機(jī)械學(xué)報(bào)2022年12期