(1.,南寧53000;2.,重慶400715;3.,重慶奉節(jié)404600)
中圖分類(lèi)號(hào):S572;S126文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1007-5119(2025)02-0101-12
An Analytical Model for Assessing Tobacco Seedling Uniformity
LI Qunling1, SUN Jiazhao, WANG Zhenguo3, CHENG ,RAN Yu'ao2, LI
,DING Wei1*
(1.ChinaTobaoagxistrialCoLtd.,ago,Cina;2.CllgeoantrotectioouthwstUiy
Chongqing 40o715,China;3.FengjieBranchofChongqingTobacoCompany,ChinaNationalTobacco Corporatio,F(xiàn)engie 404600, Chongqing, China)
Abstract:Toacheverapidassessmentandeficentanalysisoftheuniforityoftobaccosedlings inintensiveedlingfactorythis studyemploysageneralizedaditive model(GAM)toanalyetobaccoseed nurserydataadscrnfor idicatorsoftobaccoseedling uniformity. We evaluatedRandomForest algorithm,BPNeuralNetworkalgorithm,and Support VectorMachine(SVM)algorithm. Particle Swarm Optimization (PSO)isthen appliedtooptimizeeachof these modelsseparately.Thisstudyconstructed image recognitionmodelsforassessingtheuniforityof tobaccseednurseryusingdeepleaingalgorithms,twooptimizers,Adamand Nadam,specificallyAlexNet,ResNet-10l,and GoogleNet.Teresearchresultsindicated thattheplantheight,stemcicuferee, and numberofefectiveleaves of tobaccoseedlings hadasignificantimpactontheuniformityofthe tobaccoseedlings.ThePartcle Swarm Optimized Random Forest model demonstrates the best performance, with accuracy of 8 8 . 0 0 % valueof O.69,andMean AbsoluteError(MAE)of 0.13.TheAdam-GoogLeNet modelshows thebestrecognition performance,averagingacuracyof 9 3 . 8 9 % Overall,findings of thisstudy provideareasonable basis for thescientificevaluationoftobacco nurserybeduniformityand offer support for the development of tobacco seedling uniformity image recognition systems.
Keywords: tobacco seedbed; uniformity index; deep learning; uniformity model; image recognition
煙草是一種重要的經(jīng)濟(jì)作物,煙苗整齊度是煙草生產(chǎn)的關(guān)鍵指標(biāo)之一,直接影響田間管理效果。整齊度高的煙苗易于統(tǒng)一管理,可以提高移栽效率和質(zhì)量,使煙苗在田間生長(zhǎng)整齊,促進(jìn)光照、水分和養(yǎng)分均衡利用。煙苗整齊度依靠傳統(tǒng)人工方法評(píng)估,不僅效率低下,而且易受到主觀影響導(dǎo)致評(píng)估結(jié)果產(chǎn)生誤差,難以實(shí)現(xiàn)苗床精準(zhǔn)化管理。集約化育苗工廠的興起,對(duì)作物整齊度的科學(xué)評(píng)價(jià)和高效管理提出了更高的要求。在作物苗期整齊度研究中,Yang等1利用植被覆蓋率、葉面指數(shù)、植物高度等數(shù)據(jù),采用圖像學(xué)習(xí)方法對(duì)小麥整齊度進(jìn)行評(píng)估,可實(shí)現(xiàn)無(wú)人機(jī)輔助判別小麥整齊度。Liu等[2采用無(wú)人機(jī)搜集小麥幼苗RGB圖像,使用變異系數(shù)、覆蓋率等方法分析小麥出苗整齊度。Zhou等]采用基于閾值優(yōu)化的圖像分割方法對(duì)玉米幼苗圖像進(jìn)行提取,實(shí)現(xiàn)玉米出苗整齊度評(píng)估。以往研究為作物出苗整齊度圖像識(shí)別提供了有效方法,但對(duì)整齊度指標(biāo)的確立和模型構(gòu)建方面研究較少。
苗床內(nèi)煙苗整體生長(zhǎng)情況的快速高效判別,有助于提升煙草苗床管理的精準(zhǔn)度和智能化水平,降低人工成本,提高生產(chǎn)效率。因此,本研究通過(guò)采集煙草育苗數(shù)據(jù),采用廣義加性模型分析影響煙株苗床整齊度的指標(biāo),采用隨機(jī)森林、BP神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)構(gòu)建煙草苗床整齊度評(píng)估模型,同時(shí)采用深度卷積神經(jīng)網(wǎng)絡(luò)(AlexNet)、殘差網(wǎng)絡(luò)(ResNet-101)和谷歌網(wǎng)絡(luò)(GoogleNet)開(kāi)發(fā)煙草苗床整齊度圖像識(shí)別模型,以實(shí)現(xiàn)對(duì)煙苗整齊度的快速、自動(dòng)化評(píng)估。
1 材料與方法
1.1試驗(yàn)地概況與試驗(yàn)材料
試驗(yàn)在重慶渝東北地區(qū)煙草集約化育苗工廠開(kāi)展,品種為當(dāng)?shù)刂髟云贩N云煙87。育苗時(shí)間為2024年3—5月,育苗周期 6 0 d 。漂浮育苗,育苗池營(yíng)養(yǎng)液深度控制在 8 c m 左右。
1.2煙苗素質(zhì)數(shù)據(jù)采集
采用“五點(diǎn)取樣法\"對(duì)每盤(pán)煙苗標(biāo)記5株煙株,移栽前測(cè)量標(biāo)記煙苗的株高、莖圍、有效葉數(shù),用清水洗去基質(zhì)露出全部根系,根莖葉分離后烘干分別稱(chēng)取干質(zhì)量。每株煙苗采集到的數(shù)據(jù)為1條數(shù)據(jù),每盤(pán)采集5條數(shù)據(jù),共采集240盤(pán)1200條數(shù)據(jù)。使用手機(jī)采集煙苗圖像(無(wú)任何修圖處理),所用手機(jī)型號(hào)為iphone 1 4 P r o (像素4800萬(wàn)),三星s23ultra(像素2.0億),小米12(像素5000萬(wàn))。采集方式為2種:1,平行于煙苗種植方向距離煙苗頂部 5 0 c m 處進(jìn)行圖像拍攝(圖1a);2,與地面呈 夾角距離煙苗頂部 4 0 c m 處斜攝煙苗(圖1b)。兩種方法均要求在取景范圍內(nèi)至少有1盤(pán)煙苗被完整拍到,共采集3019張圖像。
1.3煙苗整齊度指標(biāo)建立
采用廣義加性模型[4-5](GeneralizedAdditiveModel,GAM)對(duì)煙苗素質(zhì)數(shù)據(jù)與煙苗整齊度進(jìn)行分析,篩選出對(duì)煙苗整齊度具有顯著影響的因子。采用Magic進(jìn)行平滑參數(shù)優(yōu)化。同時(shí)采用2種樣條函數(shù) B-spline function (BS) 和 P-spline function(PS)分析各加性項(xiàng)的擬合殘差。
圖1煙苗圖像數(shù)據(jù)采集示意圖
Fig. 1Schematic illusration of tobacco seedling image data acquisition
在本研究中GAM模型公式為:
,煙苗整齊度變量均值的鏈接函數(shù);
第 i 個(gè)觀測(cè)值的期望值;
,截距項(xiàng);
,未知平滑函數(shù),對(duì)應(yīng)于k個(gè)預(yù)測(cè)變量xi1,xi2,…xik;Xik,是第 i 個(gè)觀測(cè)值的第 k 個(gè)預(yù)測(cè)變量的值。
1.4煙苗整齊度模型的構(gòu)建
煙苗整齊度可歸納為“整齊”與“不整齊”二分類(lèi)問(wèn)題,“整齊\"則不需要剪葉,“不整齊”則需要剪葉以促進(jìn)煙苗生長(zhǎng)整齊。通過(guò)廣義加性模型對(duì)煙苗株高、莖圍、有效葉數(shù)、總干質(zhì)量進(jìn)行分析,篩選出對(duì)煙苗整齊度具有顯著影響的關(guān)鍵因子。運(yùn)用隨機(jī)森林(RandomForest)、BP神經(jīng)網(wǎng)絡(luò)(BackPropagationNeuralNetwork)和支持向量機(jī)(SupportVectorMachines)3種方法對(duì)篩選到的因子與煙苗整齊度數(shù)據(jù)進(jìn)行模型構(gòu)建。將測(cè)試集準(zhǔn)確率、決定系數(shù) 與平均絕對(duì)誤差MAE作為不同模型評(píng)判指標(biāo),篩選出最優(yōu)模型。
隨機(jī)森林通過(guò)構(gòu)建多個(gè)決策樹(shù)來(lái)進(jìn)行分類(lèi)或回歸預(yù)測(cè),對(duì)二分類(lèi)問(wèn)題具有很好的處理性能[6-7]。本研究將隨機(jī)森林的預(yù)測(cè)過(guò)程表示為一個(gè)函數(shù)的集成:
是第 i 棵樹(shù)對(duì)輸入 x 的預(yù)測(cè)結(jié)果, B 是樹(shù)的總數(shù), u 表示模型入?yún)⑻卣黜?xiàng),mode表示眾數(shù),本研究為二分類(lèi)中出現(xiàn)次數(shù)最多的類(lèi)別。模型超參數(shù)設(shè)置為決策樹(shù)數(shù)目100,最小葉子數(shù)目1,訓(xùn)練集與測(cè)試集比例隨機(jī)劃分為 0 . 7 5 : 0 . 2 5 。
BP神經(jīng)網(wǎng)絡(luò)包含一個(gè)輸入層、一個(gè)或多個(gè)隱藏層以及一個(gè)輸出層。BP神經(jīng)網(wǎng)絡(luò)通過(guò)在訓(xùn)練過(guò)程中調(diào)整網(wǎng)絡(luò)中的權(quán)重和偏置來(lái)最小化輸出誤差,利用一種監(jiān)督學(xué)習(xí)技術(shù)來(lái)訓(xùn)練網(wǎng)絡(luò),使其能夠?qū)斎藬?shù)據(jù)進(jìn)行分類(lèi)[8]。本研究中模型超參數(shù)設(shè)置為最大迭代次數(shù)1000,目標(biāo)訓(xùn)練誤差 ,學(xué)習(xí)率 0 . 0 1 。
支持向量機(jī)是機(jī)器學(xué)習(xí)中一種基于最佳邊距的分類(lèi)技術(shù),屬于二進(jìn)制分類(lèi)器[9-10]。本研究中設(shè)置該模型懲罰因子 c = 1 0 . 0 ,徑向基函數(shù)參數(shù) g = 0 . 0 1 。
粒子群優(yōu)化技術(shù)是一種基于群體的元啟發(fā)式技術(shù),用于解決優(yōu)化問(wèn)題[11]。為了提高煙苗整齊度評(píng)估分析模型的準(zhǔn)確度,采用粒子群算法對(duì)3種基礎(chǔ)模型進(jìn)行優(yōu)化。粒子群優(yōu)化算法中學(xué)習(xí)因子c 1 = 4 . 0 , c 2 = 4 . 0 ,種群更新次數(shù)maxgen 1 = 3 0 ,種群規(guī)模sizepop 。
采用R軟件4.3.3進(jìn)行分析,gamm函數(shù)對(duì)廣義加性模型進(jìn)行擬合,MATLAB2023b構(gòu)建煙苗整齊度模型,Python3.11構(gòu)建煙苗整齊度識(shí)別模型。
1.5煙苗整齊度圖像識(shí)別
1.5.1圖像數(shù)據(jù)處理研究中為得到最佳的模型識(shí)別結(jié)果,采用隨機(jī)選取方式采集圖片樣本,拍攝圖片兼具單一背景和復(fù)背景環(huán)境。拍攝過(guò)程中不采用微距鏡頭放大倍數(shù)??梢?jiàn)光圖像采集的圖片數(shù)量約為3000張,進(jìn)行篩選后總計(jì)獲得有效圖片2242張。采取以下步驟進(jìn)行圖像預(yù)處理和數(shù)據(jù)增強(qiáng):將圖像大小調(diào)整為 9 6×9 6 像素,隨機(jī)旋轉(zhuǎn)圖像,旋轉(zhuǎn)的角度在 到
之間;從圖像中心裁剪出一個(gè)2 2 4 × 2 2 4 像素的區(qū)域,以 5 0 % 的概率水平翻轉(zhuǎn)圖像,以 50 % 的概率垂直翻轉(zhuǎn)圖像;對(duì)圖像的顏色進(jìn)行隨機(jī)擾動(dòng),包括亮度、對(duì)比度、飽和度和色調(diào)的變化,以 2 . 5 % 的概率將圖像轉(zhuǎn)換為灰度圖像。數(shù)據(jù)增強(qiáng)效果如圖2。將增強(qiáng)圖像轉(zhuǎn)換為PyTorch張量(Tensor),并將其從整數(shù)像素值歸一化為0到1之間的浮點(diǎn)數(shù),使用ImageNet數(shù)據(jù)集的均值和標(biāo)準(zhǔn)差對(duì)圖像張量進(jìn)行標(biāo)準(zhǔn)化。
1.5.2模型參數(shù)設(shè)置采用AlexNet、ResNet-101和GoogleNet三種網(wǎng)絡(luò)結(jié)構(gòu)對(duì)圖像數(shù)據(jù)進(jìn)行訓(xùn)練,并使用Adam優(yōu)化器和Nadam優(yōu)化器提高訓(xùn)練過(guò)程中的收斂速度和性能。AlexNet作為早期的深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)之一,有8層網(wǎng)絡(luò)結(jié)構(gòu),包括5層卷積層和3層全連接層[12(結(jié)構(gòu)如圖3a)。
ResNet-101作為預(yù)訓(xùn)練模型,可用于遷移學(xué)習(xí)[13](結(jié)構(gòu)如圖3b)。GoogleNet已廣泛應(yīng)用于圖像識(shí)別,該模型使用稀疏網(wǎng)絡(luò)結(jié)構(gòu)來(lái)改善過(guò)度擬合和計(jì)算資源過(guò)度占用的缺點(diǎn)[14-15](結(jié)構(gòu)如圖3c)。
圖像識(shí)別訓(xùn)練計(jì)算機(jī)使用Win11X64操作系統(tǒng)作為試驗(yàn)軟件環(huán)境,采用深度學(xué)習(xí)開(kāi)源框架PyTorch。計(jì)算機(jī)內(nèi)存為 3 2 G B ,搭載13th Gen Intel(R)Core(TM)i9-13900H2.60GHz,支持GPU加速和動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò),采用英偉達(dá)RTX460Ti的GPU對(duì)深度學(xué)習(xí)模型進(jìn)行加速。本次研究中將模型訓(xùn)練周期設(shè)置為50epoch。在使用過(guò)程中添加RectifiedLinear U n i t( R e L U ) 作為激活函數(shù),解決梯度消失問(wèn)題并加快訓(xùn)練過(guò)程,結(jié)構(gòu)如圖 。導(dǎo)入煙苗整齊度照片數(shù)據(jù),劃分兩個(gè)數(shù)據(jù)集“Lowneatness\"和“Highneatness”,分別代表煙苗不整齊和整齊。隨機(jī)選出 90 % 和 10 % 的圖像樣本分別作為訓(xùn)練集與測(cè)試集。學(xué)習(xí)率設(shè)置為 0 . 0 1 。采用StepLR調(diào)度器,用于在訓(xùn)練過(guò)程中調(diào)整優(yōu)化器的學(xué)習(xí)率。在每個(gè)迭代次數(shù)結(jié)束后將學(xué)習(xí)率乘以一個(gè)因子gamma,gamma 1 = 0 . 1 。每7個(gè)epoch調(diào)整一次學(xué)習(xí)率。
2結(jié)果
2.1煙草苗床整齊度指標(biāo)分析
本試驗(yàn)共采集煙苗生長(zhǎng)指標(biāo)數(shù)據(jù)1200條。廣義加性模型由含有截距的參數(shù)項(xiàng)和含有平滑項(xiàng)的非參數(shù)項(xiàng)組成,模型擬合結(jié)果如表1所示,從中可以看出煙苗株高、莖圍和有效葉數(shù)對(duì)擬合結(jié)果有顯著影響 ( p<0 . 0 5 ) 。
表1廣義加性模型2種樣條函數(shù)的擬合參數(shù)
Table1 Parameters of two spline functionsin the generalized additive model
在廣義加性模型中第 i 個(gè)加性項(xiàng)的偏殘差是指,當(dāng)因變量減去不包含該加性項(xiàng)在內(nèi)的其他所有加性項(xiàng)的估計(jì)值后,所得到的殘差。從偏殘差(partialresiduals)分布圖(圖4)看出,在2種光滑樣條函數(shù)中, 、
和
殘差呈現(xiàn)離散分布,表明擬合效果較好。而
則呈現(xiàn)出規(guī)則分布,這可能由于在研究過(guò)程中苗床的煙苗莖圍數(shù)值較為集中。2個(gè)樣條函數(shù)參數(shù)項(xiàng)值及殘差分布圖非常接近,表明模型較為穩(wěn)定。
2.2 煙苗整齊度模型的構(gòu)建結(jié)果
根據(jù)廣義加性模型分析結(jié)果得出煙苗有效葉數(shù)、莖圍和株高對(duì)煙苗整齊度具有顯著影響,因此采用這3個(gè)因素作為模型入?yún)⒁蜃?,煙苗是否整齊(0,不整齊;1,整齊)為模型輸出指標(biāo)。
隨機(jī)森林模型預(yù)測(cè)結(jié)果如圖5所示。模型訓(xùn)練集準(zhǔn)確率為 9 8 . 3 3 % (圖5a),測(cè)試集準(zhǔn)確率為 8 3 . 3 3 % (圖5b),訓(xùn)練集混淆矩陣中選取的180個(gè)樣本第
a 0.3 ·· 中 X 1.00 0.3 . : 00 白 X 1.00 b 0.3 ·i : : X 1.00 0.3 0. X 1.00
kassrtss 0 心 0.75 kassiss 0 e0·0 0.75 sessiss 0 心 0.75 keeesisr 0 o06 0.750.50 0.50 0.50 0.50
-0.3 0.25 -0.3 0.25 -0.3 0.25 0.3 0.250 : ·. 0 0 ·. 0
-0.6-1 -0.6- T -0.6 -0.6-10 0.250.500.751.00 0 0.250.500.751.00 0 0.25 0.500.751.00 0 0.250.500.751.00X X X X
es ¥ .0 天 x 1.0 mps X 1.0 8. 00 X 1.0.ii0 0.50 0 福 8 0.50 0- 0.50 0.50心 0.25 1 0.25 心 0.25 \\` 富業(yè) 0.25
-0.3 -0.3 80 -0.3 -0.3 5000 0 0 0
-0.6- P -0.6-1 -0.6-1 r -0.6-10 0.250.500.751.00 0 0.250.500.751.00 0 0.250.50 0.751.00 0 0.250.500.751.00X X4 X X4
Fig.4Partial residuals of input factors inBS spline function (a)andPS spline function (b)in generalized aditive model一分類(lèi)準(zhǔn)確率為 9 8 . 9 % ,第二分類(lèi)準(zhǔn)確率為 9 7 . 8 % 訓(xùn)練集總體第一分類(lèi)樣本準(zhǔn)確率 9 7 . 8 % ,第二分類(lèi)樣本準(zhǔn)確率 9 8 . 9 % (圖5c)。測(cè)試集中選取的60個(gè)分類(lèi)樣本第一分類(lèi)準(zhǔn)確率為 8 2 . 8 % ,第二分類(lèi)樣本準(zhǔn)確率為 8 3 . 9 % (圖5d)。模型 為0.63,MAE為 0 . 1 6 。
圖4廣義加性模型中BS樣條函數(shù)(a)、PS樣條函數(shù)(b)中各入?yún)⒁蜃悠珰埐?/p>
圖5隨機(jī)森林模型擬合性能參數(shù)Fig.5Performance of random forest model
BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)結(jié)果如圖6所示,訓(xùn)練集準(zhǔn)確率為 78 . 3 3 % (圖6a),測(cè)試集準(zhǔn)確率為 7 5 . 0 0 % (圖6b),訓(xùn)練集混淆矩陣中選取的180個(gè)樣本第一分類(lèi)準(zhǔn)確率為 7 2 . 8 % ,第二分類(lèi)準(zhǔn)確率為 8 4 . 1 % ,訓(xùn)練集總體第一分類(lèi)樣本準(zhǔn)確率 8 2 . 7 % ,第二分類(lèi)樣本準(zhǔn)確率 7 4 . 7 % (圖6c)。測(cè)試集中選取的60個(gè)分類(lèi)樣本第一分類(lèi)準(zhǔn)確率為 5 5 . 6 % ,第二分類(lèi)樣本準(zhǔn)確率為 9 0 . 9 % (圖6d)。模型 為0.61,MAE為 0 . 5 1 。
支持向量機(jī)模型預(yù)測(cè)結(jié)果如圖7所示。訓(xùn)練集準(zhǔn)確率為 8 2 . 0 0 % (圖 7 a ),測(cè)試集準(zhǔn)確率為 8 1 . 6 6 % (圖7b),訓(xùn)練集混淆矩陣中選取的180個(gè)樣本第一分類(lèi)準(zhǔn)確率為 7 6 . 9 % ,第二分類(lèi)準(zhǔn)確率為 8 7 . 6 % 訓(xùn)練集總體第一分類(lèi)樣本準(zhǔn)確率 8 6 . 4 % ,第二分類(lèi)樣本準(zhǔn)確率 78 . 8 % (圖7c)。測(cè)試集中選取的60個(gè)分類(lèi)樣本第一分類(lèi)準(zhǔn)確率為 78 . 6 % ,第二分類(lèi)樣本準(zhǔn)確率為 8 4 . 4 % (圖7d)。模型 為0.63,MAE為 1 . 9 2 。
采用粒子群優(yōu)化隨機(jī)森林模型,預(yù)測(cè)結(jié)果如圖8所示。訓(xùn)練集準(zhǔn)確率為 9 6 . 6 7 % (圖8a),測(cè)試集準(zhǔn)確率為 8 8 . 0 0 % (圖8b),訓(xùn)練集混淆矩陣中選取的180個(gè)樣本第一分類(lèi)準(zhǔn)確率為 9 6 . 6 % ,第二分類(lèi)準(zhǔn)確率為 9 6 . 7 % ,訓(xùn)練集總體第一分類(lèi)樣本準(zhǔn)確率 9 6 . 6 % ,第二分類(lèi)樣本準(zhǔn)確率 9 6 . 7 % (圖8c)。測(cè)試集中選取的60個(gè)分類(lèi)樣本第一分類(lèi)準(zhǔn)確率為8 0 . 6 % ,第二分類(lèi)樣本準(zhǔn)確率為 9 6 . 6 % (圖8d)。模型 為0.69,MAE為 0 . 1 3 。
采用粒子群優(yōu)化BP神經(jīng)網(wǎng)絡(luò)模型,預(yù)測(cè)結(jié)果如圖9所示。訓(xùn)練集準(zhǔn)確率為 8 8 . 3 3 % (圖 9 a ),測(cè)試集準(zhǔn)確率為 8 5 . 0 0 % (圖9b),訓(xùn)練集混淆矩陣中選取的180個(gè)樣本第一分類(lèi)準(zhǔn)確率為 9 0 . 0 % ,第二分類(lèi)準(zhǔn)確率為 8 6 . 7 % ,訓(xùn)練集總體第一分類(lèi)樣本準(zhǔn)確率 8 7 . 1 % ,第二分類(lèi)樣本準(zhǔn)確率 8 9 . 7 % (圖9c)。測(cè)試集中選取的60個(gè)分類(lèi)樣本第一分類(lèi)準(zhǔn)確率為7 9 . 3 % ,第二分類(lèi)樣本準(zhǔn)確率為 9 0 . 3 % (圖9d)。模型 為0.55,MAE為 2 . 3 9 。
采用粒子群優(yōu)化支持向量機(jī)模型,預(yù)測(cè)結(jié)果如圖10所示。訓(xùn)練集準(zhǔn)確率為 9 1 . 6 7 % (圖10a),測(cè)試集準(zhǔn)確率為 8 3 . 0 0 % (圖10b),訓(xùn)練集混淆矩陣中選取的180個(gè)樣本第一分類(lèi)準(zhǔn)確率為 7 0 . 4 % ,第二分類(lèi)準(zhǔn)確率為 8 7 . 9 % ,訓(xùn)練集總體第一分類(lèi)樣本準(zhǔn)確率 8 2 . 6 % ,第二分類(lèi)樣本準(zhǔn)確率 7 8 . 4 % (圖10c)。測(cè)試集中選取的60個(gè)分類(lèi)樣本第一分類(lèi)準(zhǔn)確率為91 . 3 % ,第二分類(lèi)樣本準(zhǔn)確率為 9 2 . 0 % (圖10d)。模型 為0.58,MAE為 1 . 2 6
2.3煙苗整齊度圖像識(shí)別模型訓(xùn)練結(jié)果
3種模型訓(xùn)練精度隨迭代次數(shù)的變化情況如圖11所示。Adam優(yōu)化器訓(xùn)練模型訓(xùn)練集損失率隨著迭代次數(shù)逐漸降低,在第10次后逐漸趨于穩(wěn)定,ResNet-101模型損失率整體低于AlexNet模型(圖11a)。測(cè)試集損失函數(shù)相較于訓(xùn)練集波動(dòng)較大,但模型整體損失率隨著迭代次數(shù)也呈現(xiàn)逐漸降低的態(tài)勢(shì)(圖11b)。訓(xùn)練集準(zhǔn)確率在5次迭代之后趨于穩(wěn)定,AlexNet模型準(zhǔn)確率在0.8附近波動(dòng),ResNet-101模型準(zhǔn)確率在0.85附近波動(dòng)。迭代5次后ResNet-101模型準(zhǔn)確率整體高于AlexNet模型(圖11c)。測(cè)試集準(zhǔn)確率相較于訓(xùn)練集波動(dòng)較大,AlexNet模型與ResNet-101準(zhǔn)確率范圍出現(xiàn)多次交叉,但模型整體準(zhǔn)確率隨著迭代次數(shù)呈現(xiàn)逐漸升高的態(tài)勢(shì)。其中AlexNet模型多次準(zhǔn)確率低至0.5附近,具有較大波動(dòng)性(圖11d)。而GoogleNet模型訓(xùn)練集及測(cè)試集的損失值和準(zhǔn)確率均優(yōu)于AlexNet模型和ResNet-101模型(表2),并且模型曲線更加穩(wěn)定。Adam比Nadam優(yōu)化器模型(圖12)訓(xùn)練集和測(cè)試集準(zhǔn)確率波動(dòng)更小,模型輸出更穩(wěn)定。Adam優(yōu)化器訓(xùn)練的GoogleNet模型測(cè)試集損失值最低(0.1688),準(zhǔn)確率最高(0.9389),Adam-GoogleNet模型訓(xùn)練集和測(cè)試集的損失值比Nadam-
GoogleNet模型分別降低0.0866和0.6224,訓(xùn)練集和測(cè)試集準(zhǔn)確率分別提升0.0188和0.2333。
3討論
整齊度可評(píng)判作物排列和生長(zhǎng)的一致性,通常與作物的種植方式、生長(zhǎng)條件和管理措施有關(guān)。整齊度好的作物,作物的產(chǎn)量和品質(zhì)通常更高,同時(shí)也便于農(nóng)業(yè)機(jī)械化作業(yè),降低勞動(dòng)強(qiáng)度。影響煙苗整齊度的因素眾多,其關(guān)系尚未明確為線性或非線性。廣義加性模型(GAM結(jié)合了廣義線性模型(GeneralizedLinearModel,GLM)和加性模型(AdditiveModel)的優(yōu)點(diǎn),無(wú)需預(yù)先設(shè)定函數(shù)形式,適用于本研究中對(duì)煙苗整齊度多因素的判別。煙苗整齊度問(wèn)題本質(zhì)是一種二分類(lèi)情況,符合隨機(jī)森林分類(lèi)樹(shù)判別和粒子群搜索特點(diǎn)[17],因此研究結(jié)果也表明粒子群優(yōu)化隨機(jī)森林具有更好的預(yù)測(cè)效果。
圖113種模型使用Adam優(yōu)化器損失值與識(shí)別精度隨選代次數(shù)的變化
圖123種模型使用Nadam優(yōu)化器損失值與識(shí)別精度隨迭代次數(shù)的變化 Fig.12Variation oflossvalue andrecognition accuracy with number ofepochs for3 models using Nadamoptimizer
本研究從實(shí)用性角度出發(fā),選擇煙苗生產(chǎn)中較易獲取的表型因素株高、莖圍、有效葉數(shù)和干質(zhì)量作為模型入?yún)⒁蛩?。采用粒子群?yōu)化隨機(jī)森林算法模型預(yù)測(cè),測(cè)試集準(zhǔn)確率在 8 8 . 0 0 % ,可在較大程度上評(píng)估煙苗整齊度。因作物生長(zhǎng)中的生物因素如品種、化學(xué)成分與酶活性等較難在大規(guī)模農(nóng)業(yè)生產(chǎn)中直接獲取,因此本研究未對(duì)其進(jìn)行進(jìn)一步分析,可能對(duì)模型精準(zhǔn)性有一定影響[18-19]。未來(lái)快速檢測(cè)普及后可對(duì)該部分與煙苗整齊度關(guān)系進(jìn)行進(jìn)一步探索。
由于各種模型都有其優(yōu)勢(shì)和局限性,在建立煙苗整齊度圖像識(shí)別模型時(shí)采用3種模型及2種優(yōu)化器同時(shí)對(duì)煙草整齊度進(jìn)行圖像識(shí)別訓(xùn)練,篩選出最適模型。本研究從圖像中心裁剪出一個(gè) 2 2 4 × 2 2 4 像素的區(qū)域以減少背景干擾,使模型可以更專(zhuān)注于學(xué)習(xí)圖像的核心特征。同時(shí)采用數(shù)據(jù)增強(qiáng)生成多樣化的訓(xùn)練樣本,幫助模型學(xué)習(xí)到更多樣化的特征,減少對(duì)訓(xùn)練數(shù)據(jù)的過(guò)擬合。遷移學(xué)習(xí)中的域適應(yīng)方法可以有效解決訓(xùn)練樣本和測(cè)試樣本概率分布不一致的學(xué)習(xí)問(wèn)題[20],在本研究中加入遷移學(xué)習(xí)模塊用作特征提取器,將預(yù)訓(xùn)練模型的輸出用作新任務(wù)的輸人特征,提高模型泛化能力。結(jié)果表明Adam-GoogleNet模型對(duì)煙苗整齊度的識(shí)別效果更佳,在測(cè)試集上具有最低的損失值0.1688,和最高的準(zhǔn)確率0.9389。Adam優(yōu)化器性能高于Nadam,這與Fatima[21]對(duì)不同優(yōu)化器性能的研究結(jié)果一致。
4結(jié)論
本研究表明,煙苗株高、莖圍、有效葉數(shù)對(duì)煙苗整齊度具有顯著影響;粒子群優(yōu)化隨機(jī)森林模型對(duì)煙苗整齊度具有更高的預(yù)測(cè)準(zhǔn)確率( 8 8 . 0 0 % ,優(yōu)于BP神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)。在經(jīng)兩種優(yōu)化器(Adam、Nadam)優(yōu)化的3種煙苗整齊度圖像識(shí)別模型(AlexNet、ResNet-101、GoogleNet)中,Adam-GoogleNet擁有最高的識(shí)別準(zhǔn)確率( 9 3 . 8 9 % )和最低的模型損失值(0.1688)。本研究可為煙草苗床整齊度評(píng)價(jià)和整齊度圖像識(shí)別提供依據(jù)。
參考文獻(xiàn)
[1] YANG YD,LI Q,MU Y,et al.UAV-assisted dynamic monitoring of wheat uniformity toward yield and biomass estimation[J].Plant Phenomics,2024, 6:191.
[2] LIU T,LIR,JIN X L,et al.Evaluation of seed emergence uniformty ofmechanically sownwheatwithUAVRGB imagery[J].Remote Sensing,2017, 9(12):1241.
[3] ZHOU C Q,YANG G J, LIANG D, et al.An integrated skeleton extraction and pruning method for spatial recognition of maize seedlingsinMGV and UAV remoteimages[J].IEEE Transactions on Geoscience and Remote Sensing,2018, 56(8): 4618-4632.
[4] BECK M W, de VALPINE P, MURPHY R, et al. Multi-scale trend analysis of water quality using error propagation of generalized additive models[J].Science of the Total Environment,2022,802: 149927.
[5] LIULL, DONG Y C, KONG M, et al. Towards the comprehensive water quality control in Lake Taihu:Correlating chlorphyll a and water quality parameters with generalized additive model[J]. Science of the Total Environment,2020,705:135993.
[6] 張書(shū)偉,過(guò)偉民,陳祥,等.烤煙柔韌性與內(nèi)在品質(zhì)的相關(guān)分析 [J].中國(guó)煙草科學(xué),2022,43(1):82-88,95. ZHANG SW,GUOWM,CHENX,et al.The correlation analysisof flue-cured tobacco toughness and main quality indexes[J].Chinese Tobacco Science,2022,43(1):82-88,95.
[7] SPEISER JL,MILLER ME, TOOZE J, et al.A comparison of random forest variable selection methods for classification prediction modeling[J].Expert Systems with Applications,2019,134:93-101.
[8] YURY,ANXM,JINB,etal.Particleclassification optimizationbasedBP network for telecommunication customerchurn prediction[J]. Neural Computing and Applications, 2018, 29(3): 707- 720.
[9] CHAUHANVK,DAHIYAK,SHARMAA.Problem formulations and solvers in linear SVM: A review[J]. Artificial Intelligence Review,2019,52(2): 803-855.
[10]王大彬,孟貴星,王雪松,等.不同成熟度茄衣煙葉高光譜特征 分析及分類(lèi)模型構(gòu)建[J].中國(guó)煙草科學(xué),2023,44(3):85-91. WANGDB,MENGGX,WANG XS,et al.Analysisof hyperspectral characteristics of coat-oriented cigar tobacco with different maturity and construction of a classification model[J]. Chinese Tobacco Science,2023,44(3):85-91.
[11]JAIN M, SAIHJPAL V, SINGH N, et al. An overview of variants and advancements of PSO algorithm[J]. Applied Sciences,2022,12(17): 8392.
[12] SHI YL, CHEN W S. Sea surface target detection using global 1 alarm controllable adaptive boosting based on correlation features[J]. IEEE Transactions on Geoscience and Remote Sensing,2023,61: 5103014.
[13]LINK S, ZHAO YC,GAO XF, et al.Applying a deep residual network coupling with transfer learning for recyclablewaste sorting[J].EnvironmentalScienceand PolutionResearch International, 2022,29(60): 91081-91095.
[14]ZHANGXH,QIAO Y,MENGFF,et al.Identification of maize leaf diseases using improved deep convolutional neural networks[J]. IEEE Access,2018,6: 30370-30377.
[15]黃本榮,范兆烽,王飛,等.基于VGG16-DenseNet集成模型的 烤煙智能分級(jí)[J].中國(guó)煙草科學(xué),2024,45(3):102-112. HUANGBR,F(xiàn)ANZF,WANGF,etal.Intelligentgradingoffluecured tobacco based on VGGl6-DenseNet integrated model[J]. Chinese Tobacco Science,2024,45(3):102-112.
[16]LUSY,LUZH,ZHANGYD.Pathological braindetectionbased on AlexNet and transfer learning[J]. Journal of Computational Science,2019,30:41-47.
[17] BEDOLLA-IBARRAMG, delCARMENCABRERAHERNANDEZ M, ACEVES-FERNANDEZ M A, etal. Classification of attention levels usinga Random Forest algorithm optimized with Particle Swarm Optimization[J].Evolving Systems, 2022,13(5): 687-702.
[18] 解黎明,姜仲禹,柳洪鵑,等.甘薯發(fā)根分枝期適宜土壤水分促 進(jìn)塊根糖供應(yīng)和塊根形成的研究[J].作物學(xué)報(bào),2022,48(8): 2080-2087. XIELM, JIANG ZY,LIUHJ, et al. Suitable soil moisture promotes sugar supply and tuberization insweet potato at root branching stage[J].ActaAgronomica Sinica,2022,48(8):2080-2087.
[19]李娟,周小鳳,劉文豪,等.42個(gè)早熟陸地棉產(chǎn)量與品質(zhì)性狀的 多樣性分析[J].江蘇農(nóng)業(yè)科學(xué),2022,50(2):73-78. LIJ,ZHOUXF,LIUWH,etal.Diversityanalysisofyieldand qualitytraitsof42 early-maturinguplandcottoncultivars[J]. Jiangsu Agricultural Sciences,2022,50(2):73-78.
[20]王佳昊,付一夫,馮海男,等.基于遷移學(xué)習(xí)的動(dòng)態(tài)環(huán)境室內(nèi)定 位方法研究[J].計(jì)算機(jī)科學(xué),2024,51(5):277-283. WANGJH,F(xiàn)UYF,F(xiàn)ENGHN,etal.Indoorlocationalgorithmin dynamic environment based on transfer learning[J].Computer Science,2024,51(5):277-283.
[21]FATIMA N.Enhancing performance of a deep neural network:A comparative analysis of optimization algorithms[J]. Advancesin Distributed Computing and Artificial Intelligence Journal, 2020, 9(2): 79-90.
(上接第92頁(yè))
[13]FINNRD,CLEMENTSJ,EDDYSR.HMMER web server: interactive sequence similarity searching[J].Nucleic AcidsResearch, 2011,39(Web Server issue):W29-W37.
[14] EDWARDSKD,BOMBARELYA,STORYGW,etal.TobEA:An atlasof tobacco gene expression from seed to senescence[J].BMC Genomics,2010,11:142.
[15] 薛瑾,吳健,盧秀香,等.煙草磺肽素(PSK)基因家族鑒定及抗 旱功能分析[J].中國(guó)煙草科學(xué),2024,45(3):77-85. XUEJ,WUJ,LUXX,etal.Analysis of sulfopeptin(PSK)gene familyand drought resistance in tobacco[J].Chinese Tobacco Science,2024,45(3):77-85.
[16] 劉濤,郭存,鄒宗慶,等.煙草TPP基因家族鑒定及表達(dá)模式分 析[J].中國(guó)煙草科學(xué),2022,43(6):1-8,16. LIUT,GUO C, ZOU Z Q, et al.Identificationand expression pattern analysisofthe TPPgenefamilyin tobacco[J].Chinese Tobacco Science,2022,43(6):1-8,16.
[17] 李琦瑤,王樹(shù)聲,周培祿,等.低溫脅迫對(duì)煙苗葉形及生理特性 的影響[J].中國(guó)煙草科學(xué),2018,39(1):17-23. LIQY,WANGSS,ZHOUPL,etal.Effectsof low temperature stresson leaf shape and physiological characteristics of tobacco seedlings[J].Chinese Tobacco Science,2018,39(1):17-23.
[18] 鄧智超,田冬冬,宋青松,等.煙草OSCA基因家族鑒定及非生 物脅迫誘導(dǎo)表達(dá)模式分析[J].中國(guó)煙草科學(xué),2022,43(1):14-21. DENG ZC,TIAN D D,SONGQ S,et al.Genome wide identification and expressionanalysis of the OSCA gene familyin response to abiotic stressesin tobacco[J].Chinese Tobacco Science, 2022,43(1): 14-21.
[19] SMITH DL,F(xiàn)EDOROFFN V.LRP1,a gene expressed in lateral and adventitiousrootprimordiaofArabidopsis[J].ThePlant Cell,1995, 7(6): 735-745.
[20]BAYLIS T,CIERLIK I,SUNDBERG E,et al.SHORT INTERNODES/STYLISHgenes,regulatorsofauxin biosynthesis,are involved inleafveindevelopmentinArabidopsisthaliana[J].New Phytologist,2013,197(3):737-750.
[21] ZHU X L,WANG B Q,WANG X,et al.Genome-wide identification,structural analysis and expression profiles of short internodesrelated sequence gene familyinquinoa[J].Frontiersin Genetics,2022,13:961925.
[22] HEB,SHI PB,LVYD, et al.Gene coexpression network analysis reveals the role of SRS genes in senescence leaf of maize(Zea mays L.)[J].Journal ofGenetics,2020,99:3.
[23] GOMARIZ-FERNANDEZA,SANCHEZ-GERSCHON V, FOURQUINC,etal.The roleof SHI/STY/SRS genes inorgan growth andcarpel developmentis conserved in the distant eudicot species ArabidopsisthalianaandNicotianabenthamiana[J].Frontiersin PlantScience,2017,8:814.
[24]KIMSG,LEESM,KIMYS,etal.Activation taggingofan ArabidopsisSHI-RELATEDSEQUENCEgene producesabnormal anther dehiscence and floral development[J].Plant Molecular Biology,2010,74(4-5):337-351.
[25] 王龍,張永順,王紅艷,等.甘藍(lán)型油菜轉(zhuǎn)錄因子SRS基因家族 的全基因組鑒定及表達(dá)分析[J].中國(guó)油料作物學(xué)報(bào),2024,46(4): 795-807. WANG L,ZHANG Y S,WANG HY,et al.Genome-wide identification and expression analysis of the SRS gene familyin Brassica napus[J]. Chinese Journal of Oil Crop Sciences,2024, 46(4): 795-807.