摘要:探究手持式近紅外光譜與初烤煙葉煙堿值之間的關(guān)系,為煙葉在烘烤過(guò)程中不同階段煙堿值的快速測(cè)定提供參考。本研究以初烤煙葉煙堿值預(yù)測(cè)模型為研究對(duì)象,選取542個(gè)煙葉樣本數(shù)據(jù)作為訓(xùn)練集,構(gòu)建了包括主成分回歸、偏最小二乘法和Lasso回歸等機(jī)器學(xué)習(xí)回歸模型,并基于Stacking方法融合為單個(gè)預(yù)測(cè)模型,以136個(gè)煙葉樣本數(shù)據(jù)作為測(cè)試集評(píng)估融合模型的預(yù)測(cè)效果。融合模型在測(cè)試集上的平均絕對(duì)誤差和決定系數(shù)分別為0218和0758,且對(duì)于煙葉在烘烤過(guò)程中不同階段的煙堿值預(yù)測(cè)均有效。其中,融合模型對(duì)于煙葉類別為“42 ℃”的煙堿值預(yù)測(cè)效果最佳,而對(duì)于煙葉類別為“鮮煙葉”“38 ℃”和“46 ℃”的煙堿值預(yù)測(cè)效果要優(yōu)于煙葉類別為“48 ℃”的煙堿值預(yù)測(cè)效果。以此方法構(gòu)建的初烤煙葉煙堿值預(yù)測(cè)模型在基于手持近紅外光譜對(duì)煙葉烘烤過(guò)程中不同階段的煙堿值預(yù)測(cè)方面有著較好的效果。
關(guān)鍵詞:手持近紅外光譜;初烤煙葉;煙堿值;模型;機(jī)器學(xué)習(xí)
中圖分類號(hào):TP391.4文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1008-0457(2025)02-0056-07國(guó)際DOI編碼:10.15958/j.cnki.sdnyswxb.2025.02.008
近紅外光譜分析技術(shù)(NIR)是一種近年來(lái)迅速發(fā)展的綠色分析技術(shù)[1],因其簡(jiǎn)單、高效和快速等優(yōu)點(diǎn)在行業(yè)內(nèi)受到廣泛關(guān)注。該技術(shù)結(jié)合了光譜技術(shù)、信息學(xué)、化學(xué)計(jì)量學(xué)和計(jì)算機(jī)技術(shù),主要通過(guò)測(cè)量樣品在近紅外波段的吸收或反射光譜信息,結(jié)合化學(xué)計(jì)量學(xué)算法對(duì)光譜信息進(jìn)行處理和分析,以實(shí)現(xiàn)對(duì)樣品成分的定量或定性分析。相比傳統(tǒng)分析方法,NIR技術(shù)具有更高的分析速度和更低的樣品消耗量,同時(shí)對(duì)環(huán)境影響較小。煙草行業(yè)廣泛運(yùn)用近紅外光譜檢測(cè)技術(shù),但使用的儀器主要是傅里葉變換近紅外光譜儀。該儀器雖然檢測(cè)精度較高,但由于體積大、內(nèi)部存在移動(dòng)部件,無(wú)法隨意移動(dòng),因此其應(yīng)用主要局限在實(shí)驗(yàn)室環(huán)境中,無(wú)法應(yīng)用到煙草種植、采烤、收購(gòu)和醇化等一線場(chǎng)地[2]。近紅外光譜分析技術(shù)的進(jìn)步與近紅外光譜儀的研究密不可分,隨著技術(shù)的不斷發(fā)展,近紅外光譜儀也在不斷改進(jìn)和優(yōu)化,從而促進(jìn)了近紅外光譜分析技術(shù)的進(jìn)步。尤其是在多場(chǎng)景應(yīng)用需求的前提下,近紅外光譜儀逐步地向著小型化、固態(tài)化、模塊化和快速實(shí)時(shí)等方向發(fā)展[38]。目前,針對(duì)多場(chǎng)景應(yīng)用的需求,近紅外光譜儀開始由實(shí)驗(yàn)室靜態(tài)檢測(cè)應(yīng)用逐漸向可移動(dòng)式的手持式近紅外光譜儀方向發(fā)展。同時(shí),由于手持式近紅外光譜儀具有價(jià)格適中、輕便易攜、適用于野外工作和現(xiàn)場(chǎng)分析等優(yōu)點(diǎn),因此在煙草、食品、農(nóng)產(chǎn)品等行業(yè)的現(xiàn)場(chǎng)檢測(cè)應(yīng)用中發(fā)揮了越來(lái)越重要的作用。近紅外光譜分析技術(shù)能夠檢測(cè)有機(jī)物中含有的CH、NH、OH、CC等化學(xué)鍵的振動(dòng),而煙葉中含有的總糖、總氮、還原糖、煙堿、葉綠素等化學(xué)成分均具有豐富的含氫基團(tuán)。通過(guò)現(xiàn)代化學(xué)計(jì)量學(xué)的手段,可以挖掘煙葉光譜中蘊(yùn)含的關(guān)鍵特征,為近紅外定性、定量分析提供可能[9]。該方法解決了傳統(tǒng)化學(xué)方法難以快速完成的問(wèn)題,為煙草行業(yè)的質(zhì)量檢測(cè)等應(yīng)用場(chǎng)景提供了新的解決方案。初烤煙葉中煙堿值含量受多方因素影響,卻是評(píng)估煙葉品質(zhì)的重要指標(biāo),因此快速檢測(cè)初烤煙葉煙堿值較為困難卻又具有重要意義。機(jī)器學(xué)習(xí)是一種人工智能的分支領(lǐng)域,其專注于讓計(jì)算機(jī)系統(tǒng)能夠通過(guò)數(shù)據(jù)學(xué)習(xí)和改進(jìn),使計(jì)算機(jī)能利用數(shù)據(jù)來(lái)提升執(zhí)行特定任務(wù)的能力。機(jī)器學(xué)習(xí)結(jié)合近紅外光譜技術(shù)在煙葉化學(xué)成分預(yù)測(cè)方面的應(yīng)用,是當(dāng)前煙草行業(yè)中一項(xiàng)重要的技術(shù)發(fā)展,近紅外光譜技術(shù)能夠快速、非破壞地獲取煙葉化學(xué)成分的特征數(shù)據(jù),使用上述數(shù)據(jù)訓(xùn)練機(jī)器學(xué)習(xí)算法模型,即可實(shí)現(xiàn)對(duì)煙葉化學(xué)成分的快速預(yù)測(cè)。國(guó)內(nèi)已有煙草研究人員使用PLS模型結(jié)合光譜預(yù)處理技術(shù)構(gòu)建了初烤煙葉的新植二烯預(yù)測(cè)模型并取得了不錯(cuò)的結(jié)果[10]。劉俊等[11]采用了微機(jī)電手持近紅外光譜技術(shù),對(duì)398個(gè)初烤煙葉樣品進(jìn)行光譜建模,使用偏最小二乘法(Partial LeastSquare Method,PLS)建立了尼古丁預(yù)測(cè)模型,其結(jié)果顯示模型線性良好,預(yù)測(cè)精度高,能夠滿足現(xiàn)場(chǎng)無(wú)處理快速檢測(cè)煙片的要求。與劉俊等[11]的研究相比,本研究的不同之處和新穎性在于:現(xiàn)有文獻(xiàn)主要集中于手持近紅外檢測(cè)烤后煙葉的化學(xué)值,而本研究則以烘烤過(guò)程中不同階段的煙葉為對(duì)象,且在光譜數(shù)據(jù)處理和模型優(yōu)化方面引入了機(jī)器學(xué)習(xí)模型,以建立適用于不同階段煙葉的煙堿值預(yù)測(cè)模型,并進(jìn)一步擴(kuò)展了手持近紅外光譜法在實(shí)際田間和生產(chǎn)環(huán)境中的應(yīng)用,驗(yàn)證了其在復(fù)雜環(huán)境中的可行性和有效性。現(xiàn)有文獻(xiàn)在手持式近紅外檢測(cè)初烤煙葉化學(xué)值的應(yīng)用主要集中于對(duì)烤后煙葉的研究,本研究的主要研究對(duì)象為烘烤過(guò)程中不同階段的煙葉,并基于機(jī)器學(xué)習(xí)模型建立適用于烘烤過(guò)程中不同階段煙葉的煙堿值預(yù)測(cè)模型。本研究通過(guò)獲取烘烤過(guò)程中不同階段煙葉的手持式近紅外光譜,并使用傳統(tǒng)方法測(cè)定烘烤過(guò)程中不同階段煙葉的煙堿值數(shù)據(jù),從而建立烘烤過(guò)程中不同階段煙葉的煙堿值預(yù)測(cè)模型,旨在探討使用機(jī)器學(xué)習(xí)模型實(shí)現(xiàn)預(yù)測(cè)烘烤過(guò)程中不同階段煙葉煙堿值的可行性。
1材料與方法
11試驗(yàn)材料
煙葉樣品為2023年所采集的云南楚雄的煙葉,品種為‘K326’。研究中使用的近紅外光譜儀設(shè)備為AURA手持式近紅外光譜儀(德國(guó)Carl Zeiss公司),波長(zhǎng)點(diǎn)數(shù)為701個(gè),波長(zhǎng)范圍為950~1650 nm,為光柵陣列檢測(cè)器。
12測(cè)定方法
121取樣規(guī)格
為研究煙葉在烘烤過(guò)程中不同階段煙堿值快速檢測(cè)模型的可行性,根據(jù)實(shí)際情況,分別對(duì)上部和中部的煙葉進(jìn)行取樣。其中,煙葉產(chǎn)地為云南楚雄,品種均為‘K326’,烘烤過(guò)程中不同階段包括鮮煙葉、烘烤過(guò)程中的38、42、46及48 ℃共5個(gè)階段。
122數(shù)據(jù)采集
每個(gè)樣本取6片完整煙葉(如圖1所示),將煙葉扎在一起放進(jìn)袋子,減少煙葉造碎,并做好樣品標(biāo)簽記錄(產(chǎn)地、品種、煙葉類別),便于后期手持式近紅外光譜儀的掃描。
123光譜測(cè)定
合理的近紅外光譜樣本采集方法是近紅外光譜分析技術(shù)的關(guān)鍵,手持式近紅外光譜儀最常見(jiàn)的樣本光譜采集方式是將樣本磨碎,然后采集粉末狀樣本光譜,這種方式得到的光譜雖然具有代表性,但需要破壞樣本,且檢測(cè)效率不高,不能發(fā)揮近紅外光譜無(wú)損、快速的技術(shù)特點(diǎn)。另一種手持式近紅外光譜儀采集樣本的方法是掃描樣本一個(gè)點(diǎn)位的光譜,該方法雖然可以大大提高工作效率,但是掃描該點(diǎn)的光譜不能很好的反映該樣本的整體信息。此外,由于近紅外具有一定的穿透能力,單片煙葉采集的光譜中可能會(huì)含有其他非煙葉的信息(如實(shí)驗(yàn)臺(tái)信息等)。為減少上述問(wèn)題對(duì)光譜測(cè)定的影響,本研究采取下述檢測(cè)方式進(jìn)行光譜測(cè)定:
如圖2所示,將6片煙葉疊放在一起,用手持式近紅外光譜儀進(jìn)行9點(diǎn)掃描。首先進(jìn)行固定點(diǎn)掃描,掃描3次,分別是葉尖、葉腰、葉基(對(duì)應(yīng)圖2的點(diǎn)1、點(diǎn)2、點(diǎn)3)各掃描1次;然后將最下面的3片煙葉抽出放置最上面,再次進(jìn)行葉尖、葉腰、葉基3次掃描(對(duì)應(yīng)圖2的點(diǎn)4、點(diǎn)5、點(diǎn)6)。接著進(jìn)行滑動(dòng)式掃描,將手持式近紅外光譜儀放置于第一片煙葉表面,從葉尖滑動(dòng)至葉基進(jìn)行滑動(dòng)式掃描;再將最下面的4片煙葉抽出放置于最上面,從葉尖滑動(dòng)至葉基進(jìn)行滑動(dòng)式掃描;最后,再次將最下面的4片煙葉抽出放置最上面,從葉尖滑動(dòng)至葉基進(jìn)行滑動(dòng)式掃描。掃描完畢后,每個(gè)煙葉樣本對(duì)應(yīng)9條光譜,且9次掃描的外界環(huán)境保持相對(duì)穩(wěn)定,將得到的9條光譜計(jì)算平均值,該平均光譜即可作為該樣本的光譜信息[12]。
為了消除由外界環(huán)境變化而引起的光譜的影響,在每次測(cè)定前,需要對(duì)儀器進(jìn)行背景校正,以防光譜發(fā)生偏移;另外,當(dāng)外部環(huán)境溫度變化超過(guò)2 ℃時(shí),儀器也會(huì)自動(dòng)進(jìn)行背景校正。本研究中光譜測(cè)定方式采用多片、9點(diǎn)掃描的方法,以確保光譜數(shù)據(jù)的代表性和準(zhǔn)確性,避免了單點(diǎn)掃描可能帶來(lái)的誤差,提高了光譜數(shù)據(jù)的整體質(zhì)量。
124煙堿值測(cè)定
樣本的煙堿值測(cè)定均按YC/T 160—2002標(biāo)準(zhǔn)[13]執(zhí)行。
125樣本劃分方法
為了確保模型訓(xùn)練和測(cè)試的代表性和均衡性,本研究采用分層抽樣的方式對(duì)煙葉的近紅外光譜樣本和化學(xué)值數(shù)據(jù)進(jìn)行劃分。具體來(lái)說(shuō),我們首先將總體數(shù)據(jù)按煙葉類別分成5類,分別對(duì)應(yīng)不同烘烤階段的煙葉(鮮煙葉、38、42、46及48 ℃)。在每一類別中,我們按照特定比例隨機(jī)劃分?jǐn)?shù)據(jù),將80%的數(shù)據(jù)用于訓(xùn)練集,20%的數(shù)據(jù)用于測(cè)試集。
分層抽樣的主要依據(jù)是確保每個(gè)類別的煙葉樣本在訓(xùn)練集和測(cè)試集中都有合理的代表性和分布,這樣可以使模型在訓(xùn)練過(guò)程中充分學(xué)習(xí)每個(gè)類別的特征,并在測(cè)試過(guò)程中驗(yàn)證模型的泛化能力。通過(guò)這種方式劃分?jǐn)?shù)據(jù),可以避免因類別不平衡導(dǎo)致的模型偏差,提高模型在實(shí)際應(yīng)用中的可靠性和穩(wěn)定性。
2結(jié)果與分析
21樣本信息
共取煙葉樣本678個(gè),其中542個(gè)樣本用于構(gòu)建初烤煙葉煙堿值預(yù)測(cè)模型,136個(gè)樣本用于測(cè)試初烤煙葉煙堿值預(yù)測(cè)模型的預(yù)測(cè)效果。其中,用于模型構(gòu)建的訓(xùn)練集樣本和用于模型評(píng)估的測(cè)試集樣本為不同煙葉類別的訓(xùn)練集樣本和測(cè)試集樣本分別合并而來(lái),即訓(xùn)練集和測(cè)試集均包含不同烘烤階段的煙葉光譜數(shù)據(jù),具體信息見(jiàn)表1。
22初烤煙葉煙堿值預(yù)測(cè)模型的構(gòu)建
221訓(xùn)練集與測(cè)試集投影
基于PCA降維方法將訓(xùn)練集與測(cè)試集數(shù)據(jù)投影至二維平面,其分布如圖3所示。由圖3可知,經(jīng)降維后訓(xùn)練集和測(cè)試集的分布基本一致,這表明測(cè)試集的選取能夠代表完整數(shù)據(jù)集。
222預(yù)處理方法
對(duì)近紅外光譜的預(yù)處理方法[1416]通常有如下幾種:一階導(dǎo)數(shù)、二階導(dǎo)數(shù)、標(biāo)準(zhǔn)正態(tài)變量變換(Standard Normal Variate Transformation,SNV)、多元散射校正(Multiplicative Scatter Correction,MSC)、矢量歸一化(Normalization)等,另外還可以將不同預(yù)處理方法結(jié)合在一起形成更復(fù)雜的預(yù)處理方法[17]。對(duì)當(dāng)前的近紅外光譜數(shù)據(jù),采用了一階導(dǎo)數(shù)的預(yù)處理方法,原始光譜和預(yù)處理后光譜的對(duì)比如圖4所示。將相同煙葉類別對(duì)應(yīng)光譜數(shù)據(jù)的各波長(zhǎng)點(diǎn)位的吸光度取均值,從而繪制各類煙葉預(yù)處理前后對(duì)應(yīng)的平均光譜,如圖5所示。
223模型構(gòu)建
在訓(xùn)練集上,分別嘗試了3種基礎(chǔ)回歸模型,分別是主成分回歸(Principal Component Regression,PCR)、偏最小二乘法(Partial Least Squares,PLS)和Lasso(Least Absolute Shrinkage and Selection Operator)回歸。利用網(wǎng)格搜索的方法對(duì)上述3種基礎(chǔ)模型進(jìn)行超參數(shù)優(yōu)化。所謂超參數(shù),即機(jī)器學(xué)習(xí)模型中通常依靠人的經(jīng)驗(yàn)指定大小的參數(shù),而網(wǎng)格搜索本質(zhì)上是一種窮舉法,其通過(guò)遍歷傳入?yún)?shù)的所有排列組合,并使用交叉驗(yàn)證的方式,返回所有參數(shù)組合下的評(píng)價(jià)指標(biāo)得分,最后選擇評(píng)估指標(biāo)得分最優(yōu)的一組參數(shù)作為模型的訓(xùn)練參數(shù)。具體來(lái)說(shuō),利用網(wǎng)格搜索方法,我們首先定義每個(gè)超參數(shù)的取值范圍,然后通過(guò)交叉驗(yàn)證的方式評(píng)估每個(gè)參數(shù)組合的性能,最終選取最佳的參數(shù)組合用于模型訓(xùn)練。
基于網(wǎng)格搜索確定3種基礎(chǔ)模型的訓(xùn)練參數(shù),并利用Stacking方法將3種基礎(chǔ)模型進(jìn)行融合。Stacking方法的本質(zhì)是一種分層結(jié)構(gòu),其先從初始的訓(xùn)練集訓(xùn)練出若干模型,然后把各單模型的輸出結(jié)果作為樣本特征進(jìn)行整合,并把原始樣本標(biāo)記作為新數(shù)據(jù)樣本標(biāo)記,生成新的訓(xùn)練集。再根據(jù)新訓(xùn)練集訓(xùn)練一個(gè)新的模型,最后用新的模型對(duì)樣本進(jìn)行預(yù)測(cè)。具體步驟如下:首先,使用初烤煙葉數(shù)據(jù)分別訓(xùn)練3個(gè)基礎(chǔ)模型;其次,利用這3個(gè)基礎(chǔ)模型的預(yù)測(cè)結(jié)果作為輸入,訓(xùn)練一個(gè)新的元模型(如線性回歸、決策樹等);最后,將元模型的預(yù)測(cè)結(jié)果作為最終的融合模型輸出。
每種基礎(chǔ)模型和融合模型在測(cè)試集上的平均絕對(duì)誤差和決定系數(shù)如表2所示。由表2可知,3種基礎(chǔ)模型在測(cè)試集上的決定系數(shù)均大于07,其中主成分回歸模型在測(cè)試集上的決定系數(shù)最高,為0737;偏最小二乘法在測(cè)試集上的決定系數(shù)僅次于主成分回歸,為0735;Lasso回歸模型在測(cè)試集上的決定系數(shù)為0731。融合模型在測(cè)試集上的平均絕對(duì)誤差和決定系數(shù)分別為0218和0758,較其他3種基礎(chǔ)模型而言,融合模型在測(cè)試集上的平均絕對(duì)誤差更小,且決定系數(shù)更大,因此融合模型在測(cè)試及上的預(yù)測(cè)效果最優(yōu)。
3討論與結(jié)論
目前并未有涉及不同烘烤溫度下初烤煙葉化學(xué)值預(yù)測(cè)方面的研究,本研究對(duì)不同烘烤溫度下初烤煙葉進(jìn)行光譜測(cè)量,更能反映處于不同烘烤溫度下初烤煙葉的實(shí)際狀況。由于溫度對(duì)初烤煙葉的煙堿含量影響顯著,因此本研究對(duì)于煙堿含量的高光譜參數(shù)的預(yù)測(cè)有較好的適用范圍,具有一定的通用性。此外,本研究提出了一種適用于手持式近紅外光譜的九點(diǎn)掃描測(cè)定方法。這種方法不同于常見(jiàn)的單點(diǎn)掃描方法,九點(diǎn)掃描測(cè)定方法對(duì)煙葉的葉尖、葉腰和葉基均進(jìn)行了掃描,并將這些掃描信息進(jìn)行合并,從而更全面地反映了樣本的整體信息。這種方法提高了測(cè)量的代表性和準(zhǔn)確性,適用于現(xiàn)場(chǎng)快速檢測(cè)。
從統(tǒng)計(jì)角度來(lái)看,要建立一個(gè)可靠的定量分析模型,化學(xué)值數(shù)據(jù)的分布標(biāo)準(zhǔn)差必須遠(yuǎn)大于化學(xué)值的重復(fù)測(cè)量誤差。因此,為了確保本研究提出的定量分析模型在實(shí)際生產(chǎn)中能夠有效監(jiān)控樣品質(zhì)量,需要采取以下措施:首先,必須提高化學(xué)值測(cè)量的準(zhǔn)確度,這可以通過(guò)校準(zhǔn)儀器、優(yōu)化測(cè)量方法以及嚴(yán)格控制實(shí)驗(yàn)條件來(lái)實(shí)現(xiàn);其次,每年需要對(duì)已有模型進(jìn)行維護(hù)和優(yōu)化,具體包括引入新的代表性樣品以補(bǔ)充模型數(shù)據(jù)、更新模型參數(shù)以反映最新的數(shù)據(jù)趨勢(shì),以及篩選和剔除不適應(yīng)的信息以保持模型的準(zhǔn)確性和穩(wěn)定性。此外,定期重新預(yù)測(cè)和驗(yàn)證新年度的樣品數(shù)據(jù),通過(guò)幾年的持續(xù)優(yōu)化和篩選,可以顯著提高模型的適應(yīng)性和預(yù)測(cè)性能,確保模型在不同環(huán)境和條件下的穩(wěn)定性和可靠性。通過(guò)這些措施,可以在實(shí)際生產(chǎn)中更好地利用定量分析模型,實(shí)現(xiàn)對(duì)煙葉質(zhì)量的精準(zhǔn)監(jiān)控和預(yù)測(cè),提高生產(chǎn)效率和產(chǎn)品質(zhì)量[1820]。
由于Stacking方法通常訓(xùn)練多個(gè)元學(xué)習(xí)器且涉及多個(gè)模型選擇和超參數(shù)調(diào)優(yōu),這會(huì)增加整體模型的復(fù)雜度和計(jì)算成本,在大規(guī)模數(shù)據(jù)集應(yīng)用場(chǎng)景中可能會(huì)因?yàn)樾枰馁M(fèi)更多的計(jì)算資源和時(shí)間而導(dǎo)致模型表現(xiàn)不佳。針對(duì)上述問(wèn)題,可結(jié)合基于遺傳算法等實(shí)現(xiàn)的自動(dòng)化超參數(shù)調(diào)優(yōu)和分布式訓(xùn)練策略,從而加快超參數(shù)調(diào)優(yōu)和模型訓(xùn)練速度,達(dá)到在大規(guī)模數(shù)據(jù)集應(yīng)用場(chǎng)景中使用的目的[21]。
使用手持式近紅外光譜儀采集初烤煙葉的光譜信息能夠反映初烤煙葉的煙堿值信息,通過(guò)一階導(dǎo)數(shù)對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理,基于機(jī)器學(xué)習(xí)中的主成分回歸、偏最小二乘法和Lasso回歸等模型建立初烤煙葉煙堿值預(yù)測(cè)模型,并利用Stacking方法將上述模型進(jìn)行融合,得到的融合模型在測(cè)試集上的平均絕對(duì)誤差和決定系數(shù)分別為0218和0758,且融合的模型對(duì)于烘烤過(guò)程中不同階段的煙葉煙堿值的預(yù)測(cè)效果均較好。這說(shuō)明基于手持近紅外光譜數(shù)據(jù),利用Stacking方法將基礎(chǔ)機(jī)器學(xué)習(xí)模型進(jìn)行融合的方法,在預(yù)測(cè)煙葉在烘烤過(guò)程中不同階段的煙堿值具有可行性,本研究可為烘烤過(guò)程中不同階段煙葉煙堿值的快速測(cè)定提供參考。
(責(zé)任編輯:嚴(yán)秀芳)
參考文獻(xiàn):
[1]王文俊,沙云菲,汪陽(yáng)忠,等.近紅外和電子鼻數(shù)據(jù)融合識(shí)別不同香型風(fēng)格[J].光譜學(xué)與光譜分析,2023,43(1):133137.
[2]譚觀萍.不同形態(tài)煙葉煙堿及總糖的近紅外光譜模型轉(zhuǎn)移研究[D].長(zhǎng)沙:湖南農(nóng)業(yè)大學(xué),2017.
[3]沙云菲,趙亞萍,于潔,等.基于支持向量機(jī)的煙葉不同部位6種化學(xué)成分差異性分析[J].東華大學(xué)學(xué)報(bào)(自然科學(xué)版),2019,45(5):720723,734.
[4]褚小立.化學(xué)計(jì)量學(xué)方法與分子光譜分析技術(shù)[M].北京:化學(xué)工業(yè)出版社,2011.
[5]湯朝起,王平,竇玉青,等.河南烤煙主要化學(xué)成分與吸食品質(zhì)的關(guān)系[J].中國(guó)煙草科學(xué),2009,30(5):4145,49.
[6]劉華友,周順?lè)澹靷鞑?,?基于在線近紅外光譜分析的原煙精選均質(zhì)化調(diào)控方法[J].安徽農(nóng)業(yè)科學(xué),2021,49(3):193195.
[7]朱紅波.基于在線近紅外光譜分析技術(shù)對(duì)七種常規(guī)煙絲化學(xué)成分的實(shí)時(shí)檢測(cè)[D].貴陽(yáng):貴州大學(xué),2009.
[8]王玉真,邱昌桂,楊晶津,等.基于近紅外光譜分析技術(shù)評(píng)價(jià)打葉復(fù)烤片煙混合均勻性[J].安徽農(nóng)業(yè)科學(xué),2022,50(24):178180,194.
[9]耿瑩蕊,沈歡超,倪鴻飛,等.近紅外光譜結(jié)合無(wú)參數(shù)校正增強(qiáng)實(shí)現(xiàn)不同年份煙葉總糖含量模型更新[J].分析測(cè)試學(xué)報(bào),2022,41(7):10661071.
[10]楊盼盼,周文忠,李佛琳,等.近紅外快速測(cè)定初烤煙葉中的新植二烯[J].云南農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)),2019,34(6):994999.
[11]劉俊,姜林鈴,李晨曲,等.手持近紅外光譜法快速定量檢測(cè)初烤煙葉中的尼古丁含量[J].南方農(nóng)機(jī),2024,55(2):142144,153.
[12]邵晨陽(yáng),趙一墨,鹿莉莉,等.近紅外光譜快速分析技術(shù)的應(yīng)用研究進(jìn)展[J].化學(xué)通報(bào),2024,87(8):898912.
[13]國(guó)家煙草專賣局.煙草及煙草制品 總植物堿的測(cè)定 連續(xù)流動(dòng)法:YC/T 160—2002[S].北京:中國(guó)標(biāo)準(zhǔn)出版社,2002.
[14]褚小立,袁洪福,陸婉珍.近紅外分析中光譜預(yù)處理及波長(zhǎng)選擇方法進(jìn)展與應(yīng)用[J].化學(xué)進(jìn)展,2004(4):528542.
[15]王悅,劉正東,李文霞,等.在線近紅外光譜預(yù)處理對(duì)廢舊紡織品定性識(shí)別的影響[J].分析試驗(yàn)室,2023,42(11):14491454.
[16]田世杰.基于透射光譜的蘋果霉心病判別影響因素及其修正方法研究[D].西安:西北農(nóng)林科技大學(xué),2020.
[17]楊德建,趙遼英,郝賢偉,等.基于近紅外光譜和BYOL對(duì)比學(xué)習(xí)的煙葉部位識(shí)別方法[J].中國(guó)煙草學(xué)報(bào),2023,29(6):2330.
[18]賓俊,王志國(guó),杜文,等.基于近紅外光譜和深度模型轉(zhuǎn)移預(yù)測(cè)煙絲總糖含量[J].農(nóng)業(yè)與技術(shù),2022,42(22):1014.
[19]韋克蘇,涂永高,王豐,等.基于近紅外光譜的煙葉烘烤過(guò)程質(zhì)體色素實(shí)時(shí)監(jiān)測(cè)[J].江蘇農(nóng)業(yè)科學(xué),2021,49(16):184188.
[20]居雷,高揚(yáng),張?chǎng)?,?基于近紅外光譜維度轉(zhuǎn)換和卷積神經(jīng)網(wǎng)絡(luò)識(shí)別小產(chǎn)地?zé)熑~[J].煙草科技,2024,57(7):813.
[21]胡蕓,李博巖,龐紅蕊,等.基于近紅外光譜凈信號(hào)的煙葉加料均勻性監(jiān)測(cè)[J].煙草科技,2023,56(9):7883,90
Research on Prediction of Nicotine Content of Freshly Fluecured Tobacco Leaf Based on Handheld Nearinfrared Technology
Zhou Renhu1, Zhu Rong1, Xu Jie2, Ding Congkai1, Li Jianming1, Dong Shaokun1, Lou Yong1, Du Xiaojiao1, Chen Yi3*
(1.Chuxiong Company of Yunnan Provincial Tobacco Corporation, Chuxiong 675000,Yunan,China;2.Yunnan Mingfan Technology Company Limited, Kunming 650031,Yunan,China;3.Yunnan Academy of Tobacco Agricultural Sciences, Kunming 650031,Yunan, China)
Abstract:The relationship between handheld nearinfrared spectroscopy and the nicotine content of freshly fluecured tobacco leaves were explored to provide a reference for the rapid determination of nicotine content at different stages of the tobacco curing process. The prediction model of nicotine content of freshly cured tobacco leaves was used as the research object, and 542 tobacco leaf sample data were selected as the training set, and machine learning regression models including principal component regression, partial least squares regression, and Lasso regression were constructed. Then, based on the Stacking method, these models were integrated into a single prediction model. Finally, the prediction performance of the fusion model was evaluated using 136 tobacco leaf sample data as the test set. The results showed that the average absolute error and determination coefficient of the fusion model on the test set were 0218 and 0.758, respectively, and it was effective in predicting the nicotine content of tobacco leaves at different stages of the curing process. Among them, the fusion model had the best prediction effect on the nicotine content of tobacco leaves with a temperature of “42 ℃”, while the prediction effect for the nicotine content of tobacco leaves with categories of “fresh tobacco leaves”,“38 ℃” and “46 ℃” was better than that for the nicotine content of tobacco leaves with a category of “48 ℃”. The prediction model of nicotine content in freshly fluecured tobacco leaves by this method is effective in predicting the nicotine value of tobacco at different stages of the roasting process based on the handheld nearinfrared spectroscopy.
Keywords:handheld nearinfrared spectroscopy; freshly cured tobacco leaves; nicotine; model; machine learning