摘要 近紅外光譜分析技術因其可以快速準確地檢測煙草中化學成分含量而在煙草領域具有廣泛應用前景。概述了近紅外光譜分析技術基本原理,綜述了近紅外光譜分析技術在煙草領域的主要應用對象,探討了近紅外光譜分析技術針對煙草分析的主要建模方法,展望了近紅外光譜分析技術在煙草領域的未來發(fā)展方向。
關鍵詞 近紅外光譜;煙草;研究進展
中圖分類號S572文獻標識碼A文章編號0517-6611(2014)29-10318-04
作者簡介李豪豪(1987- ),男,河南洛陽人,碩士,從事煙草化學和工藝的研究。*通訊作者。
近紅外光(NIR)是介于可見光(VIS)和中紅外光(MIR)之間的電磁波,美國材料與試驗協(xié)會(ASTM)將波長范圍為780~2 526 nm(12 820~3 959 cm-1)的電磁波定義為近紅外光譜區(qū),通常又將NIR分為2個區(qū)域:780~1 100 nm波長范圍的近紅外短波和1 100~2 526 nm波長范圍的近紅外長波。近紅外區(qū)的光譜吸收帶是由有機物質(zhì)中能量較高的化學鍵(主要是C-H、O-H、N-H、S-H、C=O)在中紅外光譜區(qū)基頻吸收的倍頻、合頻和差頻吸收帶疊加而成。當物質(zhì)被近紅外光照射后,分子振動從基態(tài)向高能級躍遷,吸收能量使得光譜產(chǎn)生改變,進而得到物質(zhì)的官能團結構與數(shù)量信息,因此近紅外光譜非常適用于分析天然產(chǎn)物中與有機基團有直接或間接關系的成分[1]。
近紅外光譜分析技術(NIRS)是近紅外光譜儀、化學計量學軟件和應用模型3部分的有機結合體。它具有分析過程簡單、無需樣品前處理、無損檢測、測試過程無污染、多組分同時檢測、分析結果準確、投資低、操作簡便、專業(yè)要求低等諸多優(yōu)點,基于此,近紅外光譜分析技術作為近年來發(fā)展最快的光譜分析技術,廣泛應用于農(nóng)業(yè)、醫(yī)藥、石油、化工、煙草、食品、紡織等眾多領域[2-5]。
煙草作為復雜的天然植物,化學成分眾多,其常規(guī)化學成分總糖、還原糖、總氮、總植物堿、鉀、氯這6項指標是評價煙葉質(zhì)量的最基本化學成分指標,在卷煙制品的配方設計與質(zhì)量監(jiān)控方面起著非常重要的作用。這些含有大量C-H、O-H、N-H等基團的指標與近紅外光譜的吸收帶存在直接或間接的關系,適合采用近紅外分析技術進行檢測。研究人員在此方面進行了深入研究,已形成應用于實踐的定性或定量模型?;诮t外光譜分析技術的各種優(yōu)點,研究人員將其廣泛應用于煙草行業(yè)的眾多領域,取得了諸多研究成果,推動行業(yè)取得了更好的效益[6-7]。為進一步挖掘近紅外分析技術的潛力,開發(fā)新的檢測領域及指標,筆者綜述了近紅外光譜分析技術在煙草領域的應用檢測對象、主要建模方法方面的研究進展。
1 NIRS在煙草領域的應用檢測對象
近年來,利用NIRS對煙草進行檢測已逐步發(fā)展成為一門獨立的分析技術,其在煙草領域的應用對象也在不斷增加。早在1977年,McClure等就采用光譜二階導數(shù)回歸分析法建立了NIRS檢測煙葉中還原糖含量的模型,其模型相關系數(shù)為0.968,預測標準偏差為1.36[8]。Hanam等采用多種人工神經(jīng)網(wǎng)絡算法對煙葉中煙堿含量進行了預測[9],Hoyrm等的研究表明,即使低分辨率的近紅外儀也可較好地同時測量煙葉中多種化學成分[10]。國內(nèi)利用NIRS對煙葉質(zhì)量檢測也進行了大量研究。張建平等采用主成分回歸法及內(nèi)部交叉證實法建立并優(yōu)化了光譜與化學成分間的關系模型,測定了煙葉中煙堿、總糖、還原糖、總氮及氯的含量,結果表明煙堿和總糖的測定結果與流動注射分析儀的測試結果比較吻合,相對誤差在3.5%以內(nèi)[11];鄧亮等使用偏最小二乘法(PLS)為建模方法,選擇4 030~9 000 cm-1譜段,采用一階導數(shù)和SG平滑濾波法進行光譜預處理,建立了煙葉中煙堿、總氮、總糖的近紅外預測模型,結果表明近紅外檢測法與煙草行標檢測法(YC/T161)測得值之間不存在顯著性差異(P<0.05),近紅外光譜分析可準確測量煙葉中煙堿、總氮、總糖的含量[12]。
香味是煙草品質(zhì)的重要內(nèi)容,研究人員利用NIRS對煙草香味成分含量進行了諸多檢測研究。邱軍等建立了煙草中石油醚提取物內(nèi)的芳香油、樹脂、色素、醛、蠟、脂肪酸等成分的近紅外光譜模型,結果表明,預測值平均相對誤差為4.98%,預測均方差為0.303[13]。吳玉萍等分別對煙草中蘋果酸、檸檬酸、石油醚提取物和總多酚進行了NIRS檢測,結果表明,各組分預測值與實測值之間的平均偏差:蘋果酸為9.0%,檸檬酸為4.0%,石油醚提取物為12.4%,總多酚為10%[14-15]。付秋娟等[16]、蔣錦鋒等[17]利用NIRS建立了煙葉中總揮發(fā)堿、總揮發(fā)酸的數(shù)學模型,經(jīng)未知樣品檢測,其預測值和實測值間平均相對偏差均小于5%,表明NIRS技術可用于煙草香味成分的檢測。
隨著研究深入,NIRS也廣泛應用于卷煙產(chǎn)品的檢測。CO、焦油、煙堿作為卷煙產(chǎn)品的主要指標,采用經(jīng)典方法不僅無法對其含量進行預測,在測量的過程中也會產(chǎn)生污染。趙雪岑等分別使用二階導數(shù)法和偏最小二乘法(PLS)建立了30個品牌樣品的CO、焦油、煙堿校正模型,準確預測了卷煙產(chǎn)品的三大煙氣指標,同時還利用NIRS對卷煙產(chǎn)品的價格檔次進行了預測分類[18]。付秋娟等分別用煙絲(111個)和煙末(204個)樣品建立了原煙卷煙主流煙氣中焦油和煙堿的近紅外模型,研究表明,2種樣品狀態(tài)均能建立其近紅外速測模型,且煙氣煙堿的校正模型較好[19]。張鼎方等應用近紅外光纖漫反射技術掃描煙用接裝紙,對不同廠家煙用接裝紙進行模式識別,并建立評價模型,可準確評判煙用接裝紙內(nèi)在質(zhì)量穩(wěn)定性[20]。王堅等[21]、陶鷹等[22]利用NIRS建立了紅云紅河煙草(集團)有限責任公司云煙(軟珍品)、云煙(紫)、云煙(紅)、紅河(V8)、云煙(軟珍品)和紅山茶(軟)6個牌號樣品的糖料相似度匹配模型,結果表明,對模型樣品預測的相似度匹配值(SMV)均在95以上。任志強等采用主成分分析法分析了卷煙產(chǎn)品A、B1、B2的物理指標和主流煙氣指標,確定其主成分特征分量,根據(jù)特征矩陣建立了卷煙產(chǎn)品主成分得分圖,從而對不同的卷煙樣品進行聚類分析;并利用主成分載荷圖,分別對卷煙產(chǎn)品物理指標和主流煙氣指標的重要性和相關性進行分析[23]。袁大林等利用近紅外光譜分析技術結合光譜預處理、逐步變量篩選法及判別分析法等化學計量學方法,建立了3個不同品牌煙絲的判別模型,該模型的訓練與交互檢驗平均正確率分別為98.4%和95.2%[24]。張靈帥等以A牌和假冒A牌卷煙為試驗材料,采用近紅外光譜法結合主成分分析-馬氏距離判別分析方法建立了鑒別模型[25]。從120個樣品中隨機抽取100個用于建立4個主成分變量的定性判別模型,模型的相關系數(shù)達到了0.95,對20個未知樣品的預測結果準確率為100%。
研究人員利用近紅外光譜分析技術在煙葉產(chǎn)地判定、等級劃分、病蟲害鑒定、鮮煙根莖葉成分分析以及物理指標測定等領域開展了大量研究。王毅等應用光譜特征投影及相關分析方法以烤煙品種K326為樣,對多個產(chǎn)區(qū)的17類煙葉進行近紅外光譜分析,結果表明,將樣品隨機按2∶1劃分為分析集與驗證集后,其分析集與驗證集的一維、二維投影均值的相關系數(shù)都達到0.99以上,具有較好的一致性[26-27]。邱凱賢等基于近紅外光譜分析技術結合支持向量機(SVM)模式識別原理,對180個煙葉樣品的近紅外光譜一階求導后通過MATLAB分析軟件建立煙葉產(chǎn)地的近紅外預測模型,并應用該模型對78個煙葉樣品進行實際產(chǎn)地預測,結果表明,該預測模型訓練樣本的正確識別率為100.00%,測試樣本正確識別率為91.03%[28]。段焰青等以云南8個不同產(chǎn)地的880個煙葉樣品為基礎,利用TQ analyst分析軟件的定性分析方法建立煙葉產(chǎn)地的近紅外預測模型,該模型對云南煙葉產(chǎn)地的鑒別正確率為90%[29]。束茹欣等利用主成分分析(PCA)法和支持向量機算法(SVM)對6個產(chǎn)煙省份的煙葉建立了近紅外產(chǎn)地識別模型,結果表明,NIRPCASVM模型對6省煙葉樣品識別的預報正確率高達97%[30]。
宋相中等采用近紅外光譜結合最小二乘雙胞胎支持向量機(LSTSVM)算法建立了煙葉等級分類模型,對預測集樣品的平均識別率為95.56%[31]。唐果等采用近紅外光譜結合最小二乘判別分析(PLSDA)算法建立了煙葉等級分類模型,結果表明訓練集和預測集的預測正確率分別為100.0%(150/150)和96.7%(58/60)[32]。于春霞等應用基于SIMCA算法的相似性分析數(shù)學模型,對不同部位煙葉的近紅外光譜進行了相似性分析[33],結果表明,基于近紅外光譜的煙葉部位相似性分析結果與實際煙葉部位之間的相似性程度是相符的。謝娟等以NIR光譜和總糖、還原糖、煙堿、總氮、鉀、氯檢測數(shù)據(jù)為基礎,采用基于馬氏距離的判別法對1 129個國產(chǎn)烤煙煙葉樣品的產(chǎn)地和部位進行了模式識別,結果表明,對煙葉產(chǎn)地的識別準確率分別為88.0%~94.5%和62%~78%,對不同產(chǎn)地煙葉部位的識別準確率分別為71%~75%與63%~67%,對同一產(chǎn)地煙葉部位的識別準確率分別為82%~87%與80%~93%,對上、下部煙葉模式識別的識別準確率分別為92%~98%與89%~98%[3-4]。
何余勇等采用摩擦接種方法對煙苗接種TMV病毒誘發(fā)病毒病,利用近紅外光譜對健株和病株內(nèi)在化學成分(還原糖、鉀、氯、總氮、總糖和總煙堿)進行了定性和定量分析[35]。結果表明,接種TMV10 d后,健株與病株在化學成分上差異較大,特別是在有機物含量上,各調(diào)查時期的處理均高于對照。尹旭等利用近紅外分析技術結合偏最小二乘法建立片煙水分檢測模型,經(jīng)過試驗對比發(fā)現(xiàn):以標準方法檢測值為基準,利用近紅外技術檢測煙片含水率與實驗室普遍使用的快速烘箱相比,絕對偏差不大于0.2%的概率提高了1.55%,不大于0.3%的概率提高了1.82%,比快速烘箱更準[36]。王冬等利用偏最小二乘法對220個煙葉樣品進行近紅外光譜檢測,建立鈣元素和鎂元素的校正優(yōu)化模型,用F檢驗和T檢驗說明近紅外模型的預測值和化學值之間沒有明顯差異[37]。付秋娟等利用近紅外光譜儀(NIR)結合偏最小二乘法,用漫反射方法測定了青煙葉中K、Ca、Mg和質(zhì)體色素(葉綠素和類胡蘿卜素)等多種化學成分,試驗證明,NIR可以用于測試青煙葉中這幾種化學成分的含量[38-39]。李佛琳等對烤煙品種中煙101進行了葉片近紅外反射率測定、組織結構解剖觀察以及兩者關系分析,研究發(fā)現(xiàn),隨施氮量增加、葉位上升、成熟度降低,葉片厚度、柵欄組織厚度、海綿組織厚度、組織比、比葉重均呈上升趨勢,鮮煙葉近紅外(800 nm)反射增加;葉片厚度、柵欄組織厚度、海綿組織厚度、組織比與近紅外反射率之間均呈顯著正相關關系[40]。張云龍等應用聲光可調(diào)濾光器近紅外光譜儀建立再造煙葉厚度檢測方法模型,能準確預測再造煙葉厚度指標[41]。
2NIRS在煙草領域的主要建模方法
近紅外光譜吸收峰強度較弱,多組分信號重疊,并且背景干擾嚴重,如何借助化學計量學方法從復雜的光譜中提取待測組分的定量信息,消除背景和噪聲等無關信息的干擾,建立光譜與待測組分屬性值的關系模型,以實現(xiàn)定性定量分析一直是研究的重要內(nèi)容。
張敏等利用隨機模型的參數(shù)統(tǒng)計和連續(xù)小波變換(CWT)等方法,根據(jù)光譜變量對模型的影響,定義了“強影響變量(IV)”,建立了可有效識別IVs的方法;利用樣本交叉驗證殘差的分布及光譜變量組合對模型的影響,提出了一種同時剔除奇異樣本和無信息變量的方法;提出了小波展開的偏最小二乘方法(WUPLS),可充分利用光譜中的定量信息,應用于近紅外光譜的定量分析。研究結果表明,該方法可在識別奇異樣本的同時,有效消除無信息變量,并有效地提取和利用了近紅外光譜中的定量信息,提高模型的預測能力[40]。
吳榮暉等基于濾波器的構建技術,提出了一種近紅外光譜數(shù)據(jù)壓縮的自適應小波算法,該方法將小波的基本數(shù)學原理和半無限線性規(guī)劃理論結合,從信號本身的特點出發(fā),構建和優(yōu)化能滿足解壓縮和定量要求的濾波器,可避免人為因素所帶來的主觀誤差;基于離散小波變換(DWT)和最小二乘支持向量回歸(LSSVR)方法,建立了近紅外光譜測定煙葉中無機水溶性氯離子含量的一種新型回歸校正模型,首先采用DWT對近紅外光譜進行數(shù)據(jù)壓縮和背景扣除,再用LSSVR建立氯離子的校正模型。結果表明,所建立的方法可有效實現(xiàn)數(shù)據(jù)壓縮和背景扣除,能準確預測出煙葉中無機水溶性氯離子含量[41]。
賀英等將半監(jiān)督學習、遷移學習方法引入近紅外光譜分析建模方法體系,主要圍繞近紅外高維光譜數(shù)據(jù)處理、光譜定性分析和定量分析建模、光譜分析模型傳遞4個關鍵技術內(nèi)容展開了深入研究。提出一種半監(jiān)督核鄰域保護嵌入算法(SSKNPE),通過充分利用部分有標記樣本的先驗分類信息約束特征映射,使數(shù)據(jù)從高維映射到低維后仍能保持數(shù)據(jù)的全局結構和局部結構,經(jīng)試驗驗證,SSKNPE算法的降維質(zhì)量優(yōu)于LLE等傳統(tǒng)流形學習算法,能更好地改善卷煙品牌識別近紅外光譜分析模型的分類性能;引入轉(zhuǎn)導推理和半監(jiān)督學習思想,提出一種基于近鄰傳播聚類的半監(jiān)督支持向量機算法(APS4VM),近鄰傳播聚類和混沌優(yōu)化相結合,快速搜索多個間隔最大平面的低密度區(qū)域,確定安全分類的支持決策面,結果表明半監(jiān)督支持向量機解決了標記樣本不足時的卷煙近紅外光譜定性分析建模困難的問題;提出一種基于量子粒子群優(yōu)化的半監(jiān)督支持向量回歸算法(QPSOLSS3VR),解決了標記樣本不足時的卷煙近紅外光譜定量分析建模困難的問題;應用遷移學習思想,提出一種新的近紅外光譜模型傳遞算法,即基于相似匹配和遷移學習的模型傳遞算法(SMTrBoostEns),在目標儀器采集較少標準樣本光譜的情況下,仍能有效提升目標儀器回歸預測精度[42]。
李艷坤等采用多模型共識偏最小二乘(PLS)建模方法、多模型共識最小二乘支持向量回歸(LS.SⅥ)建模方法以及波長篩選方法對Boosting建模方法進行了研究,并應用于近紅外光譜煙葉樣品的定量分析。基于多模型共識建模的基本思想,采用隨機抽樣技術選擇訓練子集,建立了多模型共識偏最小二乘(cPLS)建模方法,該方法通過多次使用訓練集中不同子集樣本的信息,降低了預測結果對某一樣本的依賴性。研究結果表明,cPLS建模方法與傳統(tǒng)的偏最小二乘(PLS)建模方法相比,所建立的模型更加穩(wěn)健、可靠;采用最小二乘支持向量回歸(LS.SVR)算法與多模型共識原理結合,建立了多模型共識LS.SVR方法,能更有效地從數(shù)據(jù)的不同方面和不同層面抽取并表達自變量和因變量之間的復雜關系。結果表明,與傳統(tǒng)的LS.SVR和PLS方法相比,多模型共識LS.SVR方法預測精確度更高,也更加穩(wěn)健?;贛onte Carlo (MC)技術和無信息變量消除(UVE)方法,建立了一種改進的MC.UVE算法,能更合理、可靠地估計每個變量的穩(wěn)定性,有望解決過擬合問題?;贐oosting算法的基本原理,將AdaBoost與PLS回歸算法相結合,建立boostingPLS算法(簡稱為bPLS),該方法用訓練集樣本的相對預測誤差,被預測樣本的相對誤差越大,則在下一輪學習時,樣本的取樣權重將越大,結果表明,bPLS模型穩(wěn)健、可靠,取得了更小的預測均方根誤差(RMSEP)[43]。
3展望
目前,國內(nèi)外研究人員對NIRS在煙草分析領域的應用進行了大量富有成效的研究,在烤煙化學成分定性定量測定方面取得了重要進展,但在煙葉物理化學指標耦合、鮮煙葉化學成分測定、煙葉致香成分分析等方面的研究相對較少,還不能深入指導生產(chǎn)實踐,這將是今后研究的重點方向。隨著分析儀器往小型化、便攜式方向發(fā)展,近紅外光譜分析儀可用于快速檢測鮮煙葉內(nèi)在化學成分變化,為煙田管理提供有效數(shù)據(jù);同時可與煙葉烘烤過程結合,實時檢測煙葉內(nèi)在化學成分變化,為改善煙葉烘烤工藝參數(shù)提供數(shù)據(jù)支撐。
參考文獻
[1] 陸婉珍,袁洪福,徐廣通.現(xiàn)代近紅外光譜分析技術[M].北京:中國石化出版社,2000:14-19.
[2] 段民孝,邢錦豐,郭景倫,等.近紅外光譜(NIRS)分析技術及其在農(nóng)業(yè)中的應用[J].北京農(nóng)業(yè)科學,2002(1):11-14.
[3] 王鳳霞,張卓勇,王亞敏,等.近紅外光譜技術在醫(yī)藥領域應用的新進展[J].首都師范大學學報:自然科學版,2005,26(3):53-59.
[4] 鮑峰偉,劉景艷.近紅外光譜分析技術在石油化工中的應用[J].貴州化工,2006,31(6):34-37.
[5] 史蘇佳.近紅外的光學特性及在食品中的檢測原理和應用[J].山西食品工業(yè),2005(4):39-41.
[6] 李瑞麗,張保林,王建民.近紅外光譜檢測技術在煙草分析中的應用及發(fā)展趨勢[J].河南農(nóng)業(yè)科學,2013,42(6):1-6.
[7] 紀鵬,馮劍,李志偉.近紅外分析技術在煙草行業(yè)的應用研究進展[J].安徽農(nóng)業(yè)科學,2011,39(16):9848-9850.
[8] MCCLURE W F,NORRIS K H,WEEKS W W.Rapid spectrophotometric analysis of the chemical composition of tobacco,part 1: Total redudng sugars [J].Beitr Tabalforsch,1977,9:13-18.
[9] HANA M,MCCLUREW F,WHITAKER T B,et al.Estimating nicotine in tobacco from near infrared data[J].J Near Infrared Spectr,1955,3:133-142.
[10] HOY R M,MCCLUREW F.Fourier transform nearinfrared spectrometry: Using interferograms to determine chemical composition[J].Appl Spectr,1989,43(6):1102-1104.
[11] 張建平,謝雯燕,束茹欣,等.煙草化學成分的近紅外快速定量分析研究[J].煙草科技,1999(3):37-38.