蔣宏霖,劉會(huì)杰,王學(xué)杰,賈海江,徐雪芹
近紅外光譜技術(shù)在煙葉化學(xué)分析中的應(yīng)用*
蔣宏霖,劉會(huì)杰,王學(xué)杰,賈海江,徐雪芹
(廣西中煙工業(yè)有限責(zé)任公司,廣西 南寧 530001)
采用近紅外光譜法,對(duì)不同地區(qū)、不同等級(jí)具有代表性的500多個(gè)煙葉樣品進(jìn)行掃描,同時(shí)應(yīng)用化學(xué)分析儀測(cè)定煙葉中的總糖、還原糖、總煙堿、揮發(fā)堿、鉀含量,應(yīng)用近紅外分析軟件QUANT6.5,將光譜與對(duì)應(yīng)的化學(xué)成分值相關(guān)聯(lián),建立近紅外模型。結(jié)果表明,建立的煙草中總糖、還原糖、總煙堿、揮發(fā)堿、鉀等化學(xué)成分的回歸模型線(xiàn)性很好,通過(guò)20個(gè)未知樣品對(duì)所建模型的驗(yàn)證,所建指標(biāo)的實(shí)際值和預(yù)測(cè)值的平均相對(duì)偏差均小于5%,表明所建模型可直接應(yīng)用于煙草中主要化學(xué)成分的快速分析。
近紅外光譜技術(shù);煙葉化學(xué)成分;模型;快速分析
近紅外光譜技術(shù)作為一種簡(jiǎn)便、快速、低消耗和無(wú)污染的處理技術(shù),具有分析過(guò)程高效、綠色、環(huán)保的現(xiàn)代分析特征,從而成為近年來(lái)發(fā)展較快、引人注目的光譜分析技術(shù)之一。煙草作為天然植物,含有大量的CH、OH、NH和C=O等官能團(tuán),因此可以應(yīng)用傅里葉變換近紅外分析檢測(cè)技術(shù)對(duì)其進(jìn)行分析,減少化學(xué)分析所用試劑帶來(lái)的環(huán)境污染。目前,應(yīng)用傅里葉變換近紅外快速測(cè)定煙葉中化學(xué)成分已成為煙草化學(xué)研究的熱點(diǎn)之一,如蔣錦鋒等[1]應(yīng)用傅里葉變換近紅外光譜法掃描具有代表性的煙草近紅外光譜數(shù)據(jù), 采用偏最小二乘回歸建立了近紅外光譜信息與其含量之間的定量校正模型,建立了揮發(fā)性酸和揮發(fā)性堿的模型;王東丹等[2]應(yīng)用傅里葉變換近紅外漫反射光譜儀,建立了卷煙煙絲總糖和還原糖的近紅外定量分析數(shù)學(xué)模型;覃鑫[3]將近紅外光譜分析技術(shù)應(yīng)用于測(cè)定卷煙生產(chǎn)在線(xiàn)煙草樣本化學(xué)成分,建立了煙草總糖、還原糖、總植物堿、氯、總氮5項(xiàng)化學(xué)成分的校正模型;陳萍等[4]應(yīng)用近紅外光譜法預(yù)測(cè)云南香料煙的總糖、還原糖和總氮。程志穎等[5]采用粒子群算法結(jié)合支持向量回歸法對(duì)化學(xué)成分進(jìn)行建模。本研究利用傅里葉變換近紅外光譜近紅外(NIR)技術(shù),建立煙葉總糖、還原糖、總植物堿、鉀和揮發(fā)堿進(jìn)行定量分析模型,旨在實(shí)現(xiàn)快速無(wú)損檢測(cè)煙草中主要化學(xué)成分。
為了使建立的數(shù)學(xué)模型具有廣泛的適用性,本研究樣品選取了2015—2018年云南、貴州、廣西、湖南等不同產(chǎn)區(qū)、不同等級(jí)的初烤煙樣品共計(jì)500多個(gè)用于建立模型,選取20個(gè)未知樣品進(jìn)行模型外部驗(yàn)證。
將煙葉樣品抽梗,用QS-1試樣切絲機(jī)切絲,于40 ℃下烘干,使樣品的水分基本保持一致,再用1095 Cyclotec(XF-98B)型旋風(fēng)精密粉碎機(jī)充分粉碎,過(guò)60目篩。
建模煙葉樣品的化學(xué)成分采用Skalar流動(dòng)分析儀、AA3連續(xù)流動(dòng)分析儀及蒸餾萃取裝置進(jìn)行測(cè)定。其中,煙葉總糖、還原糖、總植物堿、鉀、揮發(fā)堿含量采用流動(dòng)注射法測(cè)定。每個(gè)樣品以此檢測(cè)數(shù)據(jù)作為基礎(chǔ)化學(xué)值數(shù)據(jù)與樣品的光譜數(shù)據(jù)對(duì)應(yīng),采用偏最小二乘法(0PLS1)建立回歸模型。
煙葉樣品譜圖掃描采用BRUKER公司(德國(guó))生產(chǎn)的MPA型傅里葉近紅外光譜儀(帶近紅外定量分析漫反射鍍金大積分球和樣品旋轉(zhuǎn)器采樣附件)進(jìn)行,應(yīng)用Bruker OPUS中定量分析
采用軟件QUANT6.5對(duì)譜圖進(jìn)行處理,具體操作如下:將煙草粉末裝入樣品杯,在杯中的高度約為3 cm,將砝碼壓在樣品上10 s后取出,用紗布將杯子底部的石英玻璃擦拭干凈,然后將樣品杯置于旋轉(zhuǎn)平臺(tái)上進(jìn)行NIR掃描。
操作參數(shù)為:光譜掃描范圍12 000~4 000 cm-1,光譜分辨率8 cm-1,掃描次數(shù)64次(約30 s)。
以透過(guò)方式采集光譜數(shù)據(jù)并處理為吸收光譜的一階微分。在建模過(guò)程中,為消除噪聲和基線(xiàn)的影響,采用一階導(dǎo)數(shù)9點(diǎn)平滑(Savitzky-Golay)對(duì)掃描后的原始光譜進(jìn)行預(yù)處理。有研究表明,誤數(shù)據(jù)誤差水平與儀器相關(guān)系數(shù)及算法有關(guān)[6],因此模型建成后應(yīng)用近紅外定量分析軟件包(偏最小二乘算法)對(duì)模型進(jìn)行優(yōu)化。
全光譜數(shù)據(jù)經(jīng)一階導(dǎo)數(shù)預(yù)處理后,輸入對(duì)應(yīng)建模樣品的總糖、還原糖、總植物堿以及鉀等化學(xué)測(cè)定數(shù)據(jù),采用偏最小二乘法和交互驗(yàn)證建立校正模型。采用光譜影響值(Leverage)和化學(xué)值誤差(Residua1)這2個(gè)參數(shù)分別剔除光譜和化學(xué)值的異常值。經(jīng)過(guò)異常值的剔除進(jìn)行逐步優(yōu)化,最后得到總糖、還原糖、總植物堿、揮發(fā)堿、鉀的回歸模型。
當(dāng)校正模型的雛形建立后,為確保其實(shí)用性,必須對(duì)模型進(jìn)行優(yōu)化。優(yōu)化模型是一個(gè)重復(fù)運(yùn)算模型的過(guò)程,其目的是剔除異常值(Outlier),直到獲得最佳數(shù)理指標(biāo)的校正模型。異常值是指遠(yuǎn)離模型整體的測(cè)量數(shù)據(jù),對(duì)模型的回歸分析影響較大,這類(lèi)數(shù)據(jù)一般具有較大的杠桿值(Leverage)和殘差值,需進(jìn)行有效剔除。
本研究采用交互驗(yàn)證(Cross-validation)建立校正模型,應(yīng)用光譜影響值和化學(xué)值誤差這兩個(gè)參數(shù)分別對(duì)異常光譜和化學(xué)值進(jìn)行剔除,并選擇與該組分或指標(biāo)相關(guān)的最佳譜區(qū)范圍、最佳光譜預(yù)處理方法和最佳主成分維數(shù)。在確定上述參數(shù)的同時(shí)要對(duì)模型進(jìn)行檢驗(yàn),以確保模型最優(yōu)。對(duì)煙草中的總糖、還原糖、總煙堿等模型進(jìn)行逐步優(yōu)化,所得數(shù)學(xué)模型較為理想,具體模型見(jiàn)圖1~圖5,各模型具體參數(shù)見(jiàn)表1。從圖1~圖5和表1中可以看出5種化學(xué)成分的回歸模型均具有較好的相關(guān)性,可以進(jìn)行定量預(yù)測(cè)。
圖1 總糖近紅外預(yù)測(cè)值與化學(xué)值的散點(diǎn)圖(單位:%)
圖2 還原糖近紅外預(yù)測(cè)值與化學(xué)值的散點(diǎn)圖(單位:%)
圖4 鉀近紅外預(yù)測(cè)值與化學(xué)值的散點(diǎn)圖(單位:%)
圖5 揮發(fā)堿近紅外預(yù)測(cè)值與化學(xué)值的散點(diǎn)圖(單位:%)
表1 各模型參數(shù)
參數(shù)Parameters總糖還原糖總植物堿氯鉀揮發(fā)堿 樣品數(shù)量467467467213213 主成分?jǐn)?shù)1313141417 決定系數(shù)(R2)97.0896.7896.7995.0195.53 內(nèi)部交叉驗(yàn)證均方差(RMSECV)0.927 00.856 00.129 00.097 20.019 5
為更好地檢測(cè)模型的預(yù)測(cè)能力,本研究采用外部驗(yàn)證的方法,選取未參與建模的20個(gè)樣品,用所建模型預(yù)測(cè)煙葉樣品的總糖、還原糖、總植物堿、揮發(fā)堿和鉀含量,并與其實(shí)測(cè)化學(xué)值比較,具體分析數(shù)據(jù)見(jiàn)表2。從表2可以看出,20個(gè)樣品的上述5種化學(xué)成分含量的近紅外預(yù)測(cè)值與實(shí)際化學(xué)測(cè)定值均基本一致,其平均相對(duì)偏差分別為2.76%,3.05%,3.91%,4.02%和4.35%,均小于5%,說(shuō)明所建模型的預(yù)測(cè)精確性較高。
表2 近紅外方法預(yù)測(cè)值與化學(xué)值的比較
編號(hào)總糖還原糖總植物堿鉀揮發(fā)堿 測(cè)定值預(yù)測(cè)值RD/(%)測(cè)定值預(yù)測(cè)值RD/(%)測(cè)定值預(yù)測(cè)值RD/(%)測(cè)定值預(yù)測(cè)值RD/(%)測(cè)定值預(yù)測(cè)值RD/(%) 129.6728.523.9526.6125.593.912.452.411.651.761.770.570.290.283.51 231.9330.793.6428.0627.133.372.722.585.281.621.591.870.310.323.17 327.6828.161.7226.4426.011.642.352.263.902.232.163.190.360.352.82 424.1825.696.0522.4221.265.311.681.796.342.012.125.330.310.296.67 536.3737.523.1132.3430.984.291.621.591.871.891.852.140.380.405.13 627.2828.795.3925.0726.053.833.513.471.152.322.476.260.470.454.35 726.8826.063.1024.3323.682.711.651.713.572.972.834.830.530.513.84 835.9636.050.2531.8232.191.162.302.352.153.263.182.480.370.395.26 930.6031.232.0427.8726.973.283.042.943.341.941.835.840.420.432.85 1025.2726.615.1723.1922.154.593.293.362.112.292.242.210.340.365.71 1131.6132.081.4828.1429.113.381.821.841.091.631.640.610.510.533.84 1233.4833.560.2430.1929.671.741.421.516.142.572.715.300.400.385.13 1327.1627.290.4824.5925.262.693.043.215.442.652.534.630.390.375.26 1430.6931.061.2027.6826.853.042.432.315.061.982.032.490.520.543.77 1523.6423.221.7921.5820.495.084.133.983.702.712.671.490.420.432.35 1629.7929.162.1427.3226.353.611.992.115.952.652.592.290.300.326.49 1727.0227.622.2024.6724.062.503.633.581.391.871.975.210.350.375.56 1832.0532.190.4429.1829.872.342.592.455.562.682.752.580.440.424.65 1924.9123.575.5321.6221.042.722.922.784.912.422.513.650.540.563.64 2030.5831.723.1627.9328.160.823.012.894.071.851.934.230.310.323.17 平均相對(duì)偏差2.763.053.914.024.35
模型應(yīng)用:應(yīng)用分析系統(tǒng)的集成軟件將建好的校正模型編入分析流程,分析樣品時(shí)通過(guò)分析系統(tǒng)的操作軟件調(diào)出相應(yīng)的分析流程,進(jìn)行掃描光譜、預(yù)測(cè),即對(duì)未知樣品的總糖、還原糖、總植物堿、揮發(fā)堿和鉀含量進(jìn)行同時(shí)測(cè)定,在操作熟練的情況下,每小時(shí)可分析60多個(gè)樣品。
模型維護(hù):采用外部驗(yàn)證法,應(yīng)用FT-NIR光譜法和化分儀、原子吸收、原子熒光等方法分別測(cè)定其相應(yīng)化學(xué)成分的含量,然后進(jìn)行統(tǒng)計(jì)評(píng)價(jià),其目的是刪除原校正模型中不適應(yīng)的光譜數(shù)據(jù),增加欠缺的光譜數(shù)據(jù),優(yōu)化模型,使模型始終保持良好的適應(yīng)狀態(tài)。
本研究采用換近紅外光譜技術(shù)建立的煙葉中總糖、還原糖、總植物堿、揮發(fā)堿、鉀的預(yù)測(cè)模型回歸系數(shù)在95%以上,說(shuō)明所建模型的預(yù)測(cè)精確性較高。通過(guò)換近紅外光譜建立了預(yù)測(cè)煙葉中總糖、還原糖、總植物堿、揮發(fā)堿、鉀含量的數(shù)學(xué)模型,可以實(shí)現(xiàn)快速、簡(jiǎn)便、大批量地分析煙葉中總糖、還原糖、總植物堿、揮發(fā)堿、鉀量的目的。
模型投入應(yīng)用后,需每年選取一定量的具有代表性的樣品作為獨(dú)立校驗(yàn)樣品,對(duì)模型進(jìn)行適應(yīng)性校驗(yàn),以提高模型的預(yù)測(cè)精度。
[1]蔣錦鋒,趙明月.近紅外光譜法快速測(cè)定煙草中的總揮發(fā)酸與總揮發(fā)堿[J].煙草科技,2006(3):33-37.
[2]王東丹,秦西云,趙立紅,等. 應(yīng)用近紅外光譜技術(shù)分析煙絲總糖和還原糖的研究[J].分析試驗(yàn)室,2007,26(5):30-32.
[3]覃鑫.在線(xiàn)近紅外光譜(NIR)快速測(cè)定煙草化學(xué)成分[J].西昌學(xué)院學(xué)報(bào)(自然科學(xué)版),2010,24(1):52-54,79.
[4]陳萍,逢濤,吳玉萍,等.近紅外光譜法預(yù)測(cè)云南香料煙中總糖、還原糖和總氮[J].光譜實(shí)驗(yàn)室,2012,29(1):95-98.
[5]程志穎,孔浩輝,張俊,等.粒子群算法結(jié)合支持向量機(jī)回歸法用于近紅外光譜建模[J].分析測(cè)試學(xué)報(bào),2010,26(12):1215-1219.
[6]CANDOLFI A,MAESSCHALCK R,JOUAN-RIMBAUD D.The influence of data pre-processing in the pattern recognition of excipients near-infrared spectra[J].J Pharma&Biom Anal,1999(21):115-132.
S572
A
10.15913/j.cnki.kjycx.2019.18.066
2095-6835(2019)18-0153-03
廣西壯族自治區(qū)科技廳科技攻關(guān)項(xiàng)目(編號(hào):桂科AB18229002)
蔣宏霖(1974—),男,本科,研究方向?yàn)闊熑~化學(xué)成分分析研究。
賈海江(1978—),主要從事煙草種植技術(shù)和分析研究工作。
〔編輯:王霞〕