王亞紅,周 萍,董大明,鄭文剛,葉 松,王文重
(1.桂林電子科技大學(xué),廣西桂林 541004; 2.北京農(nóng)業(yè)智能裝備技術(shù)研究中心,北京市農(nóng)林科學(xué)院,北京 100097)
基于PCR和PLS的蔗糖濃度透反射測(cè)量方法研究
王亞紅1,2,周 萍1,董大明2,鄭文剛2,葉 松1,2,王文重1,2
(1.桂林電子科技大學(xué),廣西桂林 541004; 2.北京農(nóng)業(yè)智能裝備技術(shù)研究中心,北京市農(nóng)林科學(xué)院,北京 100097)
利用近紅外透反射光譜技術(shù),研究短波近紅外光譜(780~1100nm)無損檢測(cè)蔗糖溶液的可行性,并通過主成分回歸(PCR)和偏最小二乘(PLS)方法建立了蔗糖溶液的近紅外定量分析模型。采用Savitzky-Golay卷積平滑(5點(diǎn))和多元散射校正(MSC)進(jìn)行預(yù)處理,并且對(duì)預(yù)處理后的數(shù)據(jù)進(jìn)行建模分析。PCR定量分析的結(jié)果:主成分?jǐn)?shù)PC=7,交互驗(yàn)證相關(guān)系數(shù)RCV=0.957335,交互驗(yàn)證的校正標(biāo)準(zhǔn)偏差RMSECV=0.015859;PLS定量分析結(jié)果:主成分?jǐn)?shù)PC=4,交互驗(yàn)證相關(guān)系數(shù)RCV=0.975789,交互驗(yàn)證的校正標(biāo)準(zhǔn)偏差RMSECV=0.012251。分別用PCR和PLS的校正模型對(duì)預(yù)測(cè)集樣本進(jìn)行預(yù)測(cè),兩種模型的預(yù)測(cè)標(biāo)準(zhǔn)偏差RMSEP分別為0.0127,0.0118。二者均對(duì)高濃度蔗糖溶液的預(yù)測(cè)結(jié)果比較理想,而且在PLS模型下,77%以上的樣本相對(duì)誤差在10%以下,較PCR模型的高。綜合結(jié)果,PLS所建立的模型簡(jiǎn)單,而且精度很高,所以,基于短波近紅外光譜的蔗糖濃度的快速無損檢測(cè)是可行的。
近紅外光譜;透反射;蔗糖;偏最小二乘;主成分回歸
近年來,采用近紅外光譜分析技術(shù)可對(duì)樣品光譜數(shù)據(jù)進(jìn)行定量或者定性分析,具有快速、無損、無需樣品預(yù)處理等特點(diǎn),已廣泛應(yīng)用于食品衛(wèi)生安全監(jiān)測(cè)方面,例如Ann Peirs、Ann Schenk等利用可見/近紅外光譜檢測(cè)7種蘋果在1999—2003年的成熟度,建立了近紅外光譜定量分析蘋果成熟度的模型[1],屠振華、朱大洲應(yīng)用近紅外光譜結(jié)合模式識(shí)別方法(LS-SVM)對(duì)蜂蜜摻假現(xiàn)象進(jìn)行了識(shí)別分析[2],對(duì)摻假蜂蜜的正確判別率能達(dá)到100%。江西農(nóng)業(yè)大學(xué)的張露采用可見/近紅外光譜技術(shù)對(duì)含有不同濃度三聚氰胺的165份牛奶樣本進(jìn)行檢測(cè)[3]。Loredana F.Leopol,Nicolae Leopold[4]等人用FTIR光譜儀透射法測(cè)量果汁的糖度,校正集模型的相關(guān)系數(shù)達(dá)到0.936等。相關(guān)研究人員分析了近紅外光譜和樣本內(nèi)部質(zhì)量指標(biāo)之間的關(guān)系,證實(shí)了將近紅外光譜應(yīng)用于固態(tài)、液態(tài)無損檢測(cè)的可行性。
蔗糖是人類基本的食品添加劑,冰糖、白砂糖、綿白糖和赤砂糖都含有不同純度的蔗糖。糖的傳統(tǒng)分析方法有離子高效液相色譜法[5-6]、離子色譜法[7]和比色法[8]等,這些方法操作時(shí)間長(zhǎng)、費(fèi)用高,不適宜在線分析。饒震紅、李民贊[9]采用短波近紅外光譜法同時(shí)定量分析水溶液中葡萄糖、果糖和蔗糖,校正集以及預(yù)測(cè)集的相對(duì)標(biāo)準(zhǔn)偏差均低于4%。但是定量分析模型比較單一,運(yùn)用不同的定量分析模型建模并對(duì)預(yù)測(cè)集進(jìn)行預(yù)測(cè)的研究相對(duì)較少。本文通過近紅外透反射光譜技術(shù)檢測(cè)溶液中的蔗糖,采用PCR和PLS兩種定量分析方法進(jìn)行建模,對(duì)比分析兩種方法的模型預(yù)測(cè)精度。
綿白糖400 g,用純凈水配制60個(gè)樣本溶液(濃度范圍:0~30%),用500 mL燒杯盛裝,溶液定容至300 mL。實(shí)驗(yàn)樣品分成校正集樣本48個(gè),預(yù)測(cè)集樣本12個(gè)。
實(shí)驗(yàn)采用CCD近紅外光譜儀(AvaSpec-2048,Avantes,The Netherlands)。糖度計(jì)為海鷗光學(xué)儀器廠的ATC型手持折光儀(0~32%),最小刻度值為0.2%。內(nèi)部帶有溫度補(bǔ)償裝置,溫度自動(dòng)補(bǔ)償范圍10~30℃。
取少許配置好的蔗糖溶液,滴在ATC型手持糖度計(jì)折光儀棱鏡表面,關(guān)上輔助棱鏡,朝向光源處并調(diào)節(jié)目鏡視度圈,使視野內(nèi)出現(xiàn)清晰明暗分界線,分界線相應(yīng)的讀數(shù)即蔗糖溶液的濃度。每次測(cè)量時(shí)應(yīng)保持棱鏡表面的清潔。
采用Avantes近紅外光譜儀的浸入式透反射光纖探頭,如圖1所示,光源為石英鹵素?zé)?2W/12V,檢測(cè)器為2048像元線性陣列CCD檢測(cè)器,采集的光譜范圍為300~1100 nm,CCD積分時(shí)間為45 ms,掃描次數(shù)為25,平均值設(shè)為10,光程為10 mm。實(shí)驗(yàn)在自行設(shè)計(jì)的密閉環(huán)境中進(jìn)行,對(duì)不同濃度蔗糖溶液的吸光度進(jìn)行測(cè)量,以純凈水為背景進(jìn)行背景光譜的采集。
圖1 實(shí)驗(yàn)原理圖Fig.1 Experimental schematic
因?yàn)槎滩ńt外波段主要是含氫基團(tuán)C-H,NH,O-H伸縮振動(dòng)的倍頻與合頻吸收[10-11],所以選取780~1100 nm波段內(nèi)溶液的吸光度值。
如圖2所示,隨著蔗糖溶液濃度的遞增,蔗糖溶液的吸光度值增大,蔗糖溶液的原始光譜圖存在基線漂移、平移的現(xiàn)象,光譜存在較大噪聲。所以在建模之前,本文采用Camo公司The Unscrambler 9.7軟件對(duì)原始光譜數(shù)據(jù)進(jìn)行預(yù)處理,預(yù)處理方法采用Savitzky-Golay(S-G)卷積平滑法和MSC(multiplicative scattering correction)多元散射校正法,S-G卷積平滑法是通過多項(xiàng)式對(duì)移動(dòng)窗口內(nèi)的數(shù)據(jù)進(jìn)行多項(xiàng)式最小二乘擬合,經(jīng)過大量實(shí)驗(yàn),移動(dòng)窗口的寬度為5時(shí)模型精度最優(yōu),MSC主要用來消除顆粒分布不均以及顆粒大小產(chǎn)生的散射[12],對(duì)原始光譜依次進(jìn)行(S-G)卷積平滑和MSC預(yù)處理后,有效的消除了原始光譜中的漂移,強(qiáng)化了譜帶特征。預(yù)處理后的光譜如圖3所示。
圖2 原始光譜Fig.2 Original spectra
圖3 預(yù)處理后的光譜Fig.3 Spectra after pretreatment
主成分回歸(PCR)和偏最小二乘(PLS)是兩種不同的建模方法,它們都能夠達(dá)到對(duì)光譜數(shù)據(jù)降維的目的[12-13],但是,PLS考慮到樣品濃度矩陣的影響,可以對(duì)濃度矩陣做同樣的處理,消除其無用的信息[13]。
選用47份校正集樣本,利用軟件 The Unscrambler 9.7對(duì)蔗糖濃度的測(cè)量值與吸光度數(shù)據(jù)進(jìn)行相關(guān)性分析,采用PCR和PLS建立模型,模型的最佳主成分個(gè)數(shù)由交互驗(yàn)證(cross-validation)法確定[14-15]。兩種建模方式下蔗糖溶液交互驗(yàn)證的預(yù)測(cè)值和測(cè)量值的對(duì)應(yīng)關(guān)系如圖4、圖5所示。
圖4 校正集樣本的PCA回歸模型Fig.4 PCA model regression figure of calibration set
圖5 校正集樣本的PLS回歸模型Fig.5 PLSmodel regression figure of calibration set
如圖4、圖5所示,橫坐標(biāo)表示蔗糖溶液的真值,縱坐標(biāo)是蔗糖溶液的預(yù)測(cè)值,圖中的坐標(biāo)點(diǎn)都緊緊圍繞在擬合的直線附近,而且直線的斜率分別是0.96114,0.97664,都近似等于1。PCR模型的預(yù)測(cè)結(jié)果為:PC=7,RCV=0.957335,RMSECV= 0.015859。PLS模型的預(yù)測(cè)結(jié)果為:PC=4,RCV= 0.975789,RMSECV=0.012251。綜合比較,兩種方法的預(yù)測(cè)精度都比較高,但是,PLS模型的交互驗(yàn)證相關(guān)系數(shù)RCV=0.975789,略高于PCR模型,交互驗(yàn)證標(biāo)準(zhǔn)偏差RMSECV也比PCR模型的小,而且,PLS模型的主成分是4,與PCR模型相比,減少了運(yùn)算量,模型相對(duì)簡(jiǎn)單[16-17],所以,PLS模型比 PCR模型的預(yù)測(cè)精度更高。
用已建立的數(shù)學(xué)模型(PCR、PLS)對(duì)13個(gè)預(yù)測(cè)集樣品的糖度進(jìn)行預(yù)測(cè),預(yù)測(cè)樣品的濃度范圍: 6.6%~27.2%,兩種模型下蔗糖溶液的預(yù)測(cè)值和真實(shí)值的對(duì)應(yīng)關(guān)系如圖6、圖7所示,12個(gè)預(yù)測(cè)集樣品的真實(shí)值、預(yù)測(cè)值及相對(duì)誤差如表1所示。
圖6 預(yù)測(cè)集樣本PCR回歸的真實(shí)值與預(yù)測(cè)值的相關(guān)性Fig.6 The correlation of predicted values and real values by PCR in prediction set
圖7 預(yù)測(cè)集樣本PLS回歸的真實(shí)值與預(yù)測(cè)值的相關(guān)性Fig.7 The correlation of predicted values and real values by PLS in prediction set
表1 預(yù)測(cè)集樣本的真實(shí)值、預(yù)測(cè)值及相對(duì)誤差Tab.1 The predicted results of 13 samples in prediction set %
由圖6、圖7可知,擬合直線的斜率分別是0.9331,0.94134,均大于 0.9,RMSEP分別是0.0127,0.0118,PLS預(yù)測(cè)結(jié)果的 RMSEP略小于PCR模型。
由表1可知,PCR模型的預(yù)測(cè)結(jié)果:樣本號(hào)為1,2,3,5,6的蔗糖溶液的預(yù)測(cè)結(jié)果不是很理想,其相對(duì)誤差均在10%以上;60%以上的樣本的相對(duì)誤差在10%以內(nèi)。PLS模型的預(yù)測(cè)結(jié)果:1~3號(hào)樣本的相對(duì)誤差在10%以上,其余樣本的相對(duì)誤差均在10%以內(nèi)。綜合比較,PCR、PLS兩種方法均對(duì)高濃度蔗糖溶液的預(yù)測(cè)結(jié)果理想,而且,PLS模型對(duì)77%以上的樣本預(yù)測(cè)精度較高,所以與PCR模型相比,PLS的建模方式最優(yōu)。
采用短波近紅外光譜透反射方式采集蔗糖溶液的光譜,并用兩種定量分析方法PCR、PLS進(jìn)行建模分析。結(jié)果表明:①兩種模型預(yù)測(cè)結(jié)果都比較好,但PLS模型的精度略高于PCR模型,且PLS模型更為簡(jiǎn)潔。②兩種模型均對(duì)高濃度蔗糖溶液的預(yù)測(cè)結(jié)果比較理想,PLS對(duì)77%以上的預(yù)測(cè)集樣本預(yù)測(cè)結(jié)果比較好,而PCR僅對(duì)60%以上的樣本預(yù)測(cè)結(jié)果好。所以,PLS模型性能更優(yōu),運(yùn)用近紅外光譜透反射技術(shù)進(jìn)行蔗糖溶液濃度的無損檢測(cè)是可行的。
[1]Ann Peirs,Ann Schenk.Postharvest effect of natural variability among apples on the accuracy of VIS-NIR calibrationmodels for optimalharvest date predictions[J].Biology and Technology,2005,35:1-13.
[2]TU Zhenhua,ZHU Dazhou,JIBaoping,et al.Adulteration detection of honey based on near-infrared spectroscopy[J].Transactions of the CSAE,2011,27(11):382-387.(in Chinese)
屠振華,朱大洲,籍保平.基于近紅外光譜技術(shù)的蜂蜜摻假識(shí)別[J].農(nóng)業(yè)工程學(xué)報(bào),2011,27(11): 382-386.
[3]ZHANG Lu.Nondestructive detection of melamine and pesticide residue in themilk products based on raman and VIS/NIR spectroscopy technology[D].Nanchang:Jiangxi Agricultural University,2012,5.(in Chinese)
張露.奶產(chǎn)品中三聚氰胺和農(nóng)藥殘留的拉曼及可見/近紅外光譜無損檢測(cè)技術(shù)研究[D].南昌:江西農(nóng)業(yè)大學(xué),2012,5.
[4]Loredana F.Leopol,Nicolae Leopold,Horst-A.Diehl.Quantification of carbohydrates in fruit juices using FTIR spectroscopy and multivariate analysis[J].Spectroscopy,2011,26:93-104.
[5]JIANG Xiaotong,CHEN Guosong,JIANG Lingling,et al.Simultaneous HPLC determination of 6 sweeteners[J].Food Science,2011,32(6):165-168.(in Chinese)
蔣曉彤,陳國(guó)松,姜玲玲,等.高效液相色譜法同時(shí)檢測(cè)6種甜味劑[J].食品科學(xué),2011,32(6):165-168.
[6]YANG Xiaoqi.Study on determination of sweetener additives and organic acids in food with high performance liquid chromatography and their application[D].Chengdu: Sichuan University,2007,5.(in Chinese)
楊曉琪.食品中甜味劑、有機(jī)酸的高效液相色譜分析方法研究及其應(yīng)用[D].成都:四川大學(xué),2007,5.
[7]XU Li.Application studies to the determination of gallic acid and soluble sugars by Ion chromatography[D].Chongqing:Southwest university,2012,6.(in Chinese)
許麗.離子色譜法在沒食子酸和可溶性糖類分析中的應(yīng)用研究[D].重慶:西南大學(xué),2012,6.
[8]MO Shuxun,QIAN Chengliang.Colorimetric method to determine content of soluble sugar[J].Journal of Fruit Science,1992,9(1):59-62.(in Chinese)
莫淑勛,錢承梁.果實(shí)中可溶性糖的比色法測(cè)定[J].果樹科學(xué),1992,9(1):59-62.
[9]RAO Zhenhong,LIMinzan,JI Haiyan.Simultaneous determination ofglucose,fructose and sucrose in aqueous solution by shor-twavelength near infrared[J].Spectroscopy Spectroscopy and Spectral Analysis,2006,26(4): 633-635.(in Chinese)
饒震紅,李民贊,吉海彥.短波近紅外光譜法同時(shí)定量分析水溶液中葡萄糖、果糖和蔗糖[J].光譜學(xué)與光譜分析,2006,26(4):633-635.
[10]XIE Jun,PAN Tao,CHE Jiemei.Joint optimization of Savitzky-Golay smoothingmodels and partial least squares factors for near-infrared[J].Spectroscopic Analysis of Serum Glucose.Analytical Chemistry,2010,3(8):342-346.(in Chinese)
謝軍,潘濤,陳潔梅.血糖近紅外光譜分析的Savitzky-Golay平滑模式與偏最小二乘法因子數(shù)的聯(lián)合優(yōu)選[J].分析化學(xué),2010,38(3):342-346.
[11]DING Haiquan,LU Qipeng,CHEN Jiemei.Effectof variable optical path length on the accuracy of the model in noninvasive biochemical detection by NIR spectrum[J].Acta Optica Sinica,2012,32(4):1-6.(in Chinese)
丁海泉,盧啟鵬,陳星旦.近紅外光譜無創(chuàng)生化檢測(cè)中不定光程對(duì)模型精度的影響研究[J].光學(xué)學(xué)報(bào),2012,32(4):1-6.
[12]ZHU Xiaoli.Molecular spectroscopy analytical technology combined with chemistries and its applications[M].Beijing:Chemical Industry Press.2011.(in Chinese)
褚小麗.化學(xué)計(jì)量學(xué)方法與分子光譜分析技術(shù)[M].北京:化學(xué)工業(yè)出版社,2011.
[13]LUO Yunhan.Analyses on internal interferer factors in noninvasive measurement of blood glucose concentration with near-infrared spectroscopy[J].Laser& Infrared,2008,38(5):465-471.(in Chinese)
羅云瀚.近紅外光譜無創(chuàng)傷血糖濃度測(cè)量的內(nèi)部干擾因素分析[J].激光與紅外,2008,38(5):465-471.
[14]Natalia Soro,Eleuterio Arancibia,Santiago A.Bortolato.Visible/near infrared-partial least-squares analysis of Brix in sugar cane juice A test field for variable selectionmethods[J].Chemo-metrics and intelligent laboratory systems,2010,102:100-109.
[15]ZHAO Ke,XIONG Yan,ZHAO Min.Rapid non-destructive testing of navel orange based on near infrared spectroscopy[J].Laser&Infrared,2011,41(6):649-652.(in Chinese)
趙珂,熊艷,趙敏.基于近紅外光譜技術(shù)的臍橙快速無損檢測(cè)[J].激光與紅外,2011,41(6):649-652.
[16]YANG Chunmei,LINing,ZHAO Xuehong,et al.Recent developments of NIRS technique for nondestructivemeasurement of fruitand vegetable interior quality[J].Laser&Infrared,2009,39(11):1137-1141.(in Chinese)
楊春梅,李寧,趙學(xué)玒,等.用于果蔬內(nèi)部品質(zhì)無損檢測(cè)的NIRS技術(shù)新進(jìn)展[J].激光與紅外,2009,39 (11):1137-1141.
[17]ZHAO Jiewen,ZHANG Donghai,LIU Muhua.Non-destructive determination of sugar contents o f apples using near infra red diffuse reflectance[J].Transactions of the CSAE,2005,21(3):162-167.(in Chinese)
趙杰文,張海東,劉木華.利用近紅外漫反射光譜技術(shù)進(jìn)行蘋果糖度無損檢測(cè)研究[J].農(nóng)業(yè)工程學(xué),2005,21(3):162-167.
Sucrose concentration measurement by transm ission and reflection spectroscopy based on PCR and PLS
WANG Ya-hong1,2,ZHOU Ping1,DONG Da-ming2,ZHENGWen-gang2,YE Song1,2,WANGWen-zhong1,2
(1.School of Electronic Engineering and Automation,Guilin University of Electronic Technology,Guilin 541004;
2.Beijing Research Center for Intelligent Equipment for Agriculture,Beijing Academy of Agriculture and Forestry Sciences,Beijing 100097,China)
Near-infrared spectra of trans-reflective is applied to determine the feasibility of nondestructive testing of the sucrose solution in the near-infrared wavelength range of 780~1100nm,and principal component regression(PCR) and partial least squares(PLS)are used to establish the near-infrared quantitative analysismodel of sucrose solution.After the pretreatment of(Savitzky-Golay)5 points smoothing and multiplicative scatter correction(MSC),the (PCR and PLS)calibration model ismade.The results of quantitative analysis of PCR are the number of principal component PC=7,the correlation coefficient RCV=0.957335,rootmean square error of cross validation RMSECV= 0.015859;The results of quantitative analysis of PLS are the number of principal component PC=4,the correlation coefficient RCV=0.975789,rootmean square error of cross-validation RMSECV=0.012251.The prediction samples are predicted respectively by the calibration model of PCR and PLS.Root mean square errors of prediction are 0.0127,0.0118 respectively.Both of themethods are satisfactory for the predicted results of high concentration samples.The relative errors ofmore than 77%of validation samples are below 10%using PLS.All of results show that PLSmodel is simpler and its prediction accuracy is higher,and short-wave near-infrared spectrometry is a valuable,rapid and nondestructive tool for the quantitative analysis of sucrose solution.
near infrared spectroscopy;transmission and reflection;sucrose;partial least squares;principal component regression
TN219
A
10.3969/j.issn.1001-5078.2014.05.011
1001-5078(2014)05-0528-05
國(guó)家自然科學(xué)青年基金(No.31101748);北京市農(nóng)林科學(xué)院創(chuàng)新能力建設(shè)專項(xiàng)(No.KJCX201102001)資助。
王亞紅(1987-),女,碩士研究生,主要從事近紅外光譜檢測(cè)儀器應(yīng)用研究。E-mail:547573454@qq.com
2013-08-12;
2013-09-09