曾路路 涂 斌 尹 成 鄭 曉 宋志強 何東平 亓培實
激光近紅外結(jié)合SVM的花生油摻偽定性定量分析
曾路路1涂 斌1尹 成1鄭 曉1宋志強1何東平2亓培實3
(武漢輕工大學(xué)機械工程學(xué)院1,武漢 430023)
(武漢輕工大學(xué)食品科學(xué)與工程學(xué)院2,武漢 430023)
(武漢百信環(huán)保能源科技有限公司3,武漢 430023)
利用激光近紅外技術(shù)結(jié)合支持向量機(support vector machines,SVM)對花生油摻偽進行定性和定量分析。使用激光近紅外光譜儀采集188個摻入餐飲廢棄油、大豆油、玉米油以及菜籽油的花生油樣品光譜圖。結(jié)果表明,建立的SVC分類模型均能實現(xiàn)100%的預(yù)測準(zhǔn)確率,但經(jīng)提取波長后的模型的變量變少,由全波段的451個波長數(shù)減少為136個。建立的SVR回歸模型也能準(zhǔn)確預(yù)測花生油中摻偽油的含量,其中非全波段模型參與建模變量變少,由451個降低到66個,預(yù)測精度也更高,校正集和測試集相關(guān)系數(shù)分別達到99.88%、99.90%,均方根誤差都低于6.99E-4。由此可知,特征波長提取方法不僅可以減少建模變量,提高建模效率,也能夠提高模型的預(yù)測能力。結(jié)果表明,運用激光近紅外結(jié)合SVM可以實現(xiàn)花生油摻偽油脂的定性和定量分析。
激光近紅外 花生油 支持向量機 定性和定量 后向偏最小二乘法
花生油是我國主要的食用油之一,營養(yǎng)價值高。目前有不少不法商販為了牟取暴利對食用植物油進行摻假[1]。如在花生油中加入大豆油、菜籽油等價值稍低的食用油,有的甚至在花生油中摻入蓖麻油、餐飲廢棄油等對人體有危害的非食用油[2-3]。為了杜絕不法摻假行為,目前的常規(guī)檢測方法有感官檢測、理化檢測等。但常規(guī)檢測方法很難檢測混合油的摻入成分及摻偽量,因此越來越多的學(xué)者開始重視儀器分析法[4]。目前利用近紅外光譜(Near Infrared,NIR)來檢測橄欖油的摻偽,其準(zhǔn)確率可達到98%[5]。而激光近紅外技術(shù)因其以新型的超輻射發(fā)光二極管(super luminescent Light Emitting Diode,SLED)作為光源,有著低噪聲、寬光譜以及高能量等特點,并且線性度、單色性較鹵鎢燈更好,比近紅外技術(shù)更有優(yōu)勢[6]。近紅外光譜技術(shù)是利用近紅外譜區(qū)內(nèi)包含的物質(zhì)信息,實現(xiàn)對有機物定性和定量分析[7]。目前,近紅外光譜技術(shù)已在石油化工、農(nóng)業(yè)、食品、高分子、醫(yī)學(xué)制藥等許多領(lǐng)域中發(fā)揮著積極作用[8]。近紅外分析技術(shù)在油脂檢測方面的應(yīng)用主要體現(xiàn)在油脂種類分類檢測、油脂品質(zhì)分析以及油脂摻偽鑒別[9-11]。
本試驗采用激光近紅外技術(shù)對花生油摻偽進行摻偽種類的定性分析和摻偽量的定量分析。采用支持向量機分類(Support Vector Machine Classifier,SVC)和支持向量機回歸(Support Vector Machine Regression,SVR)建立食用植物油定性和定量判別模型。對激光近紅外圖譜進行3種不同的預(yù)處理,采用后向偏最小二乘法(Backward interval Partial Least Squares,BiPLS)提取特征波長。旨在提出一種有效的定性、定量判別模型,實現(xiàn)對花生油摻偽種類和濃度快速、準(zhǔn)確的鑒別。
樣品主要是從一些地區(qū)分批次收集的餐飲廢棄油脂和從超市購買的不同品牌、不同品種的合格食用植物油(13種大豆油、12種菜籽油、4種玉米油、7種花生油)。隨機抽取收集到的植物油品牌(大豆油:錦麟、福臨門;玉米油:長壽花金胚玉米油、福臨門;菜籽油:金龍魚外婆鄉(xiāng)小榨、魯花)和餐飲廢棄油按一定比例摻入純花生油。以2%的等差梯度,配制摻偽油脂質(zhì)量分?jǐn)?shù)為3%~95%的二元體系花生油摻偽樣品。每份為10 g,置于離心管中混合均勻。共獲得188份摻偽食用植物油樣品。
試驗采用光譜-理化值共生距離算法(sample set partitioning based on joint X-Y distances algorithm,SPXY)[12]以3∶1 的比例將樣品劃分成校正集和測試集,其中校正集樣品用于建立模型,測試集樣品用于檢測模型預(yù)測性能的優(yōu)劣。樣品實際種類、編號和校正集及預(yù)測集樣品數(shù)量如表1所示。
表1 樣本種類、編號以及數(shù)量
試驗儀器為實驗室研發(fā)的激光近紅外植物油品質(zhì)快速檢測儀采集光譜,其中XL410型激光近紅外光譜儀:光譜測定范圍為1 350~1 800 nm,掃描次數(shù)32次,分辨率為3.5 cm-1美國AXSUN公司;試驗采用激光近紅外光譜儀自帶的軟件對樣品進行圖譜采集,用CAMO公司Unscramble 10.2化學(xué)計量學(xué)軟件和美國Math Works公司的MATLAB_R2012a對所采集的數(shù)據(jù)進行預(yù)處理和建模。
圖譜采集:將裝有樣品的試劑瓶放入水浴鍋中加熱至40℃,恒溫靜置10 min,取光程為5 mm的比色皿,用移液管將樣品注入比色皿至3/4處,將裝有樣品的比色皿放入樣品池,采集圖譜。每個樣品采集3次,取平均值作為最終的圖譜數(shù)據(jù)。每測量一次,將比色皿用有機溶劑洗滌并干燥后再進行下一次測量。試驗期間盡量保證室溫(25℃)、光線、濕度基本一致。所采集的近紅外光譜原始數(shù)據(jù)圖如圖1所示。
圖1 188份原始圖譜
2.1.1 圖譜預(yù)處理
近紅外光譜儀在對樣品進行采集時,除了可以得到分析樣品所必需的信息外,還會有其他無關(guān)信息。為了得到試驗所需信息,必須對所采集的光譜數(shù)據(jù)進行預(yù)處理[13]。對校正集和測試集樣本采用:標(biāo)準(zhǔn)正態(tài)變量變換(standard normal variate,SNV)來消除光譜的基線漂移;背景趨勢去除技術(shù)(De-trending,DT)消除光程的影響;多元散射校正(multiplicative scatter correction,MSC)消除散射的影響。圖2為DT預(yù)處理后的光譜圖。
圖2 DT預(yù)處理光譜圖
2.1.2 特征波長的提取
建立模型時,波段的選擇對模型的測試精度有著一定的影響。波段選取過寬,會導(dǎo)致信息冗余,對建模造成干擾;波段選取過窄,可能會丟失分析時所必需的信息[14]。為了得到精度較高的測試結(jié)果,需要選取適當(dāng)?shù)牟ㄩL范圍。間隔偏最小二乘法(iPLS)是一種有效的特征波長提取方法,其原理是將整個光譜圖分成若干個子區(qū)間,在每個子區(qū)間上進行偏最小二乘法回歸,建立局部模型。以交互驗證均方差(RMSECV)為標(biāo)準(zhǔn),分別比較全譜模型和局部模型的RMSECV值,取RMSECV值最小的模型所在區(qū)間為最佳區(qū)間[15]。后向偏最小二乘法(BiPLS)是iPLS的改進和延伸[16]。預(yù)處理后的數(shù)據(jù)經(jīng)過BiPLS選擇后的特征波長數(shù)量及對應(yīng)的位置見圖3。
圖3 DT-BiPLS特征波長
2.1.3 全波段和BiPLS特征波長建模
由近紅外光譜掃描所得光譜圖可以看出,所有的原始圖譜相差不大,需要通過建立花生油摻偽品種的判別模型才能區(qū)分它們之間的差異[17]。支持向量機(support vector machines,SVM)是Vapnik 等[18]根據(jù)統(tǒng)計學(xué)理論提出的一類新型機器學(xué)習(xí)方法,用于模式識別分類,函數(shù)逼近和非線性回歸等實際問題,可細分為支持向量機分類(SVC)和支持向量機回歸(SVR)2種方法。SVM用于模式識別時,需要對核函數(shù)及其參數(shù)進行選擇,本試驗采用具有較寬收斂域的RBF 核函數(shù)[19]。
分別將3種不同預(yù)處理的全波段變量和經(jīng)Bi-PLS提取的特征波長變量作為SVM的輸入量,選用RBF核函數(shù),采用網(wǎng)格搜索算法對組合參數(shù)(C,g)進行尋優(yōu),分別在全波段和特征波長變量建立SVC鑒別模型,根據(jù)樣品預(yù)測集的準(zhǔn)確率來評價模型的好壞[20]。表2為3種預(yù)處理的定性模型評價指標(biāo)。
表2 全波段與BiPLS特征波長SVC模型的測試結(jié)果
原始數(shù)據(jù)在全波段和特征波長建模的測試準(zhǔn)確率低于預(yù)處理后的準(zhǔn)確率,說明預(yù)處理對模型的結(jié)果有很大影響。3種預(yù)處理在全波段建模和特征波長建模的測試準(zhǔn)確率均高達91.49%以上,均能很好地實現(xiàn)對花生油摻偽種類地判別。采用MSC預(yù)處理方法在全波段與特征波長建模的測試集和校正集準(zhǔn)確率均為100%,且在全波段建模的參數(shù)小,效果最好。而采用SNV預(yù)處理方法在特征波長建模的測試準(zhǔn)確率高于全波段建模的準(zhǔn)確率,波長數(shù)也由原來的451減少到了136,大大縮短了建模時間,說明特征波長提取對模型的結(jié)果也是有一定影響的。圖4為MSC-SVC結(jié)果圖。綜上所述,原始數(shù)據(jù)與采用3種預(yù)處理方法在全波段與特征波長建模都可以實現(xiàn)對花生油摻偽種類的判別,且采用預(yù)處理方法可以提高模型的準(zhǔn)確率。在考慮建模時間的影響時,運用特征波長建模方法可減少建模時間。
圖4 MSC-SVC模型預(yù)測結(jié)果
2.2.1 特征波長提取
對光譜圖進行SNV、MSC、DT預(yù)處理后,采用Bi-PLS將其劃分成20個子區(qū)間,不同預(yù)處理后的數(shù)據(jù)經(jīng)過BiPLS選擇后的特征波長數(shù)量圖及對應(yīng)的位置圖如圖5所示,原始數(shù)據(jù)和經(jīng)3種不同預(yù)處理方法預(yù)處理后的數(shù)據(jù),經(jīng)過BiPLS提取后的波長數(shù)目以及對應(yīng)的測試均方根誤差(RMSE)如表3所示。
圖5 SNV-BiPLS特征波長
表3 不同預(yù)處理光譜經(jīng)BiPLS提取的特征波長
2.2.2 全波段和特征波長建模
采用SVR方法,將3種不同預(yù)處理數(shù)據(jù)的全波段變量和經(jīng)BiPLS提取的特征變量作為輸入量,采用網(wǎng)格搜索算法對組合參數(shù)(C,g)進行參數(shù)尋優(yōu),建立摻偽油脂定量預(yù)測模型[21],結(jié)果如表4所示。3種不同預(yù)處理方法建立的SVR模型測試相關(guān)系數(shù)均在99.04%以上,均方根誤差低于6.99E-4,均能很好地判斷花生油的摻偽量。預(yù)處理方法能夠提升模型的測試效果,對建模結(jié)果有一定的影響。全波段和特征波長建模的測試結(jié)果相差不大,但經(jīng)特征波長提取的模型可以剔除許多無關(guān)信息,建模變量可以由原來的451個降低到66個,縮短了建模時間。試驗表明,MCS-BiPLS-SVR模型的波長數(shù)少,參數(shù)小,穩(wěn)定性好。圖6為MSC-BiPLS-SVR模型預(yù)測結(jié)果。綜上所述,原始數(shù)據(jù)與采用3種預(yù)處理方法后在全波段與特征波長建模均能實現(xiàn)對花生油的定量分析,預(yù)處理方法可提高模型的測試能力,運用特征波長建模可縮短建模所需時間。
圖6 MSC-BiPLS-SVR模型預(yù)測結(jié)果
表4 全波段和BiPLS優(yōu)選波長SVR模型評價指標(biāo)
運用激光近紅外技術(shù)結(jié)合支持向量機算法可以實現(xiàn)花生油摻偽的定性定量分析。結(jié)果表明,對于定性分析,建立的SVC和BiPLS-SVC模型均能實現(xiàn)摻偽油種類鑒別;對于定量分析,建立的SVR和BiPLS-SVR模型都可以實現(xiàn)摻偽油含量預(yù)測;預(yù)處理方法能夠提高模型的預(yù)測能力,減小參數(shù)組合(C,g)值;特征波長提取方法在保證模型預(yù)測效果的前提下,減少了建模變量,縮短了建模時間。本研究為其他食用植物油摻偽檢測提供方法。試驗的不足之處在于摻偽樣本數(shù)量有限,且摻偽種類少,在以后的研究中要加大食用植物油摻偽樣本的搜集和配置。
[1]李娜.食用油安全問題淺析[J].中國糧食經(jīng)濟,2008(3):17-18
Li Na.Oil security analysis[J].China Grain Economy,2008(3):17 -18
[2]潘紅紅,梁潤,萬渝平.問題食用油儀器分析方法研究進展[J].農(nóng)業(yè)工程,2013,3(5):76 -80
Pan Honghong,Liang Run,Wan Yuping.Research advance in instrument method for edible oil[J].Agricultural Engineering,2013,3(5):76 -80
[3]鄒潔,趙維佳,汪海峰,等.大豆油中摻偽棕櫚油的檢測方法研究[J],中國油脂,2009,34(4):73 -76
Zou Jie,Zhao Weijia,Wang Haifeng,et al.Determination of palm oil adulterated in soybean oil[J].China Oils and Fats,2009,34(4):73 -76
[4]沈雄,鄭曉,何東平.餐飲業(yè)廢棄油脂鑒別檢測方法研究進展[J].中國油脂,2011,36(11):49 -51
Shen Xiong,Zheng Xiao,He Dongping.Advance in differential detection method of waste cooking oil[J].China Oils and Fats,2011,36(11):49 -51
[5]薛雅琳,王雪蓮,張蕊,等.食用植物油摻偽鑒別快速檢驗方法研究[J].中國糧油學(xué)報,2010,25(10):116 -118
Xue Yalin,Wang Xuelian,Zhang Rui,et al.An authentication method of edible vegetable oils[J].Journal of the Chinese Cereals and Oils Association,2010,25(10):116 -118
[6]劉燕德,萬常斕.芝麻油摻偽的近紅外透射光譜檢測技術(shù)[J].農(nóng)業(yè)機械學(xué)報,2012,43(7):136 -140
Liu Yande,Wan Changlan.Analysis of sesame oil adulteration using near infrared transmission spectroscopy[J].Transactions of the Chinese Society for Agricultural Machinery,2012,43(7):136 -140
[7]張勇,叢茜,謝云飛,等.NIRS分析技術(shù)在農(nóng)業(yè)中的應(yīng)用進展[J].農(nóng)業(yè)工程學(xué)報,2007,23(10):285 -290
Zhang Yong,Cong Qian,XieYunfei,et al.Progress in application of near infrared spectroscopy technology in agriculture[J].Transactions of the Chinese Society of Agricultural Engineering,2007,23(10):285 -290
[8]王菊香,邢志娜,申剛,等.光譜預(yù)處理和波長選擇對混胺燃料各指標(biāo)近外光譜定量分析結(jié)果的影響比較[J].計算機與應(yīng)用化學(xué),2013,30(1):39 -42
Wang Juxiang,Xing Zhina,Shen Gang,et al.Effects of spectral preprocessing and wavelength selection on content determination in mixed - amine by NIR spectroscopy[J].Computers and Applied Chemistry,2013,30(1):39 -42
[9]黃富榮,羅云瀚,鄭仕富,等.全血膽固醇、甘油三酯近紅外光譜分析與模型優(yōu)化[J].光學(xué)學(xué)報,2011,31(10):267-272
Huang Furong,Luo Yunhan,Zheng Shifu,et al.Near- infrared spectroscopic analysis and model optimization on cholesterol and triglyceride in whole blood[J].Acta Optica Sinica,2011,31(10):267 -272
[10]王銘義,郭建英,張佳寧,等.三級大豆油酸價的近紅外光譜檢測[J].食品科學(xué),2011,32(22):171 -174
Wang Mingyi,Guo Jianying,Zhang Jianing,et al.Determination of acid value in third grade soybean oil by near infrared spectroscopy[J].Food Science,2011,32(22):171 -174
[11]宋鵬,張明,曹劉霞,等.食用油脂摻入異種油脂檢測方法研究進展[J].糧食與油脂,2009(11):4 -8
Song Peng,Zhang Ming,Cao Liuxia,et al.Current advances in detection of mixed different edible oils and fats[J].Cereals & Oils,2009(11):4 -8.
[12]劉善梅,李小昱,鐘雄斌.考慮品種差異的冷鮮豬肉含水率高光譜信號補正算法[J].農(nóng)業(yè)工程學(xué)報,2014,30(4):272 -278
Liu Shanmei,Li Xiaoyu,Zhong Xiongbin.Hyperspectral signal correction algorithm for water content of cold fresh pork with considering difference between varieties[J].Transactions of the Chinese Society of Agricultural Engineering,2014,30(4):272 -278
[13]宋志強,沈雄,鄭曉,等.應(yīng)用近紅外光譜對低碳數(shù)脂肪酸含量預(yù)測[J].光譜學(xué)與光譜分析,2013,33(8):2079 -2082
Song Zhiqiang,Shen Xiong,Zheng Xiao,et al.Low carbon number fatty acid content prediction based on near-infrared spectroscopy [J].Spectroscopy and Spectral Analysis,2013,33(8):2079 -2082
[14]楊仁杰,劉蓉,徐可欣.二維相關(guān)光譜結(jié)合偏最小二乘法測定牛奶中的摻雜尿素[J].農(nóng)業(yè)工程學(xué)報,2012,28(8):259 -263
Yang Renjie,Liu Rong,Xu Kexin.Detection of urea in milk using two-dimensional correlation spectroscopy and partial least square method[J].Transactions of the Chinese Society of Agricultural Engineering,2012,28(8):259 -263
[15]黃富榮,李仕萍,余健輝,等.基于iPLS的血清膽固醇、甘油三酯近紅外定量分析[J].光譜實驗室,2011,28(8):2774-2778
Huang Furong,Li Shiping,Yu Jianhui,et al.Determination of cholesterol and triglyceride in serum based on interval partial least squares by near- infrared spectrum[J].Chinese Journal of Spectroscopy Laboratory,2011,28(8):2774-2778
[16]石吉勇,鄒小波,趙杰文,等.BiPLS結(jié)合模擬退火算法的近紅外光譜特征波長選擇研究[J].紅外與毫米波學(xué)報,2011,30(5):458 -462
Shi Jiyong,Zou Xiaobo,Zhao Jiewen,et al.Selection of wavelength for strawberry NIR spectroscopy based on BiPLS combined with SAA[J].Journal of Infrared and Millimeter Waves,2011,30(5):458 -462
[17]蔣雪松,陸輝山,張林,等.基于近紅外光譜對老陳醋的pH值和可溶性固形物定量與定性的檢測研究[J].紅外技術(shù),2013,35(11):737 -740
Jiang Xuesong,Lu Huishan,Zhang Lin,et al.Qualitative and quantitative detection research of mature vinegar’s pH and SSC based on near infrared spectroscopy[J].Infrared Technology,2013,35(11):737 -740
[18]方慧文,曾愛民,江小明,等.近紅外光譜結(jié)合化學(xué)計量學(xué)技術(shù)在食品摻假分析中的應(yīng)用[J].食品安全質(zhì)量檢測學(xué)報,2012,3(5):427 -431
Fang Huiwen,Zeng Aimin,Jiang Xiaoming,et al.Application of near-infrared spectroscopy combined with chemometrics in food adulteration detection[J].Journal of Food Safety & Quality,2012,3(5):427 -431
[19]付元元,任東.支持向量機中核函數(shù)及其參數(shù)選擇研究[J].科技創(chuàng)新導(dǎo)報,2010(9):6 -7
Fu Yuanyuan,Ren Dong.Approach to SVM kernel functions parameters selection[J].Science and Technology Innovation Herald,2010(9):6 -7
[20]鐘燕萍,鐘振聲,陳蘭珍,等.近紅外光譜技術(shù)定性鑒別蜂蜜品種及真?zhèn)蔚难芯浚跩].現(xiàn)代食品技術(shù),2010,26(11):1280 -1283
Zhong Yanping,Zhong Zhensheng,Chen Lanzhen,et al.Qualitative identification of floral origin and adulteration of honey by near- infrared spectroscopy[J].Modern Food Science &Technology,2010,26(11):1280 -1283
[21]Shen Xiong,Zheng Xiao,Song Zhiqiang,et al.Rapid identification of waste cooking oil with near infrared spectroscopy based on support vector machine[J].Computer and Computing Technologies in Agriculture,2012,(10):11 -18.
Qualitative and Quantitative Analysis of Peanut Oil Adulteration by Laser Near Infrared Spectroscopy with SVM
Zeng Lulu1Tu Bin1Yin Cheng1Zheng Xiao1Song Zhiqiang1He Dongping2Qi Peishi3
(School of Mechanical Engineering,Wuhan Polytechnic University1,Wuhan 430023)
(College of Food Science and Engineering,Wuhan Polytechnic University2,Wuhan 430023)
(Pashun Group3,Wuhan 430023)
Qualitative and quantitative analyses of peanut oils adulteration were performed by combining near infrared(NIR)spectroscopy with support vector machines(SVM).With NIR spectrometer,the spectra of 188 peanut oil samples adulterated with waste oil,soybean oil,corn oil and canola oil were collected.Experiments demonstrated that with the SVC models,the accuracy of prediction reached to 100%.Upon wavelengths extraction,the wavelength number of full spectrum was reduced from 451 to 136.With the SVR regression models,the adulterated content of peanut oil could be predicted accurately,of which,the number of modeling variables for the non - full spectrum models was reduced from 451 to 66 with higher accuracy of prediction.Correlation coefficients of calibration and test sets reached to 99.88%and 99.90%,respectively.All the root-mean-square errors were lower than 6.99E-4.On this basis,the characteristic wavelengths extraction not only reduced modeling variables and improved the modeling efficiency,but improved the modeling predictive capability.It was validated by results that the combination of NIR spectroscopy with SVM could realize the qualitative and quantitative analyses of adulteration of peanut oil.
NIR,peanut oil,support vector machines,qualitative and quantitative,BiPLS
O657.3
A
1003-0174(2016)08-0126-06
“十一五”國家科技支撐計劃(2009BADB9B08),武漢市科技攻關(guān)計劃(2013010501010147),武漢工業(yè)學(xué)院食品營養(yǎng)與安全重大項目培育專項(2011Z06),武漢輕工大學(xué)2014年研究生創(chuàng)新基金(2014cx005)
2014-12-04
曾路路,女,1991年出生,碩士,智能檢測技術(shù)
鄭曉,男,1958年出生,教授,油脂壓榨原理與智能檢測