林 晨,張方圓,吳凌濤,蔡大川,王李平,方 麗,林澤鵬,李雪瑩
(中國廣州分析測試中心 廣東省化學(xué)危害應(yīng)急檢測技術(shù)重點實驗室,廣東 廣州 510070)
氣相色譜結(jié)合化學(xué)計量學(xué)分析4種食用植物油的指紋圖譜
林晨,張方圓*,吳凌濤,蔡大川,王李平,方麗,林澤鵬,李雪瑩
(中國廣州分析測試中心廣東省化學(xué)危害應(yīng)急檢測技術(shù)重點實驗室,廣東廣州510070)
摘要:運用氣相色譜法對4類植物油(橄欖油、花生油、菜籽油和大豆油)的脂肪酸組成進行分析,并構(gòu)建了植物油的指紋圖譜,對4類植物油進行鑒別和分類。采用連續(xù)投影算法(SPA)對變量進行篩選,選出11個特征變量。以特征變量作為輸入,使用主成分分析(PCA)和有監(jiān)督模式識別(徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(RBF-ANN)、線性判別分析(LDA)和最小二乘-支持向量機(LS-SVM))進行建模分析。結(jié)果表明,11個特征變量能夠較好地區(qū)分4類植物油,PCA獲得了較好的分類,RBF-ANN的預(yù)報結(jié)果最佳,預(yù)報率為92.6%,并且能準(zhǔn)確預(yù)報二組分混合摻雜油樣。該方法能夠準(zhǔn)確區(qū)分植物油種類,可用于食用植物油的鑒別和摻雜食用植物油的鑒定。
關(guān)鍵詞:植物油;橄欖油;氣相色譜;指紋圖譜;化學(xué)計量學(xué);鑒別
食用油是人們膳食結(jié)構(gòu)中不可或缺的重要組成成分[1]。近年來,食用油的安全受到來自“地溝油”、摻假油等劣質(zhì)油的威脅。脂肪酸甘油酯是食用植物油的主要成分,也是其最為重要的營養(yǎng)成分[2]。脂肪酸為食用植物油中的特征成分,不同植物油的脂肪酸組成和含量有一定差異,在油脂質(zhì)量檢測中常被作為純度檢驗指標(biāo)[3]。
現(xiàn)有的植物油分類鑒定方法大多是以幾種常規(guī)檢測項目為依據(jù)來評價植物油質(zhì)量的好壞,這些方法不能反映植物油中甘油三脂的整體化學(xué)特性,對于綜合評價植物油品質(zhì)有一定的局限性。氣相色譜是目前分析脂肪酸成分的重要手段,可將食用植物油中的脂肪酸進行分離,得到其脂肪酸指紋圖譜[4]。近年來,化學(xué)計量學(xué)發(fā)展成為多元數(shù)據(jù)處理、提取復(fù)雜體系中隱藏信息不可或缺的工具[5-6]。食用油脂肪酸圖譜結(jié)合化學(xué)計量學(xué)方法是一種綜合的、可量化的、直觀的分析方法,已發(fā)展成為評價和鑒別食用植物油質(zhì)量和品質(zhì)的新型分析方法[7]。采用氣相色譜結(jié)合化學(xué)計量學(xué)方法鑒別食用植物油的品質(zhì),能夠有效鑒別食用植物油的種類,可為鑒定判別植物油種類和食用油的摻雜和勾兌提供技術(shù)支撐,對食用植物油的生產(chǎn)、銷售起到一定的監(jiān)管控制作用。
本文致力于將氣相色譜獲得的脂肪酸數(shù)據(jù)結(jié)合化學(xué)計量學(xué)方法來區(qū)分食用植物油的類別。首先應(yīng)用Kennard and Stone(K-S)算法選擇校正集和預(yù)報集樣品;應(yīng)用連續(xù)投影算法(SPA)篩選有效變量;應(yīng)用主成分分析(PCA)、徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(RBF-ANN)、線性判別分析(LDA)和最小二乘-支持向量機(LS-SVM)方法研究不同類別食用植物油的分類鑒別并建立校正模型。結(jié)果表明,SPA篩選變量后,再經(jīng)過RBF-ANN模型分析,可成功區(qū)分4種常見的食用植物油。
1實驗部分
1.1原料、試劑及樣品制備
從廣州市各大超市共收集食用植物油樣品41個,包括特級初榨橄欖油樣品6個,壓榨花生油樣品17個,菜籽油樣品11個,大豆油樣品7個(見表1)?;旌嫌蜆拥闹苽洌捍蠖褂秃突ㄉ偷捏w積比1∶1。
脂肪酸甲酯混標(biāo)(Nu-chekprep,Inc.);正己烷(色譜純,廣州化學(xué)試劑廠);KOH-甲醇(1 mol/L);三氟化硼甲醇(上海阿拉丁試劑有限公司)。Aglient 7820A氣相色譜儀(美國安捷倫公司);毛細管色譜柱:HP-88(30 m×0.25 mm×0.25 μm);XW-80A旋渦混合器(上海琪特分析儀器有限公司)。
取0.02 g油樣于10 mL比色管中,加入2 mL正己烷溶解,再加入1 mL KOH-甲醇溶液,渦旋1 min,加入三氟化硼甲醇0.5 mL,渦旋1 min,靜置20 min。取上層清液,供氣相色譜儀測定。
表1 食用植物油樣品統(tǒng)計及K-S分集結(jié)果
1.2氣相色譜工作參數(shù)
以He為載氣,恒流流速3.0 mL/min,進樣口溫度260 ℃,F(xiàn)ID檢測器;升溫程序:初始溫度為100 ℃,保持2 min,以20 ℃/min升至170 ℃,以2 ℃/min升至200 ℃后保持10 min,再以5 ℃/min升至230 ℃后保持5 min。分流比為30∶1,進樣體積為1.0 μL。
1.3化學(xué)計量學(xué)方法
所有的數(shù)據(jù)處理和程序運算均在MATLAB 6.5(Mathworks,Natic)軟件下進行。
1.3.1相關(guān)優(yōu)化翹曲方法(COW)COW常被用于校正色譜指紋圖譜的保留時間漂移現(xiàn)象[8]。該方法通過相關(guān)系數(shù)的最大化累積效應(yīng)從所有樣品中選擇1個樣品作為參考數(shù)據(jù)向量,其余樣品以參考樣品為標(biāo)準(zhǔn)進行保留時間校正[9]。在COW算法中,可通過色譜圖中峰寬和漂移程度來確定優(yōu)化空間,然后通過單形設(shè)計(Simplex design)在此優(yōu)化空間內(nèi)確定段長和松弛的大小。
1.3.2Kennard and Stone(K-S)算法K-S算法是Kennard和Stone提出的一個用于多元空間選擇樣品的方法,所選的樣品能夠盡可能地覆蓋所有的樣品范圍[10]。K-S算法主要用來選擇具有均勻分布的校正集和預(yù)報集樣品,依據(jù)歐式距離進行計算:
選擇過程從具有最大歐式距離的(p1,p2)開始,在后續(xù)迭代過程中,K-S算法是選擇具有最大歐氏距離的一對,一直重復(fù)直至達到分集要求。
1.3.3連續(xù)投影算法(SPA)SPA是多元校正中一種向前的變量選擇方法,其原理是在向量空間中利用簡單的投影算法來獲得一個具有最小共線性的變量集[11]。
1.3.4主成分分析主成分分析(PCA)是一種將多個變量通過線性變換,選出較少個數(shù)的重要變量的一種無監(jiān)督的多元統(tǒng)計分析方法,在數(shù)學(xué)分析中常用來降維[12-13]。一般將原始數(shù)據(jù)進行壓縮后構(gòu)建的一組新變量稱之為主成分數(shù)(PCs),這些主成分數(shù)可以看成是原始變量的線性組合,主成分數(shù)之間是相互正交的。
PCA的分析模型如下:X=TPt
X為樣本矩陣,T和P分別為對樣本矩陣進行奇異值分解得到的得分矩陣和載荷矩陣。模型中的每個樣品在主成分分數(shù)上分別定義為一個得分值,每個變量則對應(yīng)一個載荷值。在盡量保留原信息的基礎(chǔ)上,對原始數(shù)據(jù)進行轉(zhuǎn)換,并將特征信息在前幾個主成分中體現(xiàn)出來。通過對各主成分上載荷的對比可以找出對模型鑒別影響大的重要變量。
1.3.5徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(RBF-ANN)RBF-ANN是一種強大的神經(jīng)網(wǎng)絡(luò)類型,計算過程分為兩個步驟:第一步用一種聚類的無監(jiān)督模式識別方法,第二步是有監(jiān)督模式識別方法計算近似值。它包含一個只賦予隱藏的神經(jīng)元輸入層,一個由隱藏神經(jīng)元組成的隱藏層,以及一個輸出層。隱藏的神經(jīng)元是從高斯貝爾曲線中衍生出的一個非線性轉(zhuǎn)換函數(shù),輸出層神經(jīng)元則有一個線性轉(zhuǎn)換函數(shù),該函數(shù)能夠計算這些神經(jīng)元的最優(yōu)權(quán)重[14-15]。
1.3.6線性判別分析(LDA)LDA是一種常用的有監(jiān)督模式識別方法,廣泛用于非線性模型的分類分析。它首先是尋找能夠分開兩類或者多類樣品的特征變量,將這些變量線性組合,再將這個線性組合用于線性分類或作為其他分類方法的數(shù)據(jù)前處理方法。LDA將不同類樣品間的方差最大化從而保證了不同類樣品間的最大分離。
1.3.7最小二乘-支持向量機(LS-SVM)LS-SVM在經(jīng)典的支持向量機的基礎(chǔ)上發(fā)展而來,它利用最小二乘線性函數(shù)作為損失函數(shù),通過求解一組線性方程來代替?zhèn)鹘y(tǒng)的支持向量機(SVM)負責(zé)的二次規(guī)劃求解問題,降低了模型計算過程的復(fù)雜性,提高了求解速度[16]。LS-SVM模型的公式為:
式中,k(x,xi)是核函數(shù),xi是輸入向量,ai是朗格拉因子(支持值),b是偏差項。核函數(shù)常選取多項高斯徑向基函數(shù)。
圖1 4類植物油的脂肪酸組成圖譜Fig.1 GC chromatograms of the four species of vegatable oils1.olive oil,2.peanut oil,3.soybean oil,4.rapeseed oil,5.fatty acid mixed standards
2結(jié)果與討論
2.1植物油中脂肪酸成分的定性定量分析
4類植物油樣品經(jīng)氣相色譜分析后得到每個樣品的脂肪酸組成色譜圖,將樣品色譜圖與40種脂肪酸甲酯標(biāo)準(zhǔn)樣品在相同色譜條件下得到的色譜圖進行對比分析,并對色譜峰進行歸屬和確認。4類植物油的脂肪酸定性分析結(jié)果如圖1所示。
采用面積歸一化法,對油脂樣品中各脂肪酸甲酯的含量進行定量分析,得到植物油的脂肪酸組成如表2所示。由表2可知,這4類植物油中含有10種共有脂肪酸成分,分別為C16∶0(棕櫚酸),C16∶1(棕櫚酸一烯酸),C17∶0(十七烷酸),C18∶0(硬脂酸),C18∶1(油酸),C18∶2(亞油酸),C18∶3(亞麻酸),C20∶0(花生酸),C20∶1(花生酸一烯酸),C22∶0(山崳酸)。其中,4類植物油中棕櫚酸和十七烷酸的含量很接近;花生油和菜籽油中的棕櫚酸、棕櫚酸一烯酸、十七烷酸、油酸、亞麻酸、花生酸、花生酸一烯酸、山崳酸和木焦油酸的含量非常接近;花生油中硬脂酸與大豆油的含量非常接近。采用單個脂肪酸含量來分析和辨別不同類植物油不可靠。植物油之間的相似程度和區(qū)分結(jié)果由所有的脂肪酸組成成分來共同影響,其中一些含量低的成分往往具有不容忽視的作用。因此,采用化學(xué)計量學(xué)方法提取和分析樣本間的整體信息,將得到更加準(zhǔn)確可靠的分類效果。
表2 植物油中脂肪酸組成的定量分析結(jié)果
*no detected
2.2數(shù)據(jù)前處理
由于柱老化、柱污染、儀器的穩(wěn)定性及其他環(huán)節(jié)因素的改變均可能引起基線漂移和保留時間的漂移。當(dāng)采用全輪廓色譜數(shù)據(jù)構(gòu)建指紋圖譜進行分析時,基線漂移和保留時間的漂移均會對模式識別分類結(jié)果的準(zhǔn)確性產(chǎn)生不利影響。因此基線校正和保留時間漂移校正非常必要。本文分別采用airPLS和COW算法進行基線校正和保留時間漂移校正。41個植物油樣品的原始色譜圖和經(jīng)過校正后的色譜圖如圖2所示。通過對比可看出,原始色譜圖中不同樣品間的基線漂移不一,且保留時間有明顯漂移,經(jīng)過校正后,基線漂移和保留時間漂移得到明顯改善。
2.3連續(xù)投影算法(SPA)應(yīng)用于特征變量篩選
當(dāng)采用全輪廓色譜對不同種類的樣品進行區(qū)分時,由于色譜數(shù)據(jù)點較多(11 727 個),對計算機的內(nèi)存要求較高,計算所需時間長,且載荷圖(數(shù)據(jù)點變量)的解釋困難。為提高PCA的運行速度和PCA分類圖的可解釋性,本文采用SPA算法對特征變量進行選取。首先采用K-S算法選擇26個樣品作為校正集,15個樣品作為預(yù)報集(見表1)。通過SPA進行變量篩選,最終選取出6 603,3 582,5 903,5 229,4 903,4 882,5 404,5 317,3 547,3 573,9 399共11個變量。
圖3 4種植物油樣品的主成分分析投影圖Fig.3 PCA score plot of four species of vegatable oils
2.4特征變量應(yīng)用于主成分分析投影判別
將SPA算法選取的11個特征變量數(shù)據(jù)歸一化后,進行主成分分析,前兩個主成分的方差貢獻率為67.21%,4種不同種類的植物油樣品被很好地區(qū)分為4類(圖3)。
表3 3種分類模型的預(yù)報結(jié)果對比
a:number of hidden neurons:8;increase of hidden neurons:21;Root-Mean-Square Errors:10-5;(隱藏神經(jīng)元數(shù):8;增加神經(jīng)元數(shù):21;均方根差:10-5);b:optimized parameters:gam(γ)=130,sig2(σ2)=69(優(yōu)化參數(shù):gam(γ)=130,sig2(σ2)=69)
從第一主成分上,菜籽油樣品的得分為正,橄欖油和花生油樣品的得分為負,而大豆油樣品的得分處于-0.5~0.5之間。從第二主成分上,橄欖油的得分為正,花生油和大豆油的得分為負,而菜籽油的得分在-0.5~0.5之間。因而,投影雙圖上可以很好地將樣品區(qū)分為4類:8號載荷將橄欖油樣品與其他樣品區(qū)分開;4,9號載荷將大豆油樣品與其他樣品分開,并幫助8號載荷將花生油樣品鑒別出來;3,5,6,10號載荷將菜籽油樣品聚為一類。PCA分類結(jié)果良好,同時也驗證了采用SPA算法對變量的篩選是合理的。
2.5有監(jiān)督模式識別方法
應(yīng)用RBF-ANN,LDA,LS-SVM 3種有監(jiān)督模式識別方法進一步研究區(qū)分或者預(yù)報4類植物油的可能性。K-S算法將41樣品分為兩個樣品集:校正集和預(yù)報集,其中校正集26個,預(yù)報集15個(表1)。
3種有監(jiān)督模式識別方法的分類結(jié)果見表3。結(jié)果表明,RBF-ANN模型具有最高的識別率:校正率100%,預(yù)報集92.6%;LDA和LS-SVM的識別率非常相似,均低于RBF-ANN。RBF-ANN結(jié)合氣相色譜構(gòu)建的二維指紋圖譜可以對4類植物油樣品進行正確區(qū)分,其區(qū)分度可達92.6%。
2.6混合樣品的定量預(yù)報
RBF-ANN模型的預(yù)報結(jié)果較為理想,因此選用RBF-ANN對混合油樣進行定量預(yù)報。將大豆油和花生油混合樣品(1∶1)的色譜數(shù)據(jù)進行前處理作為RBF-ANN的數(shù)據(jù)輸入。在RBF-ANN模型中,4類植物油的值分別設(shè)為:大豆油=1,花生油=2,菜籽油=3,橄欖油=4。26個校正集和15個預(yù)報集的實際值和預(yù)報值的相關(guān)散點圖如圖4A所示。從圖4A可看出,大多數(shù)樣品點落在直線y=x上,驗證了RBF-ANN模型預(yù)報結(jié)果的準(zhǔn)確性。通過RBF-ANN預(yù)報得到混合油樣品的值,介于大豆油和花生油之間(圖4B),與實際相符,說明RBF-ANN模型可用于二組分混合摻雜油的判別和預(yù)報。
3結(jié)論
本文采用氣相色譜法測定了4類植物油(橄欖油、花生油、菜籽油和大豆油)的脂肪酸組成和含量,并構(gòu)建了植物油的色譜指紋圖譜,對4類植物油進行鑒別和分類。運用連續(xù)投影算法對特征變量進行選擇,無監(jiān)督(PCA)和有監(jiān)督(RBF-ANN,LDA,LS-SVM)模式識別方法對4種植物油樣品進行鑒別。實驗結(jié)果顯示,連續(xù)投影算法可以很好地解決變量選取問題,其中RBF-ANN模型結(jié)合色譜數(shù)據(jù)可獲得最好的分類結(jié)果,其預(yù)報率達92.6%?;瘜W(xué)計量學(xué)方法為建立植物油指紋圖譜提供了強有力的手段,可以準(zhǔn)確解析植物油的品種信息,為植物油的質(zhì)量控制提供了一定的借鑒和參考。
參考文獻:
[1]Jin Q Z,Wang X G,Li Q Y.Chin.OilsFats(金青哲,王興國,歷秋岳.中國油脂),2007,32(2):12-16.
[2]Ji S X,Wei F,Hu N,Lü X,Dong X Y,Chen H,Feng Y Q.J.Instrum.Anal.(藉淑賢,魏芳,胡娜,呂欣,董緒燕,陳洪,馮鈺锜.分析測試學(xué)報),2014,33(1):112-118.
[3]Chen Y X,Ma Y X,Lu Y,He M,Yang Y X.Chin.J.FoodHyg.(陳月曉,馬玉霞,陸穎,何梅,楊月欣.中國食品衛(wèi)生雜志),2012,24(4):301-305.
[4]Wang T Z,Yu L,Qiu S C,Chen X J,Cai S Q,Cao W Q.J.Instrum.Anal.(王同珍,余林,邱思聰,陳孝建,蔡淑琴,曹維強.分析測試學(xué)報),2015,34(1):50-55.
[5]Dong W J,Ni Y N.J.Instrum.Anal.(董文江,倪永年.分析測試學(xué)報),2014,33(5):506-511.
[6]Ding X X,Ni Y N.J.Anal.Sci.(丁曉曉,倪永年.分析科學(xué)學(xué)報),2014,30(4):445-450.
[7]Gu T.ACombinationofChemometricsandGC-MSTechniquesinApplicationofEdibleOilandTumorCellClassification.Changsha:Hunan University(顧婷.化學(xué)計量學(xué)結(jié)合GC-MS技術(shù)在食用油與癌細胞鑒別中的應(yīng)用.長沙:湖南大學(xué)),2013.
[8]Lucio-Gutierrez J R,Coello J,Maspoch S.Anal.Chim.Acta,2012,710:40-49.
[9]Lucio-Gutierrez J R,Garza-Juarez A,Coello J,Maspoch S,Salazar-Cavazos M L,Salazar-Aranda R,De Torres N W.J.Chromatogr.A,2012,1235:68-76.
[10]Daszykowski M,Walczak B,Massart D L.Anal.Chim.Acta,2002,468:91-103.
[11]Araujo M C U,Saldanha T C B,Galvao R K H,Yoneyama T,Chame H C,Visani V.Chem.Intel.Lab.Syst.,2001,57:65-73.
[12]Martens H,Naes T.MultivariateCalibration.New York:Wiley & Sons,1989.
[13]Wang N N,F(xiàn)eng X W,Sun Y P,Cong P S,Zhu Z L.J.Instrum.Anal.(王娜娜,馮昕韡,孫玉萍,叢培盛,朱仲良.分析測試學(xué)報),2013,32(10):1227-1231.
[14]Balabin R M,Safieva R Z,Lomalina E I.Anal.Chim.Acta,2010,671:27-35.
[15]Khajeh A,Modarress H.Expe.Syst.Appl.,2010,37:3070-3074.
[16]Guo H,Liu H P,Wang L.J.Syst.Simul.,2006,18(3):2033-2051.
Analysis of Fingerprints of 4 Species of Edible Vegetable Oils by Chemometrics Combined with Gas Chromatography
LIN Chen,ZHANG Fang-yuan*,WU Ling-tao,CAI Da-chuan,WANG Li-ping,FANG Li,LIN Ze-peng,LI Xue-ying
(Guangdong Provincial Key Laboratory of Emergency Test for Dangerous Chemicals,China National Analytical Center(Guangzhou),Guangzhou510070,China)
Abstract:Gas chromatography(GC) was used to determinate the composition and contents of fatty acids in vegetable oils,including olive oil,peanut oil,rapeseed oil and soybean oil.And the GC fingerprint profile was employed for the fingerprint analysis and species classification of the four species of vegetable oils.11 feature variables were selected by successive projections algorithm(SPA).Then,principal component analysis(PCA) and three supervised pattern recognition models:radial basis function artificial neural natwork(RBF-ANN),least square-support vector machine(LS-SVM),and linear discriminant analysis(LDA) were established to predict the species of the vegetable oils.The result demonstrated that the PCA obtained a clear clustering of objects respect to the species.RBF-ANN model performed better than the other two supervised pattern recognition models,with classification rate of 92.6%,and could predict the two component mixed oil sample accurately.The method could be used to distinguish the species of vegetable oil,and might be applicable for the identification of edible vegetable oils.
Key words:vegetable oils;olive oil;gas chromatography(GC);fingerprint;chemometrics;distinguish
收稿日期:2015-09-14;修回日期:2015-10-14
基金項目:廣東省專業(yè)鎮(zhèn)中小微企業(yè)服務(wù)平臺建設(shè)項目(2013B091604003);廣東省主體科研機構(gòu)創(chuàng)新能力建設(shè)專項(粵科規(guī)財字[2014]208號);廣州市天河區(qū)科技計劃項目(2013B040402012)
*通訊作者:張方圓,碩士,研究方向:食品安全與質(zhì)量控制,Tel:020-87603497,E-mail:zhangfyde@163.com
doi:10.3969/j.issn.1004-4957.2016.04.014
中圖分類號:O657.71;TQ645.1
文獻標(biāo)識碼:A
文章編號:1004-4957(2016)04-0454-06