高 冰,吳鵬飛,許曉棟,楊增玲,劉 賢
(中國(guó)農(nóng)業(yè)大學(xué) 工學(xué)院,北京 100083)
為保障消費(fèi)者權(quán)益,維護(hù)市場(chǎng)秩序,植物油的真實(shí)性問(wèn)題受到了廣泛的關(guān)注與研究[1-2]?,F(xiàn)有的植物油真實(shí)性檢測(cè)技術(shù)主要為色譜法[3-5]、光譜法[6-9]等,單一方法雖然可以達(dá)到檢測(cè)植物油真實(shí)性的目的,但基于單一信息源的分析技術(shù)的檢測(cè)精度不足,且檢測(cè)模型的魯棒性差[10-11]。為解決這一問(wèn)題,數(shù)據(jù)融合的方法得到了廣泛研究[12-16],其中,基于數(shù)據(jù)融合方法的食用油植物源定性判別研究鮮有報(bào)道。
本文以葵花籽油、玉米油、大豆油和花生油4種不同植物源食用油為研究對(duì)象,基于氣相色譜和近紅外光譜技術(shù),獲取植物油的多源信息。氣相色譜法可對(duì)食用油的脂肪酸組成進(jìn)行量化表征[17],近紅外光譜可對(duì)食用油中的含氫化學(xué)基團(tuán)產(chǎn)生響應(yīng)[18],兩種技術(shù)從不同角度對(duì)植物油樣本進(jìn)行分析。理論上,將這兩種技術(shù)源的數(shù)據(jù)進(jìn)行融合分析具有提高模型檢測(cè)精度以及魯棒性的潛力,并可為食用油植物源的定性分析提供新思路。
實(shí)驗(yàn)樣本共272個(gè),來(lái)自山東省金勝糧油食品公司,包括葵花籽油樣本41個(gè),玉米油樣本40個(gè),大豆油樣本40個(gè),花生油樣本151個(gè);樣本均為不同生產(chǎn)批次的成品油,樣本原料的地理來(lái)源廣闊,加工工藝及品質(zhì)指標(biāo)多樣。采樣前于室溫樣本庫(kù)中密封存放。
植物油樣本經(jīng)皂化、甲酯化、脫水后得到脂肪酸甲酯,通過(guò)氣相色譜儀(7820,美國(guó)安捷倫公司)進(jìn)行脂肪酸種類及含量測(cè)定,采用氫離子火焰檢測(cè)器(FID,美國(guó)安捷倫公司);石英毛細(xì)管柱(聚二氰丙基硅氧烷強(qiáng)極性固定相)長(zhǎng)度100 m,內(nèi)徑0.25 mm,膜厚0.25 μm。色譜分析條件:進(jìn)樣量1 μL,進(jìn)樣口溫度為250 ℃;分流比為60∶1;初始溫度175 ℃,保持10 min,以3 ℃/min速率升溫至210 ℃,保持10 min,以3 ℃/min速率升溫至225 ℃,保持15 min。檢測(cè)溫度250 ℃,載氣為氮?dú)?純度為99.999%),氫氣流速為30 mL/min,氮?dú)饬魉贋?2 mL/min,空氣流速為300 mL/min,尾吹流速為25 mL/min。每個(gè)樣品做3次平行。脂肪酸甲酯混合標(biāo)準(zhǔn)品(47885-U)購(gòu)于Sigma-Aldrich公司(美國(guó))。
室溫下,用膠頭滴管吸取搖勻后的植物油樣本約2 mL于透明平底玻璃圓管中,在25 ℃控溫裝置內(nèi)放置5~10 min;采用傅里葉變換近紅外光譜儀(QuasIRTM1000,Galaxy Scientific,美國(guó))進(jìn)行近紅外光譜掃描,光譜掃描范圍為10 000 ~4 000 cm-1;光譜分辨率為8 cm-1;掃描次數(shù)為32次。每個(gè)樣本重復(fù)掃描3次,取平均值作為樣本光譜。
采用主成分分析(PCA)和偏最小二乘判別分析(PLS-DA)對(duì)氣相色譜和近紅外光譜數(shù)據(jù)進(jìn)行探索性分析和建模;算法實(shí)現(xiàn)軟件為Matlab(R2014a,美國(guó)Mathworks公司);使用SPSS20.0程序(美國(guó)SPSS公司)中單因素方差分析法(one-way ANOVA)中的鄧肯多重檢驗(yàn)法對(duì)不同植物源食用油的脂肪酸組成與差異進(jìn)行統(tǒng)計(jì)學(xué)比較分析。置信水平設(shè)為95%(P<0.05);采用殘差統(tǒng)計(jì)剔除異常值,置信區(qū)間設(shè)為95%;為避免過(guò)擬合,在校正模型中使用“venetian blinds”法進(jìn)行交互驗(yàn)證(CV)[19],數(shù)據(jù)級(jí)隨機(jī)劃分8次,保留樣本比率為13%;采用PLS toolbox自帶的Kennard-Stone算法對(duì)樣品進(jìn)行分集處理,75%的樣品作為校正集,建立定性判別模型,25%的樣品作為獨(dú)立驗(yàn)證集對(duì)建立的定性模型進(jìn)行檢驗(yàn);采用平滑、導(dǎo)數(shù)、標(biāo)準(zhǔn)正態(tài)變換等方法進(jìn)行光譜預(yù)處理;在數(shù)據(jù)級(jí)上對(duì)氣相色譜(脂肪酸含量)和近紅外光譜(吸光度)數(shù)據(jù)進(jìn)行融合,多源數(shù)據(jù)分別進(jìn)行歸一化處理,連接構(gòu)建融合數(shù)據(jù),繼而進(jìn)行后續(xù)數(shù)據(jù)融合模型的建立;對(duì)于定性分析模型,靈敏度(Sensitivity)、特異度(Specificity)越接近于1,分類誤差(Classification error)越接近于0,定性判別效果越好[20]。
(1)
(2)
式中,TP為真陽(yáng)性的樣本個(gè)數(shù);TN為真陰性的樣本個(gè)數(shù);FP為假陽(yáng)性的樣本個(gè)數(shù);FN為假陰性的樣本個(gè)數(shù)。
如表1所示,棕櫚酸(C16∶0)、硬脂酸(C18∶0)和山崳酸(C22∶0)含量在4種植物油之間具有顯著性差異(P<0.05);玉米油和花生油中豆蔻酸(C14∶0)和反式油酸(C18∶1t)含量與其余兩種植物油具有顯著性差異,其中花生油中C18∶1t含量顯著高于大豆油(P<0.05);油酸(C18∶1)和亞油酸(C18∶2)在4種植物油中的含量均大于21%,其中花生油中C18∶1的含量顯著高,C18∶2的含量顯著低(P<0.05);玉米油和大豆油中反式亞油酸(C18∶2t)、反式亞麻酸(C18∶3t)、亞麻酸(C18∶3)和反式脂肪酸(TFA)含量顯著高于其他兩種植物油,其中大豆油中C18∶3含量顯著高于玉米油,TFA含量顯著低于玉米油(P<0.05);C20∶0、花生一烯酸(C20∶1)、芥酸(C22∶1)和木焦油酸(C24∶0)含量在花生油中顯著高,C20∶0和C20∶1含量在葵花籽油中顯著低,C24∶0含量在玉米油和大豆油中顯著低(P<0.05);花生油中飽和脂肪酸(SFA)含量顯著高,葵花籽油中SFA含量顯著低。上述分析表明,不同植物油間脂肪酸組成差異較大,該差異性數(shù)據(jù)具有進(jìn)一步區(qū)分其植物源的潛力。
表1 不同植物油脂肪酸組成差異性統(tǒng)計(jì)分析Table 1 Statistical analysis on the difference of fatty acid composition of vegetable oils (%)
圖1 基于脂肪酸組成的不同植物油Biplot圖Fig.1 Biplot of vegetable oils based on the fatty acid
基于4種植物油的氣相色譜數(shù)據(jù)進(jìn)行主成分分析,得到不同植物源食用油的Biplot圖如圖1所示,前兩個(gè)主成分分別占總變異量的60.28%和12.09%。花生油樣本點(diǎn)均分布在第一主成分的正半軸,其余3種植物油分布在第一主成分的負(fù)半軸,且玉米油樣本均位于第三主成分的負(fù)半軸;C22∶0、C20∶0、C24∶0和C18∶1t對(duì)鑒別花生油的貢獻(xiàn)較大,該結(jié)論與上述脂肪酸組成差異性結(jié)果一致,花生油中C22∶0、C20∶0、C24∶0和C18∶1t含量相比其余3種植物油差異顯著(P<0.05);C16∶0和C18∶2t對(duì)玉米油的鑒別貢獻(xiàn)較大,玉米油中C16∶0和C18∶2t含量顯著高(P<0.05);C14∶0和C18∶2分別與葵花籽油和玉米油樣本鄰近,且靠近大豆油樣本,C14∶0在葵花籽油和大豆油中含量無(wú)顯著差異,并且顯著高于其余兩種植物油(P<0.05);大豆油中C18∶2含量顯著低于玉米油(P<0.05),這導(dǎo)致C18∶2更靠近大豆油;C18∶0、C18∶3和C18∶3t對(duì)于大豆油的鑒別貢獻(xiàn)較大,這一結(jié)論與上述脂肪酸含量的顯著性分析結(jié)果一致(表1)。以上主成分分析表明,氣相色譜數(shù)據(jù)具備區(qū)分食用油植物源的能力,區(qū)分效果良好,脂肪酸的組成差異對(duì)主成分區(qū)分的貢獻(xiàn)較大。
圖2 不同植物油近紅外光譜的差異Fig.2 Differences of near infrared spectra for vegetable oils
對(duì)4種植物油的近紅外光譜數(shù)據(jù)進(jìn)行主成分分析,得到主成分得分圖(圖3A)以及PC1和PC2的載荷圖(圖3B)。第一和第二主成分占總變異量的90.02%,與圖2結(jié)論相似,花生油樣本位于第一主成分正半軸,與其余植物油樣本距離較遠(yuǎn),區(qū)分明顯,這與上述光譜差異分析結(jié)果一致;葵花籽油、大豆油和玉米油樣本相互區(qū)分明顯,但樣本之間的距離較近;葵花籽油樣本均位于第二主成分的正半軸;大部分的玉米油和大豆油樣本位于第二主成分的負(fù)半軸。由主成分得分圖可知,光譜波長(zhǎng)變量在第一主成分的得分普遍偏高,這可能與花生油的近紅外光譜與其余3種植物油在吸收強(qiáng)度上差異較大有關(guān),而第一主成分又將花生油與其余3種植物油明顯區(qū)分;PC2得分圖中,光譜的差異主要由C—H鍵的一級(jí)倍頻振動(dòng)(6 029 cm-1)、二級(jí)倍頻振動(dòng)(8 681 cm-1)和合頻振動(dòng)(8 043 cm-1)導(dǎo)致。以上主成分分析結(jié)果表明,近紅外光譜技術(shù)具有區(qū)分食用油植物源的潛力,其中光譜的吸收強(qiáng)度差異以及對(duì)C—H鍵振動(dòng)的表征對(duì)定性判別的貢獻(xiàn)較大。
圖3 基于近紅外光譜的不同植物油主成分分析Fig.3 PCA of vegetable oils based on near infrared spectraA.score plots of PCA,B.loading of PC1 and PC2
進(jìn)一步對(duì)氣相色譜和近紅外光譜數(shù)據(jù)進(jìn)行PLS-DA判別分析,結(jié)果如表2所示,氣相色譜和近紅外光譜均可對(duì)食用油植物源進(jìn)行判別分析,模型交互驗(yàn)證集的靈敏度和特異度均不低于0.929,分類誤差不大于0.061;花生油PLS-DA判別分析的靈敏度和特異度均為1.000,分類誤差為0.000,這一結(jié)果與主成分分析中花生油的區(qū)分良好有關(guān);近紅外光譜對(duì)其余3種植物油的PLS-DA判別分析結(jié)果較氣相色譜差。與現(xiàn)有文獻(xiàn)中基于近紅外光譜判別分析食用油植物源100%正確判別率的結(jié)果相比,該結(jié)論的偏差可能是樣本范圍擴(kuò)大導(dǎo)致:植物油的收集包含了不同原料品種、產(chǎn)地、生產(chǎn)工藝和存儲(chǔ)時(shí)間的樣本。采用數(shù)據(jù)級(jí)數(shù)據(jù)融合方法,融合氣相色譜和近紅外光譜數(shù)據(jù)進(jìn)行建模,結(jié)果表明,食用油植物源判別分析的靈敏度和特異度均為1.000,分類誤差為0.000;說(shuō)明數(shù)據(jù)融合的方法具有提高模型精度的能力,并且數(shù)據(jù)融合模型對(duì)于復(fù)雜來(lái)源樣本的包容性更好。
表2 食用油植物源PLS-DA判別分析結(jié)果Table 2 PLS-DA discriminant analysis results of vegetable oils type
進(jìn)一步對(duì)PLS-DA判別分析模型的交互驗(yàn)證平均分類誤差進(jìn)行統(tǒng)計(jì)[22],基于氣相色譜數(shù)據(jù)、近紅外光譜和數(shù)據(jù)融合的交互驗(yàn)證平均分類誤差對(duì)比分析如圖4所示。隨著建模主成分?jǐn)?shù)的增加,交互驗(yàn)證平均分類誤差下降,并在8~20主成分處趨于平穩(wěn)。單一的氣相色譜法和近紅外光譜法在判別分析中均表現(xiàn)良好,交互驗(yàn)證平均分類誤差在0.1以下。近紅外光譜在主成分?jǐn)?shù)小于8時(shí),判別分析效果優(yōu)于氣相色譜,數(shù)據(jù)融合的分類效果介于兩者之間;主成分?jǐn)?shù)大于8時(shí),氣相色譜模型的交互驗(yàn)證平均分類誤差最低,數(shù)據(jù)融合方法的交互驗(yàn)證平均分類誤差介于兩種單一方法模型之間。
圖4 PLS-DA判別模型的交互驗(yàn)證平均分類誤差Fig.4 Average CV classification error in the PLS-DA models
本研究采用氣相色譜技術(shù)和近紅外光譜技術(shù)結(jié)合化學(xué)計(jì)量學(xué)方法對(duì)食用油的植物源進(jìn)行判別分析,探究了數(shù)據(jù)級(jí)數(shù)據(jù)融合的可行性,構(gòu)建了基于色譜和光譜數(shù)據(jù)融合區(qū)分食用油植物源的方法與模型。氣相色譜、近紅外光譜和兩者的數(shù)據(jù)融合均可對(duì)食用油植物源進(jìn)行分類,數(shù)據(jù)融合模型最優(yōu),靈敏度和特異度均為1.000,分類誤差為0.000,提高了模型的檢測(cè)精度;交互驗(yàn)證平均分類誤差顯示數(shù)據(jù)融合的模型效果介于兩種單一方法模型之間,模型的魯棒性得到了提升。本研究為食用油植物源的分類提供了新的解決思路。