王 哲,李晨曦*,錢(qián) 蕊,劉 蓉,陳文亮,徐可欣
1. 天津大學(xué)精密測(cè)試技術(shù)及儀器國(guó)家重點(diǎn)實(shí)驗(yàn)室,天津 3000722. 天津大學(xué)精密儀器與光電子工程學(xué)院,天津 3000723. 中國(guó)汽車(chē)技術(shù)研究中心有限公司,天津 300300
隨著社會(huì)經(jīng)濟(jì)發(fā)展,食品質(zhì)量與安全越來(lái)越受到重視。植物油是每日膳食攝入的必需成分,其質(zhì)量不僅關(guān)系到人民健康,也是食品質(zhì)量與安全的重要監(jiān)管對(duì)象。由于產(chǎn)量不同和營(yíng)養(yǎng)價(jià)值不同,不同種類植物油的價(jià)格差異較大。因此,植物油種類鑒別方法具有重要的研究意義及應(yīng)用價(jià)值[1-2]。
常用的食用油鑒別和摻假檢測(cè)的方法包括皂化法[3]、電導(dǎo)率法[4]、顯色法[5]等理化方法,以及氣相色譜法[6]、液相色譜法[7]等儀器分析方法,這些方法均需要復(fù)雜的處理過(guò)程以及專業(yè)人員操作。近紅外光譜方法具有無(wú)損、快速的優(yōu)勢(shì),廣泛應(yīng)用于成分檢測(cè)及過(guò)程控制領(lǐng)域。隨著光譜儀器向著小型化、智能化方向發(fā)展,光譜建模分析算法越來(lái)越成熟,近紅外光譜在植物油種類鑒別方面的應(yīng)用也越來(lái)越廣泛。Yang[8]采集了不同植物油吸收光譜與拉曼光譜,建立植物油快速分類模型,利用吸收光譜實(shí)現(xiàn)了較高的識(shí)別率。劉翠玲[9]結(jié)合近紅外光譜技術(shù)和聚類分析方法,實(shí)現(xiàn)植物油種類的快速鑒別。馬嘯提出了一種基于樣品衰減全反射紅外光譜及KL-BP(karhunen loeve transform-back propagation)模型的分類方法,準(zhǔn)確率達(dá)到90.9%。代秀迎[10]等提出了基于主成分分析的簇類獨(dú)立軟模式法(soft independent modeling class analog,SIMCA)分類模型,對(duì)菜籽油、花生油和芝麻油的識(shí)別率在90%以上。
食用油成分復(fù)雜,在近紅外波段譜峰重疊嚴(yán)重,分析模型準(zhǔn)確度受到一定限制。對(duì)樣品施加特定的微擾(濃度、溫度等),誘導(dǎo)樣品光譜信號(hào)產(chǎn)生動(dòng)態(tài)變化,利用二維相關(guān)分析[11-13],可分辨出吸收光譜中由于譜峰重疊而不易分辨的微小吸收特征。崔路[14]比較了6種植物油的二維相關(guān)譜中自相關(guān)峰和交叉峰的位置、數(shù)目和強(qiáng)度,建立了植物油分類鑒別模型。
工作基于二維相關(guān)譜的植物油鑒別方法。以濃度為擾動(dòng)因素,測(cè)量不同濃度擾動(dòng)下植物油動(dòng)態(tài)光譜,進(jìn)行二維相關(guān)分析。利用主成分分析(principle component analysis,PCA)壓縮自相關(guān)譜,計(jì)算其歐式距離,在擇近原則基礎(chǔ)上實(shí)現(xiàn)植物油鑒別。結(jié)果表明,本方法可實(shí)現(xiàn)六種植物油的準(zhǔn)確分類,為植物油鑒別提供了參考。
采用正己烷濃度作為動(dòng)態(tài)光譜測(cè)量擾動(dòng)因素,將正己烷與植物油樣品以不同體積比混合,當(dāng)正己烷濃度t在區(qū)間[tmin,tmax]內(nèi)變化時(shí),測(cè)量隨變量t的擾動(dòng)而變化的光譜y(v,t),定義受到擾動(dòng)誘發(fā)的動(dòng)態(tài)光譜為
(1)
(2)
同步相關(guān)強(qiáng)度Φ(ν1,ν2)是頻率ν1和ν2處動(dòng)態(tài)光譜的矢量積
(3)
光譜儀(Frontier,Perkin Elmer,USA)的測(cè)量范圍3 800~10 000 cm-1,分辨率8 cm-1,每個(gè)樣品掃描6次取平均。植物油的近紅外吸收多為合頻與倍頻吸收,吸收峰一般較寬,8 cm-1的分辨率能滿足需要。實(shí)驗(yàn)樣品選擇6種消費(fèi)量較大植物油(菜籽油,大豆油,橄欖油,花生油,葵花籽油與玉米油),每種包含兩個(gè)不同品牌的產(chǎn)品。正己烷與植物油樣品按照體積分?jǐn)?shù)比例20%,40%,60%,80%,100%混合,測(cè)量得到動(dòng)態(tài)光譜,并進(jìn)行二維相關(guān)分析。
選擇濃度做外擾,是為了使整個(gè)檢測(cè)過(guò)程快捷方便。改變待測(cè)樣品的濃度只需要調(diào)整溶劑(本工作選擇正己烷)與待測(cè)樣品的體積比,而改變溫度則需要開(kāi)發(fā)配合光譜儀使用的溫控系統(tǒng),成本高,操作復(fù)雜。
選擇正己烷做擾動(dòng)溶劑,是因?yàn)橥闊N結(jié)構(gòu)的正己烷和以脂肪酸和脂肪酸酯為主的植物油之間不發(fā)生化學(xué)反應(yīng),兩者可以物理互溶,因此正己烷也是植物油提取工藝中常用的低沸點(diǎn)蒸餾溶劑。此外,正己烷的主要吸收峰在中紅外波段,在近紅外波段幾乎沒(méi)有吸收,因此不會(huì)影響植物油的近紅外光譜,不存在溶劑跟樣品吸收峰重疊的問(wèn)題。
光譜預(yù)處理主要目的是消除基線漂移,進(jìn)一步提高光譜信噪比,從而保證二維相關(guān)分析與模型預(yù)測(cè)的準(zhǔn)確度。根據(jù)樣品光譜特征,采用一階15點(diǎn)微分方法對(duì)測(cè)量光譜進(jìn)行基線校正,利用S-G三次多項(xiàng)式9點(diǎn)平滑濾波降低噪聲。測(cè)量了六種植物油吸收光譜,如圖1所示。根據(jù)方差最大原則,選擇不同樣品吸收光譜方差最大波段,即6 001~6 063 cm-1作為建模分析波段。
圖1 各樣品的近紅外光譜Fig.1 The infrared spectra of all samples
為了避免數(shù)據(jù)冗余造成的非線性擬合,提高分類準(zhǔn)確率和算法效率,對(duì)自相關(guān)譜進(jìn)行主成分分析,將主成分分量作為分類模型參數(shù)。以主成分之間歐式距離作為樣本間相似度的度量,為植物油種類鑒別提供數(shù)值依據(jù)。
比較6種常見(jiàn)植物油在6 001~6 063 cm-1波段內(nèi)的二維同步譜,結(jié)果如圖2所示。根據(jù)二維相關(guān)譜分析結(jié)果,不同種類植物油的同步譜形狀差異較大,并且特征峰數(shù)量比直接吸收譜多,分辨率更高。但二維相關(guān)譜數(shù)據(jù)量大,若將他們都作為分類參數(shù),可能會(huì)影響模型的準(zhǔn)確性,降低運(yùn)算效率。
分別比較不同種類植物油樣品自相關(guān)譜,如圖3所示。根據(jù)自相關(guān)譜特征可知,同種植物油自相關(guān)譜的變化趨勢(shì),出峰數(shù)量,出峰位置比較相似,不同種類植物油的自相關(guān)譜在出峰位置、數(shù)量以及強(qiáng)度上差別明顯。
對(duì)植物油樣品的自相關(guān)譜進(jìn)行主成分分析,前8個(gè)主成分貢獻(xiàn)率達(dá)到95%以上。因此,選取前8個(gè)主成分來(lái)代表各個(gè)樣品的同步譜,計(jì)算并比較不同種類植物油自相關(guān)譜主成分之間歐式距離,從而實(shí)現(xiàn)不同種類植物油分類。以6個(gè)不同種類植物油樣品為參考樣品,分別計(jì)算參考樣本與其他測(cè)試樣品之間的歐式距離,結(jié)果如表1所示,表中對(duì)角線加粗位置是同一種類植物油的歐氏距離。
圖2 六種常見(jiàn)植物油的同步譜(a): 菜籽油; (b): 大豆油; (c): 橄欖油; (d): 花生油; (e): 葵花油; (f): 玉米油Fig.2 2D correlation synchronization spectra of 6 kinds of common oils(a): Rapeseed oil; (b): Soybean oil; (c): Olive oil; (d): Peanut oil; (e): Sunflower oil; (f): Corn oil
圖3 六種常見(jiàn)植物油的自相關(guān)譜(a): 菜籽油; (b): 大豆油; (c): 橄欖油; (d): 花生油; (e): 葵花油; (f): 玉米油Fig.3 Autocorrelation spectra of 6 kinds of common oils(a): Rapeseed oil; (b): Soybean oil; (c): Olive oil; (d): Peanut oil; (e): Sunflower oil; (f): Corn oil
表1 歐氏距離及分類結(jié)果Table 1 The Euclidean Distance between the reference and test sample collections and classification results
根據(jù)實(shí)驗(yàn)結(jié)果,同種植物油的自相關(guān)譜主成分歐氏距離最小,不同種類植物油距離較大。以菜籽油為例,不同品牌菜籽油之間歐式距離為1.944,而與其他種類植物油之間距離普遍大于3。這也表明本研究中提出的植物油的二維相關(guān)光譜的量化方法,可以有效提取不同種類植物油的特征信息。同時(shí),模型計(jì)算中參考樣品的選擇在一定程度上也會(huì)影響分類結(jié)果,如玉米油2同葵花1,以及玉米油1的距離十分相近。差別較小的原因是,葵花油與玉米油的脂肪酸構(gòu)成相近。兩者的不飽和脂肪酸含量都在85%左右,而且其中亞油酸的含量都是60%左右。雖然玉米油和葵花油的組分構(gòu)成差別較小,實(shí)驗(yàn)表明本文方法仍然能夠成功鑒別。
研究中雖然可以區(qū)分,但是考慮到實(shí)際應(yīng)用,還需要進(jìn)行進(jìn)一步改進(jìn)。在實(shí)際應(yīng)用中,可通過(guò)擴(kuò)大參考集中的樣品數(shù),采用交互驗(yàn)證等方法來(lái)優(yōu)選參考樣品集,從而提高模型分類準(zhǔn)確性。
研究了基于二維相關(guān)近紅外光譜的植物油分類鑒別方法,利用二維相關(guān)譜中自相關(guān)譜主成分和歐氏距離判別相結(jié)合,提高了分類準(zhǔn)確性和算法效率。以正己烷為擾動(dòng)因素,測(cè)量并計(jì)算得到植物油二維相關(guān)近紅外光譜,對(duì)自相關(guān)譜進(jìn)行主成分分析,實(shí)現(xiàn)數(shù)據(jù)降維與光譜特征提取; 計(jì)算其中8個(gè)主成分歐氏距離,基于擇近原則實(shí)現(xiàn)不同種類植物油鑒別。將二維相關(guān)近紅外光譜與其特征分析相結(jié)合,提高了植物油分類準(zhǔn)確度,基于自相關(guān)譜主成分歐式距離的分類方法也為實(shí)際應(yīng)用以及自動(dòng)化處理提供了有效手段。