吳 雙,涂 斌,鄭 曉,何東平
(1.武漢輕工大學(xué) 機(jī)械工程學(xué)院,武漢430000; 2.武漢輕工大學(xué) 食品科學(xué)與工程學(xué)院,武漢430000)
油脂安全
基于特征波長提取的激光近紅外光譜快速鑒別食用植物油種類
吳 雙1,涂 斌1,鄭 曉1,何東平2
(1.武漢輕工大學(xué) 機(jī)械工程學(xué)院,武漢430000; 2.武漢輕工大學(xué) 食品科學(xué)與工程學(xué)院,武漢430000)
提出了基于CARS、SPA和CARS-SPA特征波長提取的激光近紅外光譜技術(shù)快速鑒別食用植物油種類的方法。應(yīng)用光譜儀采集127個(gè)食用植物油樣本的光譜數(shù)據(jù),采用標(biāo)準(zhǔn)正態(tài)變量變換算法(SNV)、標(biāo)準(zhǔn)正態(tài)變量變換和去趨勢技術(shù)聯(lián)用算法(SNV-DT)對其進(jìn)行預(yù)處理,采用CARS、SPA和CARS-SPA 3種方法對經(jīng)過預(yù)處理的光譜數(shù)據(jù)進(jìn)行特征波長提取,應(yīng)用支持向量機(jī)分類方法(SVC)建立食用植物油種類定性分類校正模型,選擇網(wǎng)格搜索算法對模型參數(shù)組合(C,g)進(jìn)行尋優(yōu),確定最優(yōu)參數(shù)組合。結(jié)果表明,CARS-SVC、SPA-SVC和CARS-SPA-SVC模型預(yù)測集準(zhǔn)確率均達(dá)到96.77%,預(yù)測效果理想,其中SNV-DT-SPA-SVC模型預(yù)測效果最優(yōu),預(yù)測集準(zhǔn)確率達(dá)到100%。綜上基于特征波長提取的激光近紅外光譜分析技術(shù)能夠快速準(zhǔn)確鑒別食用植物油種類,為便攜式現(xiàn)場檢測設(shè)備開發(fā)提供了理論基礎(chǔ)。
激光近紅外光譜技術(shù);食用植物油;特征波長提??;支持向量機(jī)分類;摻偽
目前,隨著計(jì)算機(jī)技術(shù)、光譜分析技術(shù)和化學(xué)計(jì)量學(xué)快速發(fā)展,近紅外光譜分析技術(shù)(NIR)以速度快、效率高、樣品無需預(yù)處理、無損分析和易于實(shí)現(xiàn)在線分析等特點(diǎn)在醫(yī)藥、食品、煙草、農(nóng)業(yè)和石化等行業(yè)得到了廣泛的應(yīng)用[1-2]。而食用植物油是多種脂肪酸甘油三酯的混合物,其化學(xué)成分含氫基團(tuán)(C—H、O—H)振動的合頻和倍頻的吸收區(qū)與近紅外光譜區(qū)是一致的,因此近紅外適用于食用植物油的快速檢測。由于光譜數(shù)據(jù)中通常包含有噪聲等無用信息,需要采用波長篩選方法提取特征波長,提高模型預(yù)測性能。常用的光譜特征波長提取方法中后向間隔偏最小二乘法(BiPLS)和聯(lián)合間隔偏最小法(siPLS)等[3]篩選波長時(shí)間長,設(shè)置參數(shù)多;遺傳算法(GA)等[4]優(yōu)選波長耗時(shí)長,且不穩(wěn)定;無信息變量消除算法(UVE)等[5]有時(shí)優(yōu)選的變量個(gè)數(shù)較多,需要與其他方法聯(lián)用。競爭性自適應(yīng)重加權(quán)采樣(CARS)是一種最近提出的波長優(yōu)選方法,不僅能有效去除無信息變量,還可以減少共線性變量對模型的影響[6]。連續(xù)投影算法(SPA)能夠降低光譜數(shù)據(jù)間的共線性,有效地提取特征波長[7]。
本文針對食用植物油種類鑒別問題,提出了一種激光近紅外光譜結(jié)合化學(xué)計(jì)量學(xué)快速分類方法,采用支持向量機(jī)分類法(SVC),結(jié)合CARS、SPA和CARS-SPA 3種特征波長提取方法建立SVC分類模型,對食用植物油種類進(jìn)行快速準(zhǔn)確分類。
1.1 樣品及樣品集劃分
樣品來源包括在武漢各大超市購買的不同品牌、不同種類的合格食用植物油共8類。實(shí)驗(yàn)采用SPXY(sample set portioning based on joint x-y distances)算法按3∶1的比例選取校正集和預(yù)測集樣本,選擇96個(gè)樣本作為校正集,其余為預(yù)測集。其中校正集樣本用于模型建立,預(yù)測集樣本用于模型預(yù)測性能的檢驗(yàn)。樣本實(shí)際種類、編號和校正集及驗(yàn)證集樣本數(shù)量如表1所示。
表1 樣本的種類及數(shù)量
1.2 儀器及軟件
采用實(shí)驗(yàn)室研發(fā)的激光近紅外植物油品質(zhì)快速檢測儀采集光譜,儀器的主機(jī)為Axsun XL410型激光近紅外光譜儀。光譜測定范圍為1 350~1 800 nm,掃描次數(shù)32次,分辨率為3.5 cm-1,測量方式為透射,溫控范圍為20~100℃。實(shí)驗(yàn)中采用儀器自帶的軟件完成樣品圖譜采集。數(shù)顯恒溫水浴鍋,5 mm石英比色皿,移液槍5~50 μL、200~1 000 μL。分析軟件采用Unscrambler 10.1(CAMO AS,Oslo,Norway),以及MATLAB_R2012a。
1.3 光譜采集及數(shù)據(jù)預(yù)處理
光譜采集流程:首先,將裝有樣本的離心管放入電子恒溫水浴鍋加熱到40℃,恒溫靜置10 min。然后調(diào)試光譜檢測儀,使用移液槍將樣本注入5 mm的比色皿中,約2/3處,放入樣品池中加熱至40℃,恒溫穩(wěn)定30 s,采集樣本光譜數(shù)據(jù)。每個(gè)樣本裝樣3次,采集3次穩(wěn)定的圖譜后取其平均圖譜作為最終圖譜,室溫下測定。采用上述方法,采集127份樣本得到的原始圖譜如圖1所示。
圖1 原始光譜
近紅外光譜技術(shù)屬于二次分析技術(shù),其光譜包含的信息豐富,同時(shí)譜帶重疊嚴(yán)重,光譜信息專屬性差,信噪比低,這些特點(diǎn)使得必須對光譜數(shù)據(jù)進(jìn)行預(yù)處理。實(shí)驗(yàn)中近紅外光譜分別采用標(biāo)準(zhǔn)正態(tài)變量變換算法(SNV)、標(biāo)準(zhǔn)正態(tài)變量變換和去趨勢技術(shù)聯(lián)用算法(SNV-DT)進(jìn)行預(yù)處理。圖2表示默認(rèn)參數(shù)下SNV-DT預(yù)處理后的光譜圖。
圖2 經(jīng)過SNV-DT預(yù)處理的光譜
1.4 特征波長提取方法
本實(shí)驗(yàn)通過CARS、SPA以及CARS-SPA對光譜數(shù)據(jù)進(jìn)行特征波長提取。具體參照文獻(xiàn)[8-10]。
1.5 建模、參數(shù)優(yōu)化方法及模型評價(jià)指標(biāo)
本實(shí)驗(yàn)選用SVC建立食用植物油種類鑒別模型,實(shí)現(xiàn)食用植物油的快速準(zhǔn)確分類。核函數(shù)選擇RBF核,此核的參數(shù)較少,實(shí)際應(yīng)用表明RBF核具有很強(qiáng)的SVC學(xué)習(xí)能力[11]。由于選擇的SVC建模方法包含懲罰因子C和核函數(shù)參數(shù)g,不同的參數(shù)所建的模型的預(yù)測能力存在差異,人為地設(shè)置參數(shù),很難建立最優(yōu)數(shù)學(xué)模型,本實(shí)驗(yàn)選用網(wǎng)格搜索法(CV)對參數(shù)組合(C,g)進(jìn)行尋優(yōu),確定最佳參數(shù)組合[12]。以分類準(zhǔn)確率作為建立的SVC模型的評價(jià)指標(biāo)。
2.1 特征波長的提取
實(shí)驗(yàn)中采用CARS、SPA、CARS-SPA 3種方法進(jìn)行特征波長提取。實(shí)驗(yàn)中CARS方法的蒙特卡羅(MC)采樣次數(shù)設(shè)為100次,所選擇的波長變量子集采用10折PLS交叉驗(yàn)證建模,根據(jù)PLS模型的交互檢驗(yàn)均方差(RMSECV)值最小確定最優(yōu)的波長變量子集。圖3為SNV-DT預(yù)處理后的光譜數(shù)據(jù)經(jīng)CARS方法特征波長變量優(yōu)選過程。
圖3 使用CARS方法特征波長提取的過程
圖3中,圖3(a)為波長變量優(yōu)選過程中被選波長變量數(shù)量的變化曲線。圖3(b)為波長變量優(yōu)選過程中PLS模型的RMSECV變化曲線。由圖3(b)可以看出,在1~38次采樣過程中,RMSECV值逐漸減小,表明優(yōu)選過程中剔除與樣品信息無關(guān)的變量;而38次采樣以后,RMSECV值逐漸增大,表明優(yōu)選過程中開始剔除與樣品相關(guān)的有效信息。圖3(c)為波長變量優(yōu)選過程中各波長變量回歸系數(shù)的變化趨勢,“*”所對應(yīng)的位置為RMSECV值最小即38次采樣。圖4為SNV-DT預(yù)處理后的光譜數(shù)據(jù)經(jīng)CARS方法提取的特征變量,提取的變量個(gè)數(shù)為60。表2為3種方法提取的特征波長變量個(gè)數(shù)。
圖4 使用CARS方法特征波長提取的數(shù)量
提取方法波長數(shù)RWASNVSNV-DTCARS315660SPA261719CARS-SPA151820
2.2 SVC模型的建立
將全波段光譜和經(jīng)過CARS、SPA、CARS-SPA壓縮原始數(shù)據(jù)得到的少數(shù)主成分作為SVC的輸入,建立全波段和非全波段SVC模型。采用CV-SVC建模方法,所建模型的參數(shù)以及預(yù)測結(jié)果如表3所示。
從表3可以看出,SVC模型的校正集和預(yù)測集的準(zhǔn)確率分別在95.83%和96.77%之上,說明此方法能夠?qū)崿F(xiàn)食用植物油種類的快速準(zhǔn)確鑒別分類。未經(jīng)預(yù)處理的原始光譜(RWA)建立的SVC模型的懲罰因子C均達(dá)到了1 024,容易減弱模型的泛化能力,影響模型的推廣應(yīng)用,表明預(yù)處理方法是建模過程的一個(gè)重要環(huán)節(jié),需要選擇合適的方法對光譜數(shù)據(jù)進(jìn)行預(yù)處理。對于全波段模型來說,全波段SNV-SVC模型的預(yù)測能力較強(qiáng),預(yù)測集準(zhǔn)確率達(dá)到了100%,但建模變量過多,造成模型參數(shù)優(yōu)化時(shí)間過長,降低建模效率。CARS、SPA、CARS-SPA 3種方法結(jié)合SVC建立的模型預(yù)測集識別準(zhǔn)確率均高于96.77%,說明3種方法均能優(yōu)選出代表待測物品的有效信息,大大減少建模變量,僅為全波段的3.3%~13.3%,建模效率提高。對比3種特征波長提取方法可以看出,SPA-SVC 建立的模型預(yù)測能力最好,且選取的建模輸入變量較少,建模效率高;其中SNV-DT-SPA-SVC模型的綜合性能最好,建模變量數(shù)僅為19個(gè),預(yù)測集的預(yù)測準(zhǔn)確率達(dá)到100%。研究表明,特征波長提取方法不僅能夠保證模型具有較高的預(yù)測準(zhǔn)確率,而且能夠減少建模輸入變量,縮短建模時(shí)間,提高運(yùn)算效率,同時(shí)為快速食用植物油檢測儀的開發(fā)設(shè)計(jì)提供理論支持。
表3 SVC模型參數(shù)及預(yù)測結(jié)果
采用原始光譜、經(jīng)過SNV和SNV-DT預(yù)處理的光譜,結(jié)合CARS、SPA和CARS-SPA優(yōu)選特征波長,利用所選波長建立SVC分類模型,表明建立的SVC模型能夠?qū)崿F(xiàn)食用植物油種類的快速準(zhǔn)確分類。預(yù)處理方法是建模過程中需要注意的一個(gè)重要環(huán)節(jié),不同的預(yù)處理方法對SVC模型的預(yù)測效果產(chǎn)生影響。CARS-SVC、SPA-SVC和CARS-SPA-SVC模型預(yù)測集準(zhǔn)確率均達(dá)到96.77%,預(yù)測效果比較理想,其中SNV-DT-SPA-SVC模型的預(yù)測集準(zhǔn)確率達(dá)到100%,表明3種特征波長提取方法不僅能夠有效提取樣品信息,保證所建模型具有較強(qiáng)的預(yù)測能力,而且減少了變量個(gè)數(shù),縮短了建模時(shí)間,提高了建模效率。結(jié)果表明,CARS、SPA、CARS-SPA是有效的特征波長提取方法,近紅外光譜分析技術(shù)結(jié)合特征波長提取方法為食用植物油種類的鑒別提供了一種快速準(zhǔn)確有效的方法。
[1] 穆同娜, 莊勝利, 趙玉琪, 等. 近紅外光譜法快速檢測嬰兒配方奶粉中的脂肪酸含量[J]. 現(xiàn)代食品科技, 2015, 31(4):277-281.
[2] 孔翠萍, 褚小立, 杜澤學(xué), 等. 近紅外光譜方法預(yù)測生物柴油主要成分[J]. 分析化學(xué), 2010, 38(6):805-810.
[3] 吳靜珠, 石瑞杰, 陳巖, 等. 食用油油酸的近紅外特征譜區(qū)優(yōu)選[J]. 中國糧油學(xué)報(bào), 2015, 30(2):118-121.
[4] 劉燕德, 張光偉, 蔡麗君. 基于高光譜的GA和SPA算法對贛南臍橙葉綠素定量分析[J]. 光譜學(xué)與光譜分析, 2012, 32(12):3377-3380.
[5] 吳迪, 吳洪喜, 蔡景波, 等. 基于無信息變量消除法和連續(xù)投影算法的可見-近紅外光譜技術(shù)白蝦種分類方法研究[J]. 紅外與毫米波學(xué)報(bào), 2009, 28(6):423-427.
[6] 李水芳, 張欣, 李姣娟, 等. 拉曼光譜法無損檢測蜂蜜中的果糖和葡萄糖含量[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2014, 30(6):249-255.
[7] 馮雷,陳雙雙,馮斌,等. 基于光譜技術(shù)的大豆豆莢炭疽病早期鑒別方法[J]. 農(nóng)業(yè)工程學(xué)報(bào),2012,28(1):139-144.
[8] 郭文川, 劉大洋. 獼猴桃膨大果的近紅外漫反射光譜無損識別[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2014, 45(9):230-235.
[9] LI H D, LIANG Y Z, XU Q S, et al. Key wavelengths screening using competitive adaptive reweighted sampling method for multivariate calibration[J]. Anal Chim Acta, 2009, 648 (1):77-84.
[10] 肖海斌, 趙進(jìn)輝, 袁海超, 等. 同步熒光光譜結(jié)合CARS變量優(yōu)選預(yù)測豬肉中四環(huán)素殘留含量[J]. 光學(xué)精密工程, 2013, 21(10):2513-2519.
[11] 宋志強(qiáng),沈雄,鄭曉,等.應(yīng)用近紅外光譜對低碳數(shù)脂肪酸含量預(yù)測[J].光譜學(xué)與光譜分析,2013,33(8):2079-2082.
[12] 涂斌, 宋志強(qiáng), 鄭曉, 等. 基于激光近紅外的稻米油摻偽定性-定量分析[J]. 光譜學(xué)與光譜分析, 2015, 35(6):1539-1545.
Classification of edible vegetable oil based on laser near-infrared spectroscopy combined with extraction of characteristic wavelength
WU Shuang1, TU Bin1, ZHENG Xiao1, HE Dongping2
(1.School of Mechanical Engineering, Wuhan Polytechnic University, Wuhan 430000, China; 2.College of Food Science and Engineering, Wuhan Polytechnic University, Wuhan 430000, China)
To classify edible vegetable oil quickly, the method of laser near-infrared(NIR) spectroscopy combined with extration of characteristic wavelength by heavy competitive adaptive weighted sampling (CARS), successive projections algorithm(SPA) and CARS-SPA was proposed. Spectral data of 127 edible vegetable oil samples were collected by laser NIR spectrometer,and pretreated by standard normal variate transformation(SNV),standard normal variate transformation and de-trending(SNV-DT),then the characteristic wavelength was extracted using CARS, SPA and CARS-SPA, and the support vector machine classification (SVC) method was applied to establish qualitative classification correction model of edible vegetable oil. In the end, the model parameter combination (C,g) were optimized by mesh search algorithm. The results showed that the accuracy rates of prediction set of CARS-SVC, SPA-SVC and CARS-SPA-SVC models all reached 96.77% and the prediction effect was satisfying, in which the prediction effect of SNV-DT-SPA-SVC model was the best with the accuracy rate of prediction set 100%. NIR spectroscopy combined with extraction of characteristic wavelength could identify edible vegetable oil accurately and quickly, and they could provide theoretical basis for develop-ment of portable field testing equipment.
laser near-infrared spectroscopy; edible vegetable oil; characteristic wavelength extraction; support vector machine classification; adulteration
2016-06-28;
2017-01-10
國家“十一五”科技支撐計(jì)劃項(xiàng)目(2009BADB9B08);武漢市科技攻關(guān)計(jì)劃項(xiàng)目(2013010501010147);武漢工業(yè)學(xué)院食品營養(yǎng)與安全重大項(xiàng)目培育專項(xiàng)(2011Z06)
吳 雙(1989),女,碩士研究生,研究方向?yàn)槔霉庾V技術(shù)檢測食用油的成分(E-mail)410451112@qq.com。
鄭 曉,教授(E-mail)zhengxiao@whpu.edu.cn。
TS225.1;TS207.7
A
1003-7969(2017)04-0072-04