張海洋,廖彩淇,楊仁杰,鮑秀君,王威,靳皓,張偉玉
眾所周知,牛奶由于能提供人體生長發(fā)育以及維持人體健康水平所必需的營養(yǎng)成份,如蛋白質(zhì)、碳水化合物、脂肪等,被稱為“白色血液”,深受廣大消費(fèi)者的喜愛。
隨著牛奶供給量不斷增加,一些奶制品銷售商為了使“不合格牛奶”轉(zhuǎn)變?yōu)椤昂细衽D獭?,往往在牛奶中添加一些不屬于牛奶組成的“外來物質(zhì)”,以獲取最大利潤。因此,發(fā)展一種便捷、精準(zhǔn)的檢測方法對(duì)于控制乳制品的質(zhì)量具有重要的意義[1]。
近、中紅外光譜技術(shù),由于其便捷、無需復(fù)雜樣品預(yù)處理和能實(shí)現(xiàn)在線檢測,已被廣泛應(yīng)用于乳制品的檢測中[2-6]。Lu等在研究摻雜三聚氰胺奶粉近紅外光譜特性的基礎(chǔ)上,基于最小二乘支持向量機(jī)實(shí)現(xiàn)摻雜奶粉的判別[2]。Lisa等基于中紅外光譜建立了定量分析摻雜三聚氰胺奶粉的偏最小二乘模型,其相關(guān)系數(shù)高于0.99[3]。李亮等將近紅外光譜與Fisher判別法相結(jié)合實(shí)現(xiàn)摻假牛奶的定性分析,對(duì)未知樣品的識(shí)別正確率為94.4%[4]。金垚等將近紅外反射光譜和主成分分析結(jié)合起來,對(duì)不同品牌牛奶及摻假牛奶進(jìn)行正確識(shí)別[5]。楊仁杰等利用1 562 cm-1與1 464 cm-1吸收峰面積之比實(shí)現(xiàn)了牛奶中摻入尿素的定量分析[6],同時(shí)建立了基于二維相關(guān)近紅外、中紅外譜摻雜牛奶的判別模型[7-10],指出不同品牌牛奶對(duì)模型的預(yù)測能力有很大影響。目前,國內(nèi)外文獻(xiàn)基本都是采用單一的光譜技術(shù)(近紅外光譜或中紅外光譜)來定性定量分析摻雜牛奶,未見將二者融合用于摻雜牛奶分析的相關(guān)報(bào)道。
近紅外光譜表征的是分子含氫基團(tuán)(C—H、N—H、O—H等)倍頻、合頻吸收,而中紅外光譜表征的是分子基頻吸收,二者都提供分子結(jié)構(gòu)和組成狀態(tài)(如蛋白質(zhì)、氨基酸、淀粉和脂肪等)等信息[11-14]。本文提出一種基于近、中紅外光譜數(shù)據(jù)融合摻假牛奶的判定方法,以摻雜三聚氰胺牛奶為研究對(duì)象,建立了摻雜牛奶的偏最小二乘判別模型,并與單一的近紅外、中紅外光譜判別模型的預(yù)測結(jié)果進(jìn)行對(duì)比。
試驗(yàn)采用美國PE公司的傅里葉變換近、中紅外光譜儀。在近紅外波段4 000~10 000 cm-1采集所有樣品的透射光譜;在中紅外波段700~4 000 cm-1采集所有樣品的衰減全反射光譜。光譜分辨率為4 cm-1,每個(gè)樣品掃描16次求平均。
從某超市購置伊利和蒙牛兩個(gè)品牌純牛奶,分別準(zhǔn)備80個(gè)伊利和蒙牛純牛奶樣品,準(zhǔn)確稱取不同質(zhì)量的三聚氰胺粉末添加到純牛奶中,配置濃度范圍為0.01~3.00 g/L的摻雜三聚氰胺伊利和蒙牛牛奶各40個(gè)。
采用課題組編寫的偏最小二乘算法Matlab代碼,來建立摻雜牛奶的判別模型。
采集了兩個(gè)品牌牛奶在700~4 000 cm-1的中紅外衰減全反射光譜和4 000~10 000 cm-1的近紅外透射光譜。研究發(fā)現(xiàn),在700~900、1 800~4 000、4 000~4 200、4 800~10 000 cm-1區(qū)間不能提供有用的光譜信息,因此,在近紅外波段選擇4 200~4 800 cm-1、中紅外波段選擇900~1 800 cm-1波數(shù)范圍內(nèi)光譜進(jìn)行分析。圖1a和1b分別給出了伊利和蒙牛兩種純牛奶在4 200~4 800 cm-1和900~1 800 cm-1波段的近、中紅外光譜。由于牛奶主要組分是相同的,所以兩個(gè)品牌牛奶在特征峰位置和光譜輪廓上幾乎都是相同的,僅在吸收強(qiáng)度上存在差異。從圖1b上可以看出,純牛奶在 1 744、1 648、1 548、1 248、1 076、1 044 cm-1處存在較強(qiáng)的特征吸收峰,其中1 744 cm-1和1 248 cm-1吸收峰主要來自牛奶中脂肪的特征吸收;1 648 cm-1和1 548 cm-1吸收峰主要來自牛奶中蛋白質(zhì)的特征吸收;1 076 cm-1和1 044 cm-1吸收峰主要來自牛奶中乳糖的特征吸收[1]。
圖 1 兩品牌純牛奶的近紅外光譜(a)和中紅外光譜(b)
圖2 a和2b分別是摻雜0.02 g/L三聚氰胺兩個(gè)品牌牛奶的近、中紅外光譜。與純牛奶的近、中紅外光譜(圖1)相比,非常相似,無法直接判定牛奶中是否摻雜三聚氰胺。為實(shí)現(xiàn)摻雜牛奶和純牛奶的有效判別,同時(shí)減小不同品牌牛奶對(duì)模型預(yù)測性能的影響,本文提出并建立了基于近、中紅外光譜數(shù)據(jù)融合摻雜牛奶的偏最小二乘判別方法。
圖 2 摻雜三聚氰胺牛奶的近紅外光譜(a)和中紅外光譜(b)
首先,分別對(duì)80個(gè)純牛奶和80個(gè)摻雜三聚氰胺的伊利或蒙牛樣品進(jìn)行分析,每一個(gè)品牌的近紅外光譜矩陣A(80×76)和中紅外光譜矩陣B(80×226)進(jìn)行融合,得到融合近、中紅外光譜矩陣U(80×302)。在此基礎(chǔ)上,建立基于近、中紅外光譜融合單一品牌摻雜牛奶的判別模型。采用馬氏距離法對(duì)80個(gè)樣品進(jìn)行異常樣品診斷,未發(fā)現(xiàn)異常樣品存在。根據(jù)K-S(Kennard-Stone)法,從總樣品中選取2/3的樣品作為校正集(純牛奶和摻雜三聚氰胺牛奶各27個(gè)),余下1/3的樣品作為預(yù)測集(純牛奶和摻雜三聚氰胺牛奶各13個(gè))。在判別模型中,純牛奶用類別變量“0”表示,摻雜三聚氰胺牛奶用類別變量“1”表示,當(dāng)某一樣品預(yù)測值大于0.5時(shí),該樣品被歸為摻假類,當(dāng)某一樣品預(yù)測值小于0.5時(shí),該樣品被歸為未摻假(純牛奶)類。
對(duì)于PLS-DA模型,主成分?jǐn)?shù)的選擇至關(guān)重要。主成分?jǐn)?shù)太多,一些無用的信息會(huì)進(jìn)入模型;主成分?jǐn)?shù)太少,一些有用的信息可能會(huì)丟失,所以需要選擇合適的主成分?jǐn)?shù)來進(jìn)行建模。本文采用交叉驗(yàn)證均方根誤差(RMSECV)來選擇模型的最佳主成分?jǐn)?shù)。圖3給出了單一品牌伊利、蒙牛牛奶判別模型RMSECV隨主成分?jǐn)?shù)變化的散點(diǎn)圖。從圖3可以看到,對(duì)于蒙牛牛奶模型,當(dāng)主成分?jǐn)?shù)為6的時(shí)候,其RMSECV最?。粚?duì)于伊利牛奶模型,當(dāng)主成分大于6的時(shí),其RMSECV隨主成分?jǐn)?shù)的增加變化不大。因此,選擇6個(gè)主成分分別建立單一品牌伊利、蒙牛牛奶的判別模型。
圖 3PLS-DA模型RMSECV隨主成分的變化曲線
圖4 和圖5分別是基于近、中紅外光譜融合所建的伊利和蒙牛牛奶判別模型對(duì)校正集和預(yù)測集樣品的預(yù)測結(jié)果。在圖4、圖5中,樣品No.1~No.27為校正集純牛奶樣品;No.28~No.54為校正集摻雜三聚氰胺牛奶樣品;樣品No.55~No.67為預(yù)測集純牛奶樣品;No.68~No.80為預(yù)測集摻雜三聚氰胺牛奶樣品。對(duì)于伊利牛奶,在校正集54個(gè)樣品中,各有1個(gè)純牛奶和摻雜三聚氰胺牛奶被誤判,其判別正確率為96.3%,在預(yù)測集26個(gè)樣品中,僅有1個(gè)摻三聚氰胺牛奶被誤判為純牛奶,其判別正確率為96.2%。對(duì)于蒙牛牛奶,在校正集和預(yù)測集中各有1個(gè)摻雜三聚氰胺牛奶被誤判,所建模型對(duì)校正集和預(yù)測集樣品的判別正確率分別為98.1%和96.2%。
圖 4 伊利牛奶判別模型對(duì)校正集和預(yù)測集樣品的預(yù)測結(jié)果
圖 5 蒙牛牛奶判別模型對(duì)校正集和預(yù)測集樣品的預(yù)測結(jié)果
為了研究不同品牌牛奶對(duì)判別模型預(yù)測性能的影響,基于融合近、中紅外光譜矩陣Q(160×302)建立了兩種品牌摻雜牛奶的判別模型。根據(jù)RMSECV選擇7個(gè)主成分,對(duì)108個(gè)樣品(兩個(gè)品牌:純牛奶和摻雜牛奶各27個(gè))建立兩種品牌摻雜牛奶的判別模型。所建模型對(duì)校正集內(nèi)部樣品的預(yù)測結(jié)果如圖6所示。
圖 6 兩個(gè)品牌牛奶判別模型對(duì)校正集樣品預(yù)測結(jié)果
樣品No.1~No.27為伊利純牛奶樣品;No.28~No.54伊利摻雜牛奶樣品;No.55~No.81為蒙牛純牛奶樣品;No.82~No.108為蒙牛摻雜牛奶樣品。從圖6可以看出,在108個(gè)樣品中,共有7個(gè)樣品被誤判,其中包括:1個(gè)伊利純牛奶,5個(gè)伊利摻雜牛奶,1個(gè)蒙牛摻雜牛奶,模型對(duì)兩品牌牛奶校正集樣品內(nèi)部預(yù)測判別正確率為93.5%。
圖7為所建模型對(duì)預(yù)測集未知樣品的預(yù)測結(jié)果,樣品No.1~No.13為伊利純牛奶樣品;No.14~No.26伊利摻雜牛奶樣品;No.27~No.39為蒙牛純牛奶樣品;No.40~No.52為蒙牛摻雜牛奶樣品。從圖7可以看出,在52個(gè)樣品中,僅有3個(gè)伊利摻雜牛奶被誤判,模型對(duì)兩品牌牛奶預(yù)測集樣品的判別正確率為94.2%。
圖 7 兩個(gè)品牌牛奶判別模型對(duì)預(yù)測集樣品預(yù)測結(jié)果
在上述融合近、中紅外光譜數(shù)據(jù)建模的基礎(chǔ)上,分別基于近紅外光譜矩陣A(80×76)和中紅外光譜矩陣B(80×226)建立了伊利、蒙牛牛奶的判別模型。為了比較模型性能,表1和表2同時(shí)給出了單一近紅外光譜、中紅外光譜以及融合近、中紅外光譜所建模型的性能指標(biāo)。從表1中可以看出,相對(duì)于單一近紅外光譜和中紅外光譜,無論是對(duì)校正集樣品內(nèi)部預(yù)測,還是對(duì)預(yù)測集外部未知樣品的預(yù)測,融合近、中紅外光譜數(shù)據(jù)所建立的模型都對(duì)伊利牛奶的判定提供更好的結(jié)果。從表2可以看出,對(duì)于蒙牛牛奶的分析,3個(gè)模型提供了相同的判別結(jié)果。
表1 3個(gè)模型對(duì)伊利牛奶判別結(jié)果比較
表2 3個(gè)模型對(duì)蒙牛牛奶判別結(jié)果比較
同時(shí),也建立了兩個(gè)品牌的近紅外光譜矩陣C(160×76)和中紅外光譜D(160×226)判別模型。同樣為了比較模型性能,表3給出了單一近紅外光譜、中紅外光譜以及融合近、中紅外光譜所建模型對(duì)兩個(gè)品牌牛奶的判別性能。從表3中可以看出,相對(duì)于單一的近紅外光譜和中紅外光譜,基于融合近、中紅外光譜所建的模型能對(duì)兩個(gè)品牌牛奶提供更好的分析結(jié)果。從上述分析可以看出,基于融合近、中紅外光譜數(shù)據(jù)建模,可以減小不同牛奶品牌對(duì)模型預(yù)測能力的影響,從而提高模型的判別正確率。
表3 3個(gè)模型對(duì)兩個(gè)品牌牛奶判別結(jié)果比較
本文發(fā)展并建立了一種基于近、中紅外光譜數(shù)據(jù)融合摻假牛奶的判定方法。該方法對(duì)伊利、蒙牛和兩個(gè)品牌牛奶未知樣品的判別正確率分別為96.2%、96.2%和94.2%,并與單一光譜技術(shù)近紅外光譜和中紅外光譜的建模結(jié)果進(jìn)行了比較。研究結(jié)果表明,對(duì)于單個(gè)品牌牛奶模型,所提方法能提供更好的判別正確率;對(duì)于兩個(gè)品牌牛奶模型,所提方法能減小不同品牌牛奶對(duì)模型預(yù)測性能的影響,提高了判別正確率。
[1]崔彩路,楊仁杰,朱文碧,等.二維相關(guān)紅外譜結(jié)合PARAFAC-MLR判別摻雜牛奶[J].天津農(nóng)學(xué)院學(xué)報(bào),2015,22(1):19-23.
[2]Lu C H,Xiang B R,Hao G,et al.Rapid detection of melamine in milk powder by near infrared spectroscopy[J].J Near Infrared Spectroscopy,2009,17(2):59-67.
[3]Lisa J M,Alona A,Chernyshova A H,et al.Melamine detection in infant formula powder using near- and mid-infrared spectroscopy[J].Journal of Agricultural and Food Chemistry,2009,57(10):3974-3980.
[4]李亮,丁武.摻有植物性填充物牛奶的近紅外光譜判別分析[J].光譜學(xué)與光譜分析,2010,30(5):1238-1242.
[5]金垚,杜斌,智秀娟.NIR技術(shù)快速鑒定牛奶品牌與摻假識(shí)別[J].食品研究與開發(fā),2016,37(3):178-181.
[6]楊仁杰,劉蓉,徐可欣.基于中紅外光譜檢測牛奶中摻雜尿素[J].光譜學(xué)與光譜分析,2011,31(9):2383-2385.
[7]Yang R J,Liu R,Dong G M,et al.Two-dimensional hetero-spectral mid-infrared and near-infrared correlation spectroscopy for discrimination adulterated milk[J].Spectrochimica Acta Part A,2016,157:50-54.
[8]Yang R J,Dong G M,Sun X S,et al.Synchronousasynchronous two-dimensional correlation spectroscopy for the discrimination of adulterated milk[J].Analytical Methods,2015,7(10):4302-4307.
[9]楊仁杰,劉蓉,楊延榮,等.二維相關(guān)近紅外譜多維主成分分析摻雜牛奶判別方法研究[J].光學(xué)精密工程,2014,22(9):2352-2358.
[10]楊仁杰,楊延榮,劉海學(xué),等.二維相關(guān)譜在食品品質(zhì)檢測中的研究進(jìn)展[J].光譜學(xué)與光譜分析,2015,35(8):2124-2129.
[11]Casale M,Oliveri P,Casolino C,et al.Characterisation of PDO olive oil Chianti Classico by non-selective(UV–visible,NIR and MIR spectroscopy)and selective(fatty acid composition)analytical techniques[J].Analytica Chimica Acta,2012,712:56-63.
[12]Bras L P,Bernardino S A,Lopes J A,et al.Multiblock PLS as an approach to compare and combine NIR and MIR spectra in calibrations of soybean[J].Chemometrics and Intelligent Laboratory Systems,2005,75(1):91–99.
[13]Casale M,Sinelli N,Oliveri P,et al.Chemometrical strategies for feature selection and data compression applied to NIR and MIR spectra of extra virgin olive oils for cultivar identification[J].Talanta,2010,80(5):1832-1837.
[14]Harrington P B,Kister J,Artaud J,et al.Automated principal component-based orthogonal signal correction applied to fused near infrared-mid-infrared spectra of French olive oils[J].Analytical Chemistry,2009,81(17):7160-7169.