王 磊,郭中華,金 靈,鄭彩英
(寧夏大學(xué)物理電氣信息學(xué)院,寧夏銀川750021)
近年來(lái),中國(guó)經(jīng)濟(jì)迅速發(fā)展,國(guó)民的健康意識(shí)大幅提高。牛奶因其富含蛋白質(zhì)、氨基酸、礦物質(zhì)、鈣和各種維生素等營(yíng)養(yǎng)物質(zhì),成為人們?nèi)粘I钪斜夭豢缮俚囊环N食品,因此,對(duì)乳及乳制品質(zhì)量的檢測(cè)和品種鑒別成為一項(xiàng)重要的課題。目前,一些學(xué)者對(duì)乳及乳制品品的質(zhì)檢測(cè)已經(jīng)進(jìn)行了一系列深入的研究,也得到了較好的成果[1-6],但是,相對(duì)于其他食品的品種鑒別而言[7-9],對(duì)乳及乳制品品種鑒別的相關(guān)研究還較少。作為生活中必不可少的高營(yíng)養(yǎng)食品,為了滿足廣大消費(fèi)者的需求,不但要對(duì)其品質(zhì)進(jìn)行嚴(yán)格把關(guān),品種區(qū)分也非常重要,只有這樣才能在銷售過(guò)程中更具針對(duì)性。
近紅外光譜法是光譜測(cè)量技術(shù)和化學(xué)計(jì)量學(xué)的有機(jī)結(jié)合,因其具有硬件成本低、檢測(cè)速度快、測(cè)試重現(xiàn)性好和對(duì)樣品無(wú)損壞的優(yōu)點(diǎn)而被廣泛的應(yīng)用于食品工業(yè)、石油化工、農(nóng)業(yè),醫(yī)藥也等多個(gè)領(lǐng) 域[10-13]。 近 紅 外 光 譜 是 指 波 長(zhǎng) 在 780 ~2526 nm范圍內(nèi)的電磁波,波數(shù)范圍為3500~13000 cm-1,從波長(zhǎng)上可以分為短波近紅外(780~1100 nm)和長(zhǎng)波近紅外(1100~2526 nm)。其分析特點(diǎn)是利用近紅外光照射被測(cè)樣品,由于分子團(tuán)的振動(dòng),樣品會(huì)吸收一部分能量。不同分子團(tuán)的振動(dòng),吸收光的波段不同,主要信息是含H基團(tuán)倍頻和合頻的吸收[14]。
本文將采用透射法獲取四種乳制品的近紅外光譜,然后建立鑒別模型。
樣本選自寧夏回族自治區(qū)本地某品牌液態(tài)乳制品,分別為純牛奶、酸牛奶、麥香奶和枸杞紅棗奶四個(gè)品種共計(jì)240個(gè),其中每個(gè)品種挑選生產(chǎn)批次不同的60個(gè)樣本。每個(gè)品種60個(gè)樣本分別按照約3∶1的比例劃分校正集和預(yù)測(cè)集如表1所示。
表1 鑒別模型校正集/預(yù)測(cè)集樣品劃分
使用AntarisⅡ傅里葉變換近紅外光譜分析儀的漫透射附件進(jìn)行樣本光譜采集。每次打開(kāi)光譜儀均預(yù)熱30 min~1 h,實(shí)驗(yàn)室溫度保持在25℃左右。樣本使用光程1 mm的石英比色皿裝盛,并占比色皿容積4/5。儀器參數(shù)設(shè)定如下:掃描范圍為10000 ~40000 cm-1,分辨率 8 cm-1,掃描次數(shù) 32次,每個(gè)樣本平行測(cè)定3次,取平均光譜。所有樣品原始光譜如圖1所示。為了消除背景噪聲,每100分鐘取一次背景光譜。
圖1 樣品原始光譜圖
3.1.1 支持向量機(jī)人工神經(jīng)網(wǎng)絡(luò)(SVM-ANN)
支持向量機(jī)(Support Vector Machine,簡(jiǎn)稱SVM)是在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上發(fā)展起來(lái)的,Vapnik和Chemielewaski于1995年提出了完整的統(tǒng)計(jì)學(xué)理論,并在此接觸上發(fā)展了一種新的用于解決模式分類和非線性回歸問(wèn)題的學(xué)習(xí)方法——SVM[15]。SVM的關(guān)鍵在于核函數(shù)的選擇,低維空間向量集通常難于劃分,解決方法就是將低維空間映射到高維空間。而核函數(shù)正好可以解決這個(gè)問(wèn)題,所以選擇合適的核函數(shù)就可以得到高維空間的分類函數(shù)[15]。
3.1.2 小波變換(WT)
小波變換[16](Wavelet Transform,WT)是一個(gè)時(shí)間和頻率的局域變換,能夠有效地從信號(hào)中提取信息。在近紅外光譜分析中,小波變換可用于壓縮樣本光譜數(shù)據(jù)從而達(dá)到光譜數(shù)據(jù)被降維的目的。
3.1.3 校正模型的評(píng)價(jià)參數(shù)
光譜數(shù)據(jù)經(jīng)過(guò)預(yù)處理,然后使用BP-ANN、RBFANN和SVM-ANN和分別建立鑒別模型,模型的評(píng)價(jià)指標(biāo)是鑒別率(r),即鑒別正確的樣品數(shù)在預(yù)測(cè)集樣品中所占百分比。
采用光譜分析軟件OMNIC7.0將光譜轉(zhuǎn)化為.CSV格式的數(shù)據(jù),然后使用TQ7.0對(duì)光譜進(jìn)行預(yù)處理。為了尋求最佳的鑒別模型、最高的鑒別率和最快速的鑒別速率,本文共采用了WT、FD、SD、FD+WT、SD+WT、SD+SG、SNV+SG、MSC+SG、MSC+SG+FD、SD+SG+WT、SNV+SG+WT、MSC+SG+WT和MSC+SG+FD+WT共13種方法對(duì)光譜進(jìn)行了預(yù)處理。經(jīng)過(guò)反復(fù)實(shí)驗(yàn),選取硬閾值下分解尺度為6、小波基為db3函數(shù)的小波變換,經(jīng)過(guò)小波壓縮后的光譜數(shù)據(jù)點(diǎn)由原始的2179變?yōu)?8,從而達(dá)到了數(shù)據(jù)降維和提高建模速率的目的。通過(guò)三種神經(jīng)網(wǎng)絡(luò)鑒別模型得到的最佳光譜預(yù)處理方法為MSC+SG+WT,四種乳制品共240個(gè)樣品經(jīng)過(guò)MSC+SG+WT預(yù)處理后的光譜圖2所示。
圖2 經(jīng)過(guò)MSC+SG+WT預(yù)處理后的光譜圖
3.3.1 模型建立
分別以上述13種光譜預(yù)處理方法處理過(guò)的光譜數(shù)據(jù)和原始光譜數(shù)據(jù)作為BP-ANN、RBF-ANN和SVM-ANN三種神經(jīng)網(wǎng)絡(luò)的輸入變量,對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)和訓(xùn)練,最終得到最佳的鑒別模型,然后再對(duì)預(yù)測(cè)集樣品的性質(zhì)進(jìn)行鑒別。通過(guò)實(shí)驗(yàn)結(jié)果得出:當(dāng)對(duì)樣品光譜進(jìn)行MSC+SG+WT處理后,三種神經(jīng)網(wǎng)絡(luò)建立的鑒別模型鑒別率均為100%,鑒別模型圖如圖3所示,且三種網(wǎng)絡(luò)的最佳參數(shù)設(shè)置如下:
(1)BP-ANN最佳網(wǎng)絡(luò)參數(shù):隱含層節(jié)點(diǎn)數(shù)為2,輸出層節(jié)點(diǎn)數(shù)為1,最大訓(xùn)練次數(shù)為500,學(xué)習(xí)速率為0.001,目標(biāo)誤差為0.001,初始權(quán)值和閾值由程序隨機(jī)設(shè)置;
(2)RBF-ANN最佳網(wǎng)絡(luò)參數(shù):輸入層節(jié)點(diǎn)數(shù)為38,隱含層節(jié)點(diǎn)數(shù)為10,輸出層節(jié)點(diǎn)數(shù)為1,目標(biāo)誤差為0.01,擴(kuò)散常數(shù)SPREAD為180;
(3)SVM-ANN最佳網(wǎng)絡(luò)參數(shù):懲罰參數(shù)c=32、數(shù)據(jù)映射到新的特征空間后的分布參數(shù)g=4。
圖3 經(jīng)MSC+SG+WT處理后的乳制品鑒別模型圖
3.3.2 模型評(píng)價(jià)
所有光譜預(yù)處理方法下三種人工神經(jīng)網(wǎng)絡(luò)對(duì)四種乳制品的鑒別模型結(jié)果對(duì)比如表2所示。
表2 四種乳制品鑒別模型對(duì)比
從表2中可以得出以下結(jié)論:
(1)在所有光譜預(yù)處理方法中,最佳的方法是MSC+SG+WT,通過(guò)這種方法預(yù)處理后,BP-ANN、RBF-ANN和SVM-ANN三種神經(jīng)網(wǎng)絡(luò)對(duì)乳制品建立鑒別模型均達(dá)到了100%;
(2)除MSC+SG+WT方法以外,只采用WT進(jìn)行光譜預(yù)處理后,三種神經(jīng)網(wǎng)絡(luò)建立的鑒別模型鑒別率也均可達(dá)到90%以上;采用FD+WT預(yù)處理后的鑒別率也均可達(dá)到85%以上。所以在進(jìn)行乳制品品種鑒別時(shí),首先可以采取最佳預(yù)處理方法MSC+SG+WT,除此之外還可考慮WT和FD+WT;
(3)采用MSC+SG進(jìn)行光譜預(yù)處理后,SVMANN法鑒別模型行的鑒別率也可達(dá)到100%,而MSC+SG+FD+WT進(jìn)行光譜預(yù)處理,BP-ANN和RBF-ANN建立的鑒別模型性能也比較可靠,鑒別率也均可達(dá)到98%,因此,可根據(jù)根據(jù)實(shí)際需求進(jìn)行選擇;
(4)從總體上看,使用SVM-ANN建立鑒別模型的精度要高于BP-ANN和RBF-ANN法,除了MSC+SG+FD和MSC+SG+FD+WT兩種光譜預(yù)處理方法以外,其他光譜預(yù)處理方法下,SVM-ANN法建立鑒別模型的鑒別率均可達(dá)到80%以上,多數(shù)在90%以上,基本符合實(shí)際需求。
綜上可見(jiàn),三種人工神經(jīng)網(wǎng)絡(luò)中,性能最穩(wěn)定,精度最高的是SVM-ANN,實(shí)際生產(chǎn)和生活中可多采用此方法。
對(duì)應(yīng)用近紅外光譜技術(shù)快速建立四種乳制品鑒別模型的方法進(jìn)行了研究,得到了一種速度快,精度高,無(wú)損壞的鑒別方法。用小波變化壓縮預(yù)處理后的樣品光譜數(shù)據(jù),數(shù)據(jù)被降維;然后分別采用BPANN、RBF-ANN和SVM-ANN建立品種鑒別模型。結(jié)果表明,三種人工神經(jīng)網(wǎng)絡(luò)中,SVM-ANN性能最穩(wěn)定且精度最高,為實(shí)際生產(chǎn)和生活提供了理論依據(jù)。
[1] Nagarajan R,Singh Parul,Mehrotra Ranjana.Direct determination of moisture in powder milk using near infrared spectroscopy[J].Journal of Automated Methods& Management in Chemistry,2006,(3):1 -4.
[2] Masataka Kawasaki,Shuso Kawamura,Maki Tsukahara,et al.Near-infrared spectroscopic sensing system for online milk quality assessment in a milking robot[J].Computers and Electronics in Agriculture,2008,(63):22 -27.
[3] Jaya Sundaram,Chari V K,Christopher L B.Application of near infrared spectroscopy to peanut grading and quality analysis:overview[J].Sens.& Instrumen.Food Qual,2009,(3):156 -164.
[4] Roman M B,Sergey V S.Melamine detection by mid-and near-infrared(MIR/NIR)spectroscopy:A quick and sensitive method for dairy products analysis including liquid milk,infant formula,and milk powder[J].Talanta,2011,(85):562-568.
[5] Wang Tianzi,Zheng Limin,Tian Lijun,et al.Analysis of milk and dairy products by Near-Infrared Spectroscopy:a review[J].Spectroscopy and Spectral Analysis,2010,30(12):3208 -3212.(in Chinese)王田子,鄭麗敏,田立軍,等.近紅外在乳及乳制品質(zhì)量檢測(cè)中的研究發(fā)展[J].光譜學(xué)與光譜分析,2010,30(12):3208-3212.
[6] Zhu Xiangrong,Shan Yang,Li Gaoyang,et al.Determination of fat and protein content in liquid milk by near infrared spectroscopy[J].Food Science,2011,32(12):191 -195.(in Chinese)朱向榮,單陽(yáng),李高陽(yáng),等.近紅外光譜法快速測(cè)定液態(tài)奶中蛋白質(zhì)和脂肪含量[J].食品科學(xué),2011,32(12):191-195.
[7] Zhou Zaijin,Liu Gang,Ren Xianpei.Identification studies of wild mushroom by mid-infrared spectrum and stratified sampling method[J].Laser & Infrared,2010,40(9):970 -975.(in Chinese)周在進(jìn),劉剛,任先培.中紅外光譜和分層抽樣法應(yīng)用于野生菌的快速鑒別[J].激光與紅外,2010,40(9):970-975.
[8] Tan Ailing,Bi Weihong.Identification of honey by NIR spectroscopy technology based on KPCA and LSSVM[J].Laser& Infrared,2011,41(12):1331 - 1336.(in Chinese)談愛(ài)玲,畢衛(wèi)紅.基于KPCA和LSSVM的蜂蜜近紅外光譜鑒別分析[J].激光與紅外,2011,41(12):1331-1336.
[9] Niu Xiaoying,Shao Limin,Zhao Zhilei,et al.Nondesructive discrimination of strawberry varieties by NIR and BRANN[J].Spectroscopy and Spectral Analysis,2012,32(8):2095 -2099.(in Chinese)牛曉穎,邵利敏,趙志磊,等.基于BP-ANN的草莓品種近紅外光譜無(wú)損鑒別方法研究[J].光譜學(xué)與光譜分析,2012,32(8):2095 -2099.
[10] Guo Haixia,Wang Tao,Liu Yang,et al.Study on recognition of the true or false red wine based on visible-near infrared spectroscopy[J].Spectroscopy and Spectral Analysis,2011,31(12):3269 -3272.(in Chinese)郭海霞,王濤,劉洋,等.基于可見(jiàn)-近紅外光譜技術(shù)的葡萄酒真?zhèn)舞b別的研究[J].光譜學(xué)與光譜分析,2011,31(12):3269 -3272.
[11] Zhang Jun,Jiang Li,Chen Zhe,et al.Study on the gasoline classification methods based on near infrared spectroscopy[J].Spectroscopy and Spectral Analysis,2010,30(10):2654 -2657.(in Chinese)張軍,姜黎,陳哲,等.基于近紅外光譜技術(shù)成品汽油分類方法的研究[J].光譜學(xué)與光譜分析,2010,30(10):2654-2657.
[12] Wu Wenjin,Wang Hongwu,Chen Shaohong,et al.Fast discrimination of commercial corn varieties based on near infrared spectra[J].Spectroscopy and Spectral Analysis,2010,30(5):1248 -1251.(in Chinese)鄔文錦,王紅武,陳紹江,等.基于近紅外光譜的商品玉米品種快速鑒別方法[J].光譜學(xué)與光譜分析,2010,30(5):1248 -1251.
[13] Yan Wenjuan,Lin Ling,Zhao Jing,et al.Probability neural network for the classification of tonguediagnosis by near infrared spectroscopy[J].Laser & Infrared,2010,40(11):1201 -1204.(in Chinese)嚴(yán)文娟,林凌,趙靜,等.概率神經(jīng)網(wǎng)絡(luò)用于舌診的近紅外光譜分類[J].激光與紅外,2010,40(11):1201-1204.
[14] Lu Wanzhen,Yuan Hongfu,Xu Guangtong.Modern near infrared spectral analysis technology[M].2nd ed.Beijing:China Petrochemical Press,2007:15.(in Chinese)陸婉珍,袁洪福,徐廣通.現(xiàn)代近紅外光譜分析技術(shù)[M].2 版.北京:中國(guó)石化出版社,2007:15.
[15] Fang Hui,Wang Qian.Research of algorithm on support vector machine[J].Journal of Changchun Normal University:Natural Science,2007,26(3):90 -91.(in Chinese)方輝,王倩.支持向量機(jī)的算法研究.長(zhǎng)春師范學(xué)院學(xué)報(bào):自然科學(xué)版,2007,26(3):90 -91.
[16] Yang Fusheng.Engineering analysis and application of wavelet transform[M].Beijing:Science Press,1999:1 -4.(in Chinese)楊福生.小波變換的工程分析與應(yīng)用[M].北京:科學(xué)出版社,1999:1-4.