許毓婷,孫浩然,高 勛*,郭凱敏,林景全
1.長春理工大學(xué)理學(xué)院,吉林 長春 130022 2.長春工業(yè)大學(xué)機電工程學(xué)院, 吉林 長春 130012 3.包頭師范學(xué)院物理科學(xué)與技術(shù)學(xué)院,內(nèi)蒙古 包頭 014030
豬肉制品營養(yǎng)成分豐富,在人類飲食中占有重要地位,由于近年來豬肉制品價格水漲船高。不同部位的豬肉組織較為類似,在某些豬肉產(chǎn)品銷售市場上,一些不良商家將廉價部位的豬肉以次充好高價售賣,讓消費者無法分辨。豬肉部位的傳統(tǒng)檢測方法主要有物理學(xué)方法(顯微檢測法)[1]、免疫學(xué)方法(蛋白質(zhì)檢測)[2]和分子生物學(xué)方法(檢測DNA分子)[3],但這些方法操作繁瑣,檢測周期長,需專業(yè)技術(shù)人員操作。基于分子光譜學(xué)的豬肉部位檢測方法如近紅外光譜技術(shù)和拉曼光譜技術(shù)[4],方法雖便捷,由于各部分豬肉成分組成接近且豬肉組織接近,造成豬肉部位分類識別的識別率有待提高。
激光誘導(dǎo)擊穿光譜技術(shù)(laser-induced breakdown spectroscopy,LIBS)[5]是一種利用高能激光脈沖激發(fā)待測樣品并產(chǎn)生等離子體,通過分析樣品的等離子體發(fā)射光譜,最終識別待測物質(zhì)成分的分析方法。近年來,LIBS作為一種新興的光化學(xué)元素分析技術(shù),具有快速、綠色、無損檢測等優(yōu)點[6],因此LIBS技術(shù)在冶金、航天、土壤污染、水體污染、食品安全等多個領(lǐng)域進行推廣和應(yīng)用[7-8]。在食品安全領(lǐng)域,王彩虹[9]等基于LIBS技術(shù)和線性回歸方法對豬肉中的Cr元素進行定量分析,分析了單變量和多變量特征譜線對豬肉中Cr元素的定量分析影響。Gonca Bilge[10]等將豬肉、牛肉、雞肉碾碎混合,基于LIBS技術(shù)并結(jié)合主成分分析(principal component analysis,PCA)機器算法,對肉類的分類和識別準(zhǔn)確率達到83.37%。汪海燕[11]等提出了LIBS技術(shù)結(jié)合KNN和支持向量機(support vector machines,SVM)機器算法對豬油、豬皮、里脊等軟組織進行分類識別,識別準(zhǔn)確率和靈敏度分別達到了99.83%和99.5%。
研究上述表明LIBS技術(shù)結(jié)合機器學(xué)習(xí)對肉類組織以及肌肉組織的分類和識別是可行的,但在豬肉部位分類和識別方面的研究還未見報道。本工作通過LIBS技術(shù)與PCA-SVM機器學(xué)習(xí)相結(jié)合,對同一頭豬的不同豬肉部位開展研究,實現(xiàn)豬肉部位的分類和識別。
豬肉部位的分類和識別LIBS實驗裝置示意圖如圖1所示,實驗均在一個大氣壓、環(huán)境溫度23 ℃、相對濕度40%的潔凈空間下完成。激光光源為輸出波長1 064 nm的Nd∶YAG激光器(SLII-10, Continuun),光束模式TEM00,脈寬為10 ns,重復(fù)頻率為10 Hz,光束直徑約為6 mm,最大輸出脈沖能量為250 mJ。激光光束經(jīng)二分之一玻片和格蘭棱鏡組成的能量衰減系統(tǒng),經(jīng)1 064 nm HR鏡和焦距為120 mm的石英透鏡聚焦豬肉組織表面,焦點位于豬肉樣品表面內(nèi)0.1 mm,誘導(dǎo)擊穿豬肉的激光脈沖能量為60 mJ。誘導(dǎo)擊穿產(chǎn)生的等離子體由45°放置、焦距為75 mm的透鏡收集經(jīng)光纖耦合傳輸?shù)脚溆蠭CCD探測器的中階梯光譜儀(Mechelle 5000,Andor,波長范圍200~850 nm,光譜分辨率為0.05 nm)進行探測。ICCD探測器和激光輸出同步觸發(fā)由數(shù)字脈沖延時發(fā)生器DG645控制,ICCD探測器相對激光脈沖延時為1 μs,積分時間1 μs。由于豬肉組織樣品表面不均勻,為使豬肉樣品不被擊穿打在載玻片上產(chǎn)生誤差,在實驗中同時保證PI平移臺處于以0.1 mm·s-1的速度移動,采集100個脈沖的LIBS光譜并進行平均,降低脈沖能量抖動對LIBS光譜的穩(wěn)定性影響,且在同一實驗條件下每個豬肉部位樣品采集100幅光譜。
圖1 LIBS實驗裝置圖
實驗樣品購自長春市蓮花山豬肉市場的同一頭肉豬的前腿肉、梅花肉、里脊肉、五花肉。由于豬肉組織成分的表面分布不同于固體金屬表面均勻穩(wěn)定。本實驗為了減小樣品的隨機性,對同一種類的豬肉采集多個切片;樣品形態(tài)、表面溫度、干燥程度均會對實驗結(jié)果產(chǎn)生影響,為減小外界因素對實驗結(jié)果產(chǎn)生影響,實驗開始前通過人工切片的方式將豬肉切成7 mm×2 mm×1 mm片狀樣品,并放置于零下20℃的保鮮柜中,為反映實驗結(jié)果真實,不做干燥處理。實驗開始前將樣品取出,將樣品放置在三維平移臺上,確保每次激光作用于新的激光燒蝕點。
四種豬肉部位降噪處理后的LIBS光譜如圖2所示。由圖2可知,豬肉組織中觀察到H 656.2 nm,O 777.1 nm等非金屬元素譜線,由于實驗在空氣環(huán)境中進行,空氣等離子體發(fā)射光譜可能會對豬肉組織LIBS光譜中的H和O非金屬元素造成一定的干擾,因此H和O元素不能作為分析譜線。由于豬肉組織有大量的碳水化合物脂肪組織,因此實驗中觀察到了C—N譜線如385.4和387.1 nm。豬肉組織LIBS光譜中還存在Mg Ⅱ 279.8 nm,Ca Ⅱ(393.3,396.8,422.7,430.2和445.4 nm等),Na Ⅰ 588.9 nm,Na Ⅰ 589.0 nm,K Ⅱ 766.4 nm和K Ⅰ 769.9 nm等金屬元素譜線。一般LIBS的特征譜線的選取,要選擇干擾較少,信背比較高,峰值明顯,易激發(fā)的波段,如圖3所示。通過實驗所得的光譜信息,參照美國NIST原子光譜數(shù)據(jù)庫,選取Ca Ⅱ 393.3和422.7nm, Na Ⅰ 588.9和589.0 nm, K Ⅱ 766.4 nm,K Ⅰ 769.9 nm作為豬肉組織分類和識別的LIBS特征分析光譜線。
圖2 四種豬肉部位LIBS光譜(里脊、梅花、前腿、五花)
脂肪含量較多的五花肉LIBS光譜中存在大量C—N及C元素譜線峰,且譜線強度明顯比其他三種部位組織樣品高。由于實驗選擇的前腿肉、梅花肉、里脊肉、五花肉四類組織都來自同一種生物個體,獲得的LIBS特征譜線都較為相似。若從LIBS光譜圖中分辨豬肉部位,脂肪含量較高的五花肉和含鈣較高的前腿肉可以直接區(qū)分,而梅花肉、里脊肉兩種豬肉組織元素LIBS光譜強度差異較小,不能進行直接分辨。因此僅通過4種部位組織的LIBS光譜無法對豬肉部位組織進行分類鑒別,需結(jié)合機器學(xué)習(xí)算法對豬肉部位進行分類識別。
分析豬肉組織的LIBS光譜,元素線狀光譜和分子光譜有十多條之多,因此對豬肉部位進行分類識別的過程中,需要減少LIBS譜線的分析數(shù)據(jù)量。主成分分析(PCA)是一種常用的線性變換技術(shù),能夠降低噪聲和維度[12],使用PCA對豬肉部位LIBS光譜數(shù)據(jù)進行降維處理,同時能夠保留大部分原始光譜數(shù)據(jù)信息。將選取的Ca Ⅱ 393.3和422.7 nm, Na Ⅰ 588.9和589.0 nm, K Ⅱ 766.4 nm,K Ⅰ 769.9 nm六個特征譜線強度作為輸入變量,得到PC1,PC2,PC3,PC4,PC5和PC6的主成分貢獻率及累計貢獻率如圖3所示。
圖3 主成分貢獻率及累計貢獻率
由圖3可知,PC1,PC2和PC3的累計貢獻率達到了95%以上,說明由PC1,PC2和PC3三個主成分基本能夠表征豬肉部位的LIBS光譜全部信息,PC1,PC2和PC3三個主成分的三維散點圖如圖4所示。
由圖4可知,經(jīng)PCA降維后發(fā)現(xiàn),里脊、梅花、五花肉數(shù)據(jù)點呈現(xiàn)出明顯的聚類,但里脊和梅花肉部位信息存在部分重疊。前腿的光譜數(shù)據(jù)點較為分散,沒有呈現(xiàn)出聚類,表明前腿豬肉組織部位包括了里脊、梅花和五花肉類組織的生物特性,因此前腿部位的光譜數(shù)據(jù)和里脊、梅花、五花等部位光譜數(shù)據(jù)重疊區(qū)域較大。
圖4 四種豬肉組織散點圖
由于生物組織光譜數(shù)據(jù)所固有的高維性,需結(jié)合一種使用大數(shù)據(jù)統(tǒng)計的分類算法,支持向量機(support vector machine,SVM)[13]是一種基于統(tǒng)計學(xué)習(xí)理論的新型學(xué)習(xí)機。本文將采用SVM結(jié)合PCA算法對4種豬肉部位進行分類識別,以PC1,PC2和PC3主成分代替豬肉的特征光譜,構(gòu)建豬肉樣品的特征空間向量,特征向量構(gòu)成的數(shù)據(jù)矩陣作為SVM識別算法的輸入量。為保證豬肉部位識別模型的穩(wěn)定性,采用十倍交叉驗證的方式對模型進行評估,得到分類識別結(jié)果混淆矩陣如圖5所示。
圖5 豬肉部位PCA-SVM分類識別混淆矩陣
由圖5的豬肉部位PCA-SVM分類識別混淆矩陣可知,里脊組織、梅花組織、前腿組織、五花組織的分類識別率分別為96%,98%,97%和100%,說明基于LIBS技術(shù)結(jié)合PCA-SVM分類模型可以有效地實現(xiàn)豬肉部位的快速識別。豬肉組織相鄰較近的組織成分接近,因此LIBS光譜數(shù)據(jù)的信息冗余性較高且噪聲干擾較強,通過PCA實現(xiàn)LIBS光譜分析變量減少,克服了生物組織光譜數(shù)據(jù)信息重疊性及噪聲干擾。在PCA基礎(chǔ)上,構(gòu)造核函數(shù)的方式將兩條相近不可分的譜線映射到高維空間中,再從高維空間得到線性區(qū)分,采用SVM算法克服了豬肉組織光譜數(shù)據(jù)維度較高的缺點,因此,PCA-SVM機器學(xué)習(xí)算法可有效提高了豬肉部位的分類準(zhǔn)確率。
通過LIBS技術(shù)結(jié)合PCA-SVM機器學(xué)習(xí)對豬肉部位識別進行了研究。通過對比分析同一頭肉豬的前腿肉、梅花肉、里脊肉、五花肉的4個部位組織的LIBS特征光譜,發(fā)現(xiàn)4個部位組織的LIBS特征光譜具有較高的相似性。通過PCA算法對豬肉部位LIBS光譜數(shù)據(jù)進行降維處理,里脊、梅花、五花呈現(xiàn)出明顯的聚類,但里脊和梅花部位信息存在部分重疊,前腿的光譜數(shù)據(jù)點較為分散,沒有呈現(xiàn)出聚類。通過十倍交叉驗證的方式,采用PCA-SVM分類模型得到里脊組織、梅花組織、前腿組織、五花組織的分類識別率分別為96%,98%,97%和100%,表明LIBS與機器學(xué)習(xí)相結(jié)合的方法可以作為一種綠色、快速的生物組織檢測技術(shù)手段。