王彩霞, 何智武, 吳龍國, 買玉花, 張智峰, 賀曉光*
(1. 寧夏大學 農(nóng)學院, 寧夏 銀川 750021; 2. 寧夏尚農(nóng)生物科技產(chǎn)業(yè)發(fā)展有限公司, 寧夏 固原 756000)
牛肉是我國消費最為普遍的肉制品之一,其味道鮮美,營養(yǎng)豐富,深受國內(nèi)外市場的青睞。近年來,牛肉消費量逐年增加[1]。目前國內(nèi)市場的牛肉品種繁多,不同品種的牛肉在口感和品質(zhì)上存在很大差異,但肉品性狀和顏色極為相似,肉眼無法區(qū)分。為保護一些優(yōu)良的牛肉品種及消費者權益,對牛肉品種進行快速鑒別具有很重要的現(xiàn)實意義。
傳統(tǒng)的肉類鑒別方法有酶聯(lián)免疫吸附[2]、蛋白質(zhì)譜技術[3-5]、PCR[6]等,鑒定成本高,操作復雜,耗時耗力。因此,尋求一種快速高效的牛肉品種鑒別方法有很重要的現(xiàn)實意義。高光譜成像技術是一種集圖像和光譜于一體的無損檢測新技術,具有高效快速、操作簡單等優(yōu)點[7],在肉品分析領域得到了廣泛的應用。王松磊等[8]在400~1 000 nm波段對灘羊肉嫩度進行檢測,結果表明基于圖譜特征變量融合所建立的偏最小二乘回歸(Partial least square regression,PLSR)模型決定系數(shù)為0.88;Jiang等[9]利用Vis/NIR高光譜對雞胸肉的嫩度進行分類,結果表明基于全光譜波段所建立的偏最小二乘判別(Partial least squares discrimination analysis,PLS-DA)模型的校正集與預測集準確率分別為0.92和0.94;Xiong等[10]利用可見近紅外高光譜對散養(yǎng)雞和普通飼養(yǎng)方式下的雞進行識別分析,并結合多元散射校正(Multiplicative scatter correction,MSC)進行預處理,建立基于連續(xù)投影算法(Successive projections algorithm,SPA)和徑向基函數(shù)-支持向量機(RBF-SVM)的雞肉判別模型,模型準確率高達93.33%;Balage等[11]應用近紅外高光譜成像技術對豬肉的pH值、顏色、脂肪和剪切力值進行預測,并取得了較好的預測結果;王靖等[12]使用900~1 700 nm高光譜成像系統(tǒng)對寧夏不同產(chǎn)地的羊肉進行品種識別,結果表明CARS-PLS-DA為最優(yōu)模型, 校正集正確率90.48%,預測集正確率84.21%。
由上述研究可知,利用高光譜成像技術在肉品定量分析及定性鑒別領域已得到國內(nèi)外許多學者的研究并都取得了較好的結果。本文利用高光譜成像技術對安格斯牛、力木贊牛、西門塔爾牛3個品種的牛肉進行鑒別研究,比較不同預處理方法和特征波長篩選方法對模型精度及穩(wěn)定性的影響,并對400~1 000 nm及900~1 700 nm波段的鑒別結果進行比較分析,進而為不同牛肉品種的鑒別提供技術參考。
分別采集3歲左右的安格斯牛、力木贊牛、西門塔爾牛各3~5頭,肉樣均采自寧夏固原市寧夏尚農(nóng)生物科技發(fā)展產(chǎn)業(yè)有限公司。各品種牛經(jīng)屠宰后在0 ℃下冷藏,排酸48 h。取出牛肉樣品進行分割,取4個部位肉(脖肉、眼肉、里脊肉、瓜條肉),每個部位取0.5 g,放入保溫箱運至實驗室,貯藏在4 ℃冷柜備用。光譜掃描前將肉樣整形切塊(大小約為40 mm×30 mm×10 mm),室溫下放置2 h,待肉樣中心溫度達到室溫水平后,用濾紙吸干樣品表面的水分,進行光譜掃描。
TA-XT plus質(zhì)構儀(HDP-BSW刀具,厚度3 mm,英國Stable Micro Systems有限公司);WSC-S色差計(北京精密科學儀器有限公司);pHS-25數(shù)顯pH計(上海儀電科學儀器股份有限公司);SMART Turbo微波水分測定儀(美國培安有限公司);Hyper Spec-VNIR高光譜成像系統(tǒng)(光譜范圍400~1 000 nm,美國Headwall公司);Hyper SIS-NIR型近紅外光譜成像儀(光譜范圍900~1 700 nm,芬蘭Specimen公司)
2.2.1 色澤測定
應用色差儀對牛肉樣品進行色澤測定。在每個樣品表面取3個不同的位置,測定3組L*、a*、b*值,取其平均值。
2.2.2 嫩度值測定
牛肉嫩度的測定依據(jù)NY/T 1180-2006標準進行。將牛肉塊順著肌纖維方向切成1 cm×1 cm×2 cm的小塊,置于質(zhì)構儀上,垂直于肌肉纖維方向剪切,取3個肉塊剪切力的平均值作為該樣本的最終嫩度值。測試參數(shù)設定:測試模式為壓縮測試,探頭下降速度為6.0 mm/s,探頭回程速度為6.0 mm/s,測試距離為20 mm。
2.2.3 pH值測定
將pH計的探針插入肉樣中,使pH計的電極與肌肉組織充分接觸,待讀數(shù)穩(wěn)定后記錄數(shù)據(jù),每個肉樣重復測定3次,取其平均值。
2.2.4 水分、蛋白質(zhì)及脂肪含量的測定
采用SMART Turbo微波水分測定儀進行水分、蛋白質(zhì)及脂肪含量的測定。
在樣本采集前,需打開高光譜儀器預熱30 min。由于牛肉樣本形狀、表面紋理、色澤等會造成光源漫反射,同時,光源強度分布不均以及相機中暗電流的存在,使光強在分布較弱波段下的圖像噪聲較大,影響光譜信息采集,因此,需要對儀器進行黑白校正及掃描參數(shù)設定。經(jīng)過預試驗最終確定VIS/NIR高光譜系統(tǒng)的采集參數(shù)為:相機曝光時間為15 ms,物距為380 mm,位移平臺移動速度為15 mm/s;近紅外高光譜采集系統(tǒng)的參數(shù)為:輸送速度14 mm/s,物距為370 mm,曝光時間20 ms,掃描長度160 mm。試驗過程中,每組取5塊肉樣依次置于電控位移平臺上,進行光譜掃描,獲取所有樣本的高光譜圖像數(shù)據(jù)。圖像數(shù)據(jù)處理之前,利用ENVI 4.8軟件選取整塊肉表面作為感興趣區(qū)域(Region of interest,ROI),計算ROI內(nèi)的平均反射光譜,作為樣本的反射光譜。利用SPXY[13]法對采集到的光譜數(shù)據(jù)進行樣本劃分,并對劃分后的數(shù)據(jù)進行預處理,本文選取SG卷積平滑(Savitzky-Golay smoothing,SG)、歸一化(Normalize)、基線校準(Baseline)、標準正態(tài)變量變換(Standard normal variate,SNV)和MSC預處理方法處理。
由于牛肉樣本的全波段光譜數(shù)據(jù)量大、信息混雜,因此,需選用適當?shù)奶卣鞑ㄩL提取方法剔除不相關或者非線性變量,降低模型運算量、提高模型穩(wěn)健性[14]。本文選用SPA、間隔隨機蛙跳(Interval random frog,IRF)法提取特征波長。SPA法提取的特征波長具有共線性小、冗余度低的性能[15],IRF法是將整個光譜按照特定寬度劃分成區(qū)間,通過每個區(qū)間光譜點的絕對回歸系數(shù)總和來評估區(qū)間,找到最佳區(qū)間組合的一種方法[16]。
應用SAS 9.2對牛肉樣品的色澤、嫩度、pH值及水分含量測定值進行均值差異顯著性分析;光譜數(shù)據(jù)預處理在The Unscrambler X 10.4中進行,其余算法在Matlab R2016a中實現(xiàn)。
不同品種的牛肉在內(nèi)外品質(zhì)上有很大的差異。牛肉的品質(zhì)主要包括食用質(zhì)量(色澤、風味、嫩度)、營養(yǎng)質(zhì)量(蛋白質(zhì)含量、脂肪含量)、技術質(zhì)量(系水力、pH值水平)等[17]。本試驗對3個品種牛肉的理化指標進行測定,結果如表1所示。
表1 3種類型牛肉的理化指標統(tǒng)計情況
注:同行平均值標注不同字母為差異顯著(P<0.05);標注相同字母為差異不顯著(P>0.05)。
由表1可知:安格斯牛與力木贊牛的L*值差異不顯著,且均低于西門塔爾牛;安格斯牛與西門塔爾牛的a*、b*、pH值差異不顯著,但a*值、pH值與力木贊牛差異顯著;安格斯牛與力木贊牛的水分含量差異不顯著,蛋白質(zhì)含量差異顯著;3個品種牛肉的嫩度與脂肪含量差異顯著,力木贊牛的嫩度最高,西門塔爾牛的嫩度最??;安格斯牛的脂肪含量高于力木贊牛與西門塔爾牛。
樣本集的劃分方法在一定程度上決定了所建模型的優(yōu)劣性,本研究采用SPXY法對樣品進行劃分。結果如表2所示。
表2 利用SPXY法劃分樣本結果
為消除原始光譜曲線的噪音及無關信息,提高所建模型的準確性,需要對原始光譜進行預處理。在建立PLS-DA模型時,需確定模型的最佳主成分數(shù)。試驗中將最大主成分數(shù)設定為20,進行數(shù)據(jù)歸一化處理,并采用百葉窗交互驗證[18],設置交互驗證組數(shù)為10,原始光譜的交互驗證錯誤率隨主成分數(shù)的變化如圖1所示。
從圖1可以看出,在主成分數(shù)為18時,錯誤率達到最低。之后隨主成分數(shù)的上升錯誤率緩慢增大,因此將18確定為最優(yōu)主成分數(shù)。依此類推,可確定其他預處理數(shù)據(jù)的最佳主成分數(shù),結果如表3所示。
圖1 交互驗證中不同主成分下的錯誤率
Fig.1 Error rate of different principal components in cross validation
由表3可知,400~1 000 nm波段內(nèi)校正集準確率效果較好,均高于95%,其中,校正集準確率最高的是SNV與MSC,預測集中經(jīng)SNV方法預處理后的模型準確率略高于MSC方法,說明SNV法可有效消除由于肉品表面不均及操作環(huán)境造成的光譜差異,因此,在400~1 000 nm波段范圍選擇SNV法為建立牛肉樣品分類PLS-DA模型的最優(yōu)光譜預處理方法。在900~1 700 nm波段范圍,準確率最高的為SG預處理,校正集與預測集準確率分別為100%和96.04%,故選用其為900~1 700 nm波段的最佳預處理方法。
表3 不同預處理方法后的PLS-DA模型結果
Tab.3 Results of PLS-DA models by different pretreatment methods
預處理方法400~1 000 nm900~1 700 nm校正集正確率/%預測集正確率/%校正集正確率/%預測集正確率/%原始光譜98.5697.1198.5295.05SG平滑98.5696.1510096.04Normalize99.0495.1998.5291.09Baseline96.1794.2396.5597.03SNV10097.1298.0393.07MSC10095.1994.5893.07SG-MSC99.0495.1910095.05SNV-MSC99.5297.1294.5893.07
3.4.1 SPA法提取特征波長
在采用SPA法進行特征波長篩選時,首先需要計算SPA在不同的有效波長數(shù)下的均方根誤差(Root mean square error of calibration set,RMSEC),通常將最小的RMSEC值確定為最佳的有效波長數(shù)。
由圖2(a)可知,特征波長數(shù)為15之前時,RMSEC處于顯著下降狀態(tài),之后隨著波長數(shù)的增加,RMSEC處于較平穩(wěn)的變化狀態(tài)。當波長數(shù)為15時,RMSEC為0.546 01,表明特征波長所含牛肉品種差異信息與真實值之間具有較高的一致性。圖2(b)為400~1 000 nm波段范圍共125個波段下挑選出的特征波長,分別為425,430,459,473,531,550,579,589,598,670,723,761,776,958,987 nm。利用SPA法優(yōu)選出的特征波長占全部波長的12%。由圖3(a)可得,特征波長數(shù)為12之前時,RMSEC處于顯著下降狀態(tài),12之后隨著波長數(shù)的增加,RMSEC處于較平穩(wěn)的變化狀態(tài)。當波長數(shù)為12時,RMSEC為0.316 84。圖3b為900~1 700 nm波段范圍共256個波段下挑選出的特征波長,分別為954,981,993,1 005,1 023,1 151,1 202,1 229,1 607,1 649,1 664,1 673 nm,提取的特征波長主要位于光譜吸收曲線的波峰波谷位置。
圖2 400~1 000 nm波段利用SPA方法提取特征波長
圖3 900~1 700 nm波段利用SPA方法提取特征波長
3.4.2 IRF法提取特征波長
在利用IRF提取特征波長時,設置迭代次數(shù)N為1 000,間隔寬度W為10,子間隔初始值Q為50,主成分數(shù)為20。在400~1 000 nm波段運行IRF,得到116個間隔中排名前10的間隔如表4所示;同時計算每個間隔的RMSECV,如圖4所示。同理可得,900~1 700 nm波段中排名前10的間隔如表5所示,247個間隔的RMSECV如圖5所示。
由表4可知,挑選出的排名前10的區(qū)間波點為36號到125號。而圖4(a)顯示,前18名間隔波長的RMSECV值最小,因此,選擇排名前18的間隔波長[19],最終優(yōu)選出的波點為8~19,35~52,79~99,113~125號,具體波長是435~488 nm、565~646 nm、776~819 nm、939~997 nm,共58個波長。
由表5可知,挑選出的排名前10的區(qū)間波點為31號到104號。而圖4(b)顯示,前18名間隔波長的RMSECV值最小,因此,選擇排名前32的間隔波長[19],最終優(yōu)選出的波點為7~16,24~45,87~121,168~177,186~203號,具體波長是936~963 nm、987~1 050 nm、1 175~1 276 nm、1 416~1 443 nm、1 470~1 521 nm,共95個波長。
表4 400~1 000 nm波段牛肉光譜數(shù)據(jù)排名前10的波長間隔
Tab.4 Top ranked 10 wavelength intervals of beef spectral data from 400-1 000 nm
排名間隔排名間隔138~476115~1242116~125735~44341~50839~48436~45942~51537~4610114~123
圖4 波段排名從第一到最后一個波長間隔的RMSECV值
Fig.4 RMSECV of the union of the intervals from 1st to last
表5 900~1 700 nm波段牛肉光譜數(shù)據(jù)排名前10的波長間隔
Tab.5 Top ranked 10 wavelength intervals of beef spectral data from 900-1 700 nm
排名間隔排名間隔132~41633~42231~40735~44388~97893~102490~99992~101591~1001089~98
3.4.3 IRF-SPA特征波長篩選
通過IRF篩選出的特征波長變量依然較多,波長變量之間仍存在共線性,為更加有效地篩選出最少的特征變量,經(jīng)IRF篩選特征波長后再利用SPA進行二次特征波長篩選。在400~1 000 nm波段,從58個特征波長變量中篩選出19個變量,分別為411,425,435,445,459,488,497,526,541,545,555,589,593,608,617,637,641,646,651 nm;在900~1 700 nm波段,從95個特征波長變量中篩選出16個變量,分別為401,406,440,445,449,454,488,512,550,603,641,723,757,795,819,848 nm。
利用PLS-DA鑒別模型對不同波段下的牛肉品種進行鑒別,并對全波段及3種特征波長提取波段下建立的牛肉品種鑒別模型進行對比分析,結果見表6。
由表6可知,在400~1 000 nm波段,經(jīng)SNV法預處理的全波段PLD-DA鑒別模型中校正集與預測集準確率分別為100%和97.12%。基于不同特征波長提取方法建立的鑒別模型中,SPA法建立的模型準確率較低,校正集與預測集準確率均低于90%;IRF法提取58個特征波長下建立的PLS-DA模型中,校正集準確率為99.04%,略低于全波段模型,預測集準確率為98.08%,高于全波段模型準確率。IRF-SPA法共提取了19個特征波長,校正集與預測集準確率分別為98.56%和97.12%,所建模型的校正集準確率接近IRF法建立的模型,預測集準確率與全波段模型相同。IRF-SPA法提取的19個波長與全波段及IRF法相比,大大降低了運算量,并且建模準確率高于SPA法。因此,在400~1 000 nm波段內(nèi)IRF-SPA方法提取出的19個特征波長可以代替全波長進行3種牛肉的光譜鑒別。
表6 3個品種牛肉的鑒別準確率
在900~1 700 nm波段,經(jīng)SG卷積平滑預處理后的全波段PLD-DA鑒別模型中校正集與預測集準確率分別為100%和96.04%。利用SPA法提取的12個特征波長建立的模型的校正集準確率為94.09%,低于全波段建模的準確率;預測集準確率與全波段相同,均為96.04%。IRF法提取95個特征波長下建立的PLS-DA模型中,校正集準確率為100%,但預測集準確率僅為83.17%。IRF-SPA法共提取了16個特征波長,校正集與預測集準確率分別為94.09%和90.10%,均低于SPA法。SPA法提取的12個波長與全波段及IRF法相比,波長數(shù)大大減少,模型穩(wěn)定性也較高。因此,在900~1 700 nm波段,SPA方法提取出的12個特征波長可以代替全波長進行3種牛肉的光譜鑒別。
根據(jù)以上分析可知,在特征波長提取方法中,SPA法優(yōu)選出的變量數(shù)明顯少于IRF提取方法,但IRF法所建模型的準確率均高于SPA法。400~1 000 nm波段的鑒別準確率高于900~1 700 nm波段,說明3種牛肉在外部色澤紋理上的識別效果比內(nèi)部成分的識別更加準確,這與王松磊等[20]對羊肉品種的多波段識別結果一致。
安格斯牛、力木贊牛、西門塔爾牛3個品種的牛在內(nèi)外品質(zhì)上有很大的差異。通過實驗研究發(fā)現(xiàn),在外部色澤方面,安格斯牛與力木贊牛的L*值差異不顯著,安格斯牛與西門塔爾牛的a*、b*值不顯著,因此,僅用色澤差異無法對3個品種的牛肉進行區(qū)分。通過對牛肉內(nèi)部品質(zhì)進行檢測發(fā)現(xiàn),安格斯牛與西門塔爾牛的pH值差異不顯著;安格斯牛與力木贊牛的水分含量差異不顯著;3個品種牛肉的嫩度與脂肪含量差異顯著,安格斯牛的脂肪含量高于力木贊牛與西門塔爾牛。這是由于牛肉的嫩度不僅與牛肉大理石結構有很大關系,還受肌肉中各種蛋白質(zhì)結構特性、結締組織含量及分布的影響。
對400~1 000 nm及900~1 700 nm波段的牛肉原始光譜進行不同預處理后分別建立牛肉品種的PLS-DA全光譜鑒別模型,對比得出在400~1 000 nm波段,SNV法為最優(yōu)預處理方法;在900~1 700 nm波段,SG平滑法為最優(yōu)預處理方法。
采用SPA、IRF及IRF-SPA方法對經(jīng)預處理后的光譜進行特征波長篩選并建立PLS-DA鑒別模型。經(jīng)比較分析,在400~1 000 nm波段,利用IRF-SPA方法提取出的19個特征波長下建立的PLS-DA模型的校正集與預測集準確率分別為98.56%和97.12%,接近全波段識別率,因此可代替全波長進行3種牛肉的光譜鑒別。在900~1 700 nm波段,利用SPA方法提取出的12個特征波長下建立的PLS-DA模型的校正集與預測集準確率分別為94.09%和96.04%,校正集準確率略低于全波段準確率,預測集準確率與全波段相同,該方法在很大程度上簡化了模型復雜程度,提高了運算效率。