方 瑤,謝天鏵,郭 渭,白雪冰,李鑫星*
1. 中國農(nóng)業(yè)大學信息與電氣工程學院食品質(zhì)量與安全北京實驗室,北京 100083 2. 中國農(nóng)業(yè)大學工學院,北京 100083
隨著生活物質(zhì)水平逐步提高,人們對于牛肉消費要求趨向于新鮮、 衛(wèi)生。但消費者在選擇好品質(zhì)的肉時只能根據(jù)肉類品種、 商家廣告等判斷肉類好壞[1]。目前,我國的肉類銷售仍以冷凍儲藏為主,長期的冷凍儲藏會導致冷鮮肉的質(zhì)量逐漸發(fā)生變化。使用傳統(tǒng)的理化分析法檢測肉質(zhì)時存在耗費試劑量大、 檢測周期長和人力要求高等問題[2]。通過基于高光譜多參數(shù)融合的冷鮮肉品質(zhì)無損檢測既可以避免傳統(tǒng)破壞性檢測對產(chǎn)品的破壞,又可以實現(xiàn)對產(chǎn)品準確、 快速的實時檢測[3]。
高光譜成像作為一項新興的檢測成像技術,具有無損、 快速、 精度高等優(yōu)勢,被廣泛應用于食品安全檢測中[4]。國內(nèi)外許多學者將高光譜技術應用于豬、 羊、 魚等[5-8]的肉質(zhì)檢測,He[9]等采用HSI技術成功在全波段內(nèi)預測了三文魚的硬度、 內(nèi)聚性、 黏性。有研究使用高光譜成像方法實現(xiàn)了冷藏腐敗過程魚肉蛋白質(zhì)和脂肪變化檢測。但很少有學者對冷鮮牛肉的品質(zhì)檢測進行研究。
牛肉質(zhì)地特性[10-12],例如硬度、 回復性、 彈性、 粘著性、 膠著度、 咀嚼度等是決定肉類產(chǎn)品整體質(zhì)量的關鍵參數(shù)。因而冷鮮肉質(zhì)的測定對肉質(zhì)品質(zhì)檢測具有重要的意義。
以不同儲藏時間和溫度的冰鮮牛肉作為研究對象,重點分析研究在冰鮮牛肉冷凍儲藏處理過程中其蛋白質(zhì)構成的特性: 粘著性、 回復性等復雜變化。采集其對應的高光譜圖像,分別采用一階微分、 多元散射校正、 二元一階微分、 標準正態(tài)變換對高光譜數(shù)據(jù)進行預處理; 采用連續(xù)投影法(SPA)篩選出最優(yōu)波長; 分別使用偏最小二乘法(PLSR)和主成分回歸法(PCR)建立預測模型。最終建立基于特征波長的高光譜與多參數(shù)的冷鮮肉品質(zhì)檢測模型。
實驗所用樣本為北京市美廉美超市所購買的新鮮的牛肉背部肌。購買后立即將牛肉分成126份,平均分配到0,4和8 ℃三個恒溫箱中,每個溫度下的每塊樣品使用無菌袋單獨包裝,進行編號,在每個溫度的恒溫箱中放入溫度記錄儀。實驗共進行十四天,每天從每個恒溫箱中取出三個樣本進行實驗。
高光譜圖像采集設備采用中國農(nóng)業(yè)大學信息與電氣工程學院的GaiaSorter高光譜分選儀,采集軟件為SpecView,選用波段為1 000~2 500 nm的近紅外光譜相機獲取冷鮮肉的光譜反射率,手動調(diào)節(jié)焦距至圖像最清晰,每次采集圖像后按式(1)進行黑白校準
(1)
式(1)中,Ra為隨機矯正后的高精度光譜波形圖像,Ba為標準校正黑板反射光譜圖像;Wa為標準白板反射光譜圖像;Ia為隨機利用高精度光譜圖像采集處理系統(tǒng)進行采集后得到的高精度光譜波形圖像。TPA(質(zhì)構分析)參數(shù)采集使用Stable Micro Systems質(zhì)構儀,采用圓柱型探頭,直徑為6mm,默認返回速度為4.5 mm·s-1,兩次壓縮等待時間間隔為2 s,每個樣本采樣三次。
冷鮮肉的貨架期一般為14 d,是理想的試驗周期。本研究以牛肉背部肌為試驗樣本,每天對0,4和8 ℃三個溫度下儲存的冷鮮牛肉采集3個樣本的高光譜圖像及質(zhì)構特性參數(shù),取平均值。獲取高光譜數(shù)據(jù)的軟件為ENVI5.3。ENVI(the environment for visualizing images)是一個完整的專業(yè)遙感軟件圖像處理分析平臺,匯集于其中的遙感軟件圖像處理分析技術覆蓋遙感圖像處理數(shù)據(jù)的精確定標、 數(shù)據(jù)流的融合、 信息提取等各種信息變換。對每一幅高光譜圖像設置50×50的感興趣區(qū)域(region of interest, ROI),計算所有興趣區(qū)域的高光譜圖像平均值, 得到表示所選感興趣區(qū)域的高光譜圖像反射率與光譜波長之間關系值的曲線, 將得到的光譜數(shù)據(jù)導出。實驗所研究的對象為牛肉背部肌,每一塊樣品中不均勻地分布著牛肉脂肪沉淀,手動選擇ROI區(qū)域可以一定程度排除脂肪沉淀干擾。
利用新型質(zhì)構儀器測定冷鮮牛肉質(zhì)構得到具有粘聚性、 回復性等六個主要質(zhì)構測量指標,指標在不同牛肉貯藏時間溫度下隨保存時間的變化趨勢顯示如圖1所示。硬度、 彈性、 咀嚼度、 膠著度隨時間變化未呈現(xiàn)明顯的遞增或遞減趨勢,說明大多數(shù)質(zhì)構參數(shù)指標波動大,測量時干擾較多,數(shù)據(jù)存在一定的誤差,建模時需要篩選指標以保障模型的精確度。其中,測量精度較高的指標有: 粘聚性、 回復性。隨時間下降,粘聚性和回復性下降趨勢明顯說明牛肉品質(zhì)隨著儲藏時間的增加而下降,新鮮度降低。0~5 d下降趨勢較緩,第6天以后下降速度加快,第11天左右出現(xiàn)上升趨勢。這可能是由于儲存后期肉質(zhì)腐敗程度大,導致大量水分丟失、 組織結(jié)構受到很大破壞、 底部效應增強所導致[13]。為了篩選精確度較高的質(zhì)構特性指標,建立質(zhì)構特性預測模型,結(jié)果如表1所示,粘聚性和回復性預測集準確度較高,其余指標預測集準確度均遠低于0.5,模型誤差超出容錯范圍,舍去。最終,選擇粘聚性和回復性作為參數(shù)建模。
圖1 不同質(zhì)構參數(shù)隨時間變化曲線(a): 硬度隨時間變化; (b): 彈性隨時間變化; (c): 咀嚼度隨時間變化;(d): 粘聚性隨時間變化; (e): 膠著度隨時間變化; (f): 回復性隨時間變化Fig.1 Curve of different texture parameters changing with time(a): Hardness over time; (b): Resilience of hardness over time; (c): Chewiness of hardness over time; (d): Cohesivencess of hardness time; (e): Stalemate of hardness over time; (f): Resilience of hardness over time
表1 質(zhì)構特性參數(shù)結(jié)果Table 1 Results of texture characteristic parameters
分別采用Kennard-Stone和SPXY算法將實驗樣本劃分為訓練集和預測集,其中篩選出35個訓練集樣本,7個預測集樣本。KS算法通過歐氏距離選擇樣本進入訓練集,以充分保證樣本集的選取具有代表性和均勻性。SPXY在計算樣品間距離時將自變量和因變量同時考慮在內(nèi)。為了保證樣本模型分析精度能夠達到最佳,訓練樣本模型應該在結(jié)構組成上和性質(zhì)上與預測到的樣本模型基本相同。對每種方法得到的樣本劃分結(jié)果以粘聚性作為參數(shù)分別采用全波段建模以確定最終的數(shù)據(jù)劃分方式。
為了比較不同樣本劃分方式效果的優(yōu)劣,采用相對標準偏差RSD及相關系數(shù)R2作為指標選擇最佳預處理方法,結(jié)果如表2所示。由表2可知,經(jīng)過SPXY和KS劃分后的樣本數(shù)據(jù)建立的偏最小二乘模型訓練集和預測集相關系數(shù)分別為0.769 3和0.596 6,均優(yōu)于無劃分方式的相關系數(shù)0.554 7,說明樣本劃分的必要性。使用KS算法樣品劃分后的建模預測集相關系數(shù)為0.596 6。使用 SPXY算法樣品劃分后建模預測集相關系數(shù)為0.769 3。兩者相對標準偏差接近,SPXY劃分結(jié)果相關系數(shù)相較于KS算法更接近1。綜上所述,SPXY建模效果優(yōu)于KS算法,采用SPXY作為樣本劃分方式。
表2 不同樣本劃分方式結(jié)果Table 2 Results of different sample partitioning methods
圖2為冰鮮牛肉原始光譜曲線。不同時間測量的光譜曲線整體趨勢相近。隨著儲藏時間延長,曲線在1 100 nm處峰值增加,1 200 nm處的峰谷降低,這可能是由于肌紅蛋白的轉(zhuǎn)化和降解。由于原始光譜包含許多噪聲干擾,例如光譜基線漂移,隨機噪聲等等,影響光譜建模的準確性,可導致模型的精確度降低,因此對原始光譜進行預處理十分必要。研究中使用一階微分、 二階微分、 多元散射校正、 標準正態(tài)變換對高光譜數(shù)據(jù)進行預處理,處理后采用全波段建模以確定最終預處理方式,結(jié)果如表3所示。
圖2 冰鮮牛肉原始光譜曲線Fig.2 Raw spectral curve of chilled beef
表3 不同預處理方式結(jié)果Table 3 Results of different pretreatment method
從表3數(shù)據(jù)可得,使用預處理后的光譜數(shù)據(jù)建立的冷鮮牛肉品質(zhì)模型的準確度總體上升。以粘聚性為參數(shù)時,經(jīng)SNV處理后光譜的模型準確度高于其他預處理方法,R2約為0.81,模型具有較高精度。在以回復性為參數(shù)建模時,D2st預處理效果最好,相關系數(shù)達到0.867 4,RSD為0.099 4。在選用不同質(zhì)構參數(shù)建立偏最小二乘模型時,相同預處理方法對模型的精確度的提升效果不同。由表3確定以粘聚性、 回復性為參數(shù)建模時分別采用SNV、 D2st作為原始光譜預處理方法。預處理后總體建模準確度在0.7~0.8左右,這可能是參數(shù)測量時存在較大誤差,數(shù)據(jù)波動性較大,穩(wěn)定性差的緣故。
經(jīng)預處理后的全波段牛肉品質(zhì)預測模型的效果得到改善。全波段光譜存信息量過大且包含大量冗雜數(shù)據(jù),因此預測模型需要優(yōu)化。主要使用連續(xù)投影法(SPA)對不同光譜的最優(yōu)波段進行篩選。SPA選擇含有最少多余信息的波長變量組合以最小化信息重復疊加。圖3展現(xiàn)了SPA應用算法分析得到的每個特征波長在SNV預處理后的全波段反射光譜上的幾個具體位置。SPA提取特征波長結(jié)果詳見表4。由表4可知,相比于無特征波長提取,SPA從原始光譜中提取了4個特征波長,有效減小了全波段建模包含的大量噪聲信息的缺點,使模型的精確度得到保障的同時提高了模型的運行速度。
圖3 SPA選取最優(yōu)特征波長Fig.3 Optimal wavelength selected by SPA
表4 提取特征波長后建模結(jié)果Table 4 Modeling results after feature wavelength extraction
現(xiàn)階段常用的預測變量建模和計算方法主要有PLSR,PCR和ANN等。PLSR通過投影分別將要預測的變量和其他觀測變量映射到一個新的空間, 來幫助尋找一個基于線性回歸的模型。分別采用SNV和D2st對數(shù)據(jù)進行預處理。對提取特征波長后的光譜進行粘聚性、 回復性預測模型的建立和分析。結(jié)果如表5和表6所示。
表5 基于PLSR的建模結(jié)果Table 5 Modeling results based on PLSR
表6 基于PCR的建模結(jié)果Table 6 Modeling results based on PCR
由表5對比可知,使用PLSR建模時,以粘聚性和回復性為參數(shù)的模型精確度分別為0.879 8和0.880 6。使用PCR建模時,以粘聚性和回復性為參數(shù)的模型精確度分別為0.728 8和0.766 04?;赑LSR的牛肉品質(zhì)參數(shù)預測模型的相關系數(shù)總體較高于基于PCR模型的相關系數(shù),說明PLSR的建模效果優(yōu)于PCR,這可能由于PCR模型中與組分值無關的一些變量可能也具有很大的權重,導致使用PCR建模存在一定的誤差。
對原始冷鮮牛肉高光譜數(shù)據(jù)進行預處理,采用SPA算法篩選出最優(yōu)波段,提取特征波段輸入PLSR算法中,構成基于高光譜的冷鮮牛肉粘聚性、 回復性的預測模型,得到不同質(zhì)構特性參數(shù)的預測值。最小二乘回歸結(jié)果如圖4(a,b)所示。
圖4 質(zhì)構參數(shù)回歸模型(a): 粘聚性真實值與預測值散點圖;(b): 回復性真實值與預測值散點圖Fig.4 Regression model of TPA(a): Scatter plots of true and predicted values of cohesivencess; (b): Scatter plots of ture and predicted values of resilience
結(jié)果表明: 基于SPA-PLSR的牛肉品質(zhì)預測模型具有較高的精度,當預測參數(shù)分別為粘聚性、 回復性的識別指數(shù)分別為0.856 6和0.840 7。
采用粘聚性、 回復性作為綜合評價冷鮮牛肉品質(zhì)的參數(shù),建立了基于高光譜的牛肉品質(zhì)預測模型。采用SPXY對光譜進行樣本劃分,生成35個訓練集樣本和7個預測集樣本,分別使用SNV和D2st對原始光譜數(shù)據(jù)進行預處理。采用SPA提取特征波長,將特征波段和質(zhì)構特性參數(shù)作為PLSR輸入,建立了基于高光譜與牛肉品質(zhì)(粘聚性、 回復性)預測模型,模型相關系數(shù)分別為0.879 8和0.880 6。經(jīng)過模型數(shù)據(jù)可靠性檢驗,該質(zhì)構預測模型精確度較高,適用于對牛肉品質(zhì)的在線快速檢測。