袁江濤, 郭佳俊, 孫有瑞, 劉貴珊*, 李 月, 吳 迪, 景怡萱
1. 寧夏大學(xué)食品科學(xué)與工程學(xué)院, 寧夏 銀川 750021 2. 寧夏大學(xué)物理與電子電氣工程學(xué)院, 寧夏 銀川 750021
肉類食品中富含的蛋白質(zhì)和脂肪極易氧化, 導(dǎo)致肉品色澤、 質(zhì)地以及風味劣變[1]。 生育酚是一種天然抗氧化劑, 有猝滅自由基的功能[2]。 羊肉中生育酚來源為維生素E的水解產(chǎn)物, 是非酶類內(nèi)源性抗氧化物質(zhì)之一。 生育酚當量抗氧化能力(trolox-equivalent antioxidant capacity, TEAC)是可以全面反映肉類內(nèi)源抗氧化能力的綜合性指標之一, 但傳統(tǒng)檢測方法過程復(fù)雜, 效率低, 亟需一種實時、 無損、 高效的檢測方法。
以灘羊肉為研究對象, 采用Vis/NIR高光譜成像技術(shù)結(jié)合圖像TFS信息對羊肉中TEAC進行無損檢測, 并提高其預(yù)測性能, 為實時快速定量檢測灘羊肉中TEAC提供參考。
灘羊肉采購于寧夏鹽池鑫海食品有限公司。 分別取不同灘羊背最長肌、 前腿肉和后腿肉, 保存在0~4 ℃保溫箱中運至實驗室, 剔除肉樣表面多余的筋膜、 結(jié)締組織和脂肪, 4 ℃冰箱排酸24 h, 分割為30 mm×20 mm×10 mm的羊肉樣本180個(隨機選取6只灘羊三個部位采樣, 每部位肉樣10份, 真空包裝后標記。 按3∶1的比例劃分為校正集和預(yù)測集。
Vis/NIR高光譜成像系統(tǒng)有125個波長, 波長范圍為400~1 000 nm(Headwall Photonics公司, 美國)。 該系統(tǒng)由成像光譜儀、 電控位移平臺、 4個光纖鹵素燈(150 W)、 增強型CCD相機、 計算機和數(shù)據(jù)采集軟件組成。 使用高光譜前應(yīng)預(yù)熱30 min, 圖像采集前進行黑白校正[5], 肉樣用紙巾擦拭表面水分。
參考Anticona[6]的方法并進行修改。 吸取6 mL ABTS·+溶液和50 μL的肌肉提取液進行混合, 30 ℃下孵育6 min, 用50 μL超純水和6 mL ABTS·+溶液混合做空白對照。 在734 nm下測定吸光度, 通過已知濃度的生育酚溶液繪制標準曲線。 結(jié)果以μmol·g-1生育酚當量表示。
1.4.1 感興趣區(qū)域提取
使用ENVI 4.8軟件, 采用閾值分割法提取感興趣區(qū)域(region of interest, ROI), 設(shè)置閾值為0.12, 將樣本與背景分開得到二值化圖像, 并將整個樣本圖像(約2500像素)作為感興趣區(qū)域[7]。
1.4.2 預(yù)處理方法
原始光譜數(shù)據(jù)含有暗電流噪聲和儀器基線漂移等, 因此需要通過光譜預(yù)處理方法來消除和校正干擾無關(guān)信息。 其中平滑是消除噪聲最常用的方法之一, 通過減少圖像噪聲對數(shù)據(jù)點數(shù)值的干擾, 提高信噪比。 主要有中值濾波(median filtering, MF)、 基線校準(baseline)、 卷積平滑(savitzky-golay, S-G)。 多元散射校正(multiplicative scatter correction, MSC)作為校正變換類的光譜預(yù)處理方法, 不僅能夠增強光譜信息的顯示, 而且能有效消除樣品散射所導(dǎo)致的基線偏移和平移現(xiàn)象, 提高光譜信噪比[8]。 故采用以上四種算法以增強光譜信號并提高模型預(yù)測性能。
1.4.3 特征波長選擇方法
間隔隨機蛙跳(interval random frog, IRF)算法可以根據(jù)所定義的策略來更新變量的子集。 在滿足迭代時間后, 計算每個波段被選擇的概率, 并按降序排列[9]。 變量組合集群分析(variable combination population analysis, VCPA)算法根據(jù)模型總體分析, 在可變子集總體構(gòu)建的模型群體中提取統(tǒng)計信息, 以迭代方式進行最優(yōu)的變量子集選擇[10]。 競爭性自適應(yīng)加權(quán)抽樣(competitive adaptive reweighted sampling, CARS)算法將有較大絕對回歸系數(shù)的波長識別為關(guān)鍵波長, 權(quán)重小的波長[11]。 迭代變量子集優(yōu)化(iteratively variable subset optimization, IVSO)算法具有較高的穩(wěn)定性, 原因是該算法使用順序加法和加權(quán)二進制矩陣采樣的方法, 以競爭方式消除非關(guān)鍵變量信息, 同時降低丟失關(guān)鍵變量的風險[12]。
1.4.4 圖像TFS信息的提取
TFS信息表示相鄰像素之間的強度關(guān)系, 常用于解釋和量化圖像中的灰度值。 灰度共生矩陣(gray level co-occurrence matrix, GLCM)常用于提取TFS, 具有適應(yīng)性強、 魯棒性好的特點。 用于計算圖像中像素之間不同灰度組合頻率, 以此反映樣本外部特征中最重要的指標。 本研究基于主成分分析(principal component analysis, PCA)選擇的特征圖像, 依次選取羊肉樣本信息表達量前三的PC圖像在0°、 45°、 90°、 135°四個方向下的角二矩陣、 對比度、 相關(guān)性和熵的特征參數(shù)來表示羊肉樣本的TFS[13], 分別記為TF1、 TF2、 TF3、 TF4。
1.4.5 模型建立
基于光譜信息和圖像紋理信息建立羊肉中TEAC的反向傳播人工神經(jīng)網(wǎng)絡(luò)(back-propagation artificial neural network, BP-ANN)和最小二乘支持向量機(least squares support vector machines, LSSVM)預(yù)測模型。 BP-ANN在前向傳播過程中若輸出信息的期望值存在誤差, 則誤差將沿著原始路徑重新傳播, 通過逐個修改每一層神經(jīng)元的權(quán)重, 以減少誤差, 直到結(jié)果的輸出滿足精度要求[14]。 LSSVM是一類基于核的學(xué)習(xí)方法, 廣泛應(yīng)用于執(zhí)行非線性多元數(shù)據(jù)分析[4]。 以校正集相關(guān)系數(shù)(Rc)、 校正集均方根誤差(RMSEC)、 預(yù)測集相關(guān)系數(shù)(Rp)、 和預(yù)測集均方根誤差(RMSEP)進行評估預(yù)測模型性能的可靠性和準確性。
1.4.6 數(shù)據(jù)處理工具
數(shù)據(jù)處理軟件采用MATLAB R2019 a、 ENVI 4.8和Origin 2018。 數(shù)據(jù)分析用Intel core I5-10210 CPU, 主頻1.6 GHz、 RAM為8 GB、 NVIDIA MX250、 顯存為2 GB的計算機。
灘羊肉樣品在Vis區(qū)域(400~750 nm)和NIR區(qū)域(750~1 000 nm)均有譜帶。 對樣品的平均反射率曲線進行了比較和分析。 從光譜曲線可以看出, 不同部位肉樣的平均光譜曲線具有相似的趨勢, 但光譜縱向位移有很大的差異。 如圖1所示, 不同部位的灘羊肉樣品在434、 545、 573、 756和967 nm處均具有吸收帶。 在434 nm左右的吸收是由于肉樣中血紅素輔基中的π—π*鍵振動, 這種色素與肉色有關(guān)[15]。 545~573 nm范圍內(nèi)的吸收, 與肌紅蛋白(氧合肌紅蛋白和脫氧肌紅蛋白)和肉色的a*值高度相關(guān)[16]。 760 nm附近的吸光度帶與O—H拉伸第三倍頻或肌紅蛋白氧化相關(guān), 970 nm左右的吸收峰與O—H彎曲的第二倍頻有關(guān)[17]。
圖1 灘羊肉樣本的原始光譜(a)和平均光譜曲線(b)
為了提高重疊數(shù)據(jù)的光譜分辨率, 利用四種預(yù)處理方法建立PLSR的預(yù)測模型。 同時在不同預(yù)處理下提取潛在變量(latent variables, LV)以降低數(shù)據(jù)維度, 去除冗余信息, 同時保留了原始數(shù)據(jù)中的有效信息。 通過建立PLSR模型評價不同預(yù)處理方法的效果, 結(jié)果如表1所示, 與TEAC的原始光譜模型效果相比, S-G預(yù)處理后的光譜模型性能較低, 可能是由于S-G算法消除了與TEAC含量相關(guān)的有效光譜信息。 使用Baseline預(yù)處理建立的PLSR模型呈現(xiàn)出最高的相關(guān)系數(shù),Rc為0.912 1,Rp為0.868 3, RMSECV為1.407 5。 這可能是Baseline對光譜圖像具有較好的濾波作用, 與此同時可以保護信號的邊緣數(shù)據(jù)。 Dixit[18]等在對牛肉成分分析時同樣發(fā)現(xiàn)經(jīng)Baseline處理后可獲得更清晰的樣品特征。 因此, 將Baseline預(yù)處理作為TEAC的全樣本數(shù)據(jù)信號, 并進行后續(xù)建模。
表1 PLSR模型利用不同預(yù)處理數(shù)據(jù)的預(yù)測結(jié)果
為了在一定程度上提高模型的預(yù)測性能, 采用IRF、 VCPA、 CARS和IVSO對全波段光譜進行降維處理, 結(jié)果如圖2所示。 圖2(a)為IRF算法提取特征波長結(jié)果, 當組合間隔為48時可使RMSECV達到最小值(1.268 4)。 此時選取前48個組合波段, 共71個波長, 分布在434~607和665~823 nm區(qū)域, 占全光譜的56.8%。 圖2(b)為應(yīng)用VCPA算法提取特征波長結(jié)果, 在RMSECV達到最小值(1.234 5)時, 此時采樣數(shù)為50, 共篩選出478、 492、 550、 607、 703、 785、 790、 871和895 nm 9個特征波長, 占全光譜的7.2%。 圖2(c)為采用CARS算法提取特征波長的結(jié)果, 共篩選出22個特征波長, 占全光譜的17.6%, 分別為434、 454、 458、 478、 492、 559、 579、 603、 607、 670、 713、 727、 785、 790、 828、 833、 867、 871、 895、 924、 943和972 nm。 圖2(d)為IVSO算法權(quán)重值變化, 通過IVSO算法篩選出39個特征波長, 占全光譜的31.2%, 分別為434、 444~458、 478、 487~497、 506、 550~564、 574、 579、 607、 636、 684、 727、 780~795、 833、 847、 857、 867、 871、 881、 895、 910、 915、 924、 943、 963、 977~987和996 nm。 分析發(fā)現(xiàn)478、 492、 607、 785、 790 nm為共有特征波長, 其中492 nm與高鐵肌紅蛋白有關(guān)[19], 而高鐵肌紅蛋白會受到細胞內(nèi)氧化還原水平影響, 這可能與TEAC含量存在間接關(guān)系。 提取特征波長后, 可以大幅減少圖像大小, 特征更加突出, 這在一定程度上會增加非線性關(guān)系, 但同時又有助于減輕硬件需求和計算負載[20]。
圖2 優(yōu)選特征波長
使用ENVI 4.8軟件, 通過正向主成分統(tǒng)計方法對灘羊肉樣本光譜圖像進行主成分分析, 如圖3所示, PC1、 PC2、 PC3累計貢獻率大于99%, 其中PC1、 PC2、 PC3表達分別為98.76%、 0.75%、 0.09%, 可見PC1包含了部分信息的同時又能有效去除冗余信息。 因此對表達量最多的PC1分別從θ=0°、 45°、 90°、 135°角度下對角二矩陣、 對比度、 相關(guān)性和熵進行TFS信息提取。 通過對肉樣感興趣區(qū)域圖像的四個紋理變量計算, 得到一個紋理信息矩陣, 180樣本×4變量。
圖3 羊肉樣本前三個PC圖像
2.5.1 特征光譜預(yù)測模型建立
基于多種特征波長篩選方法(CARS、 VCPA、 IRF和IVSO)建立的TEAC模型的預(yù)測效果如表2所示, 當采用BP-ANN建立預(yù)測模型時, 雖然CARS-BP-ANN模型具有最高的Rp, 但其校正集Rc僅為0.8189。 因此, IVSO-BP-ANN模型的效果最佳(Rc=0.887 5, RMSEC=1.113 1,Rp=0.863 0, RMSEP=1.126 6); IVSO-LSSVM模型體現(xiàn)出最佳的預(yù)測能力(Rc=0.913 2, RMSEC=0.962 0,Rp=0.864 6, RMSEP=1.288 3)。 對比不同特征波長提取算法下的兩種模型, 發(fā)現(xiàn)LSSVM模型中Rc值整體比BP-ANN模型較高, 且使用IVSO方法顯示出更好的預(yù)測能力, 說明IVSO算法可有效篩選出與TEAC含量相關(guān)的特征波長并去除冗余波段。 因此, IVSO-LSSVM模型預(yù)測TEAC性能最佳。
表2 BP-ANN和LSSVM模型在不同波長提取方法下的性能
2.5.2 光譜數(shù)據(jù)結(jié)合TFS信息預(yù)測模型建立
在提取特征波長后, 數(shù)據(jù)維度大幅度降低, 特征更加突出, 在一定程度上會增加非線性關(guān)系, 而BP-ANN和LSSVM預(yù)測模型對非線性數(shù)據(jù)具有較好的預(yù)測能力。 根據(jù)特征波長建模結(jié)果, 使用IVSO算法提取的特征波長與肉樣紋理信息融合建立TEAC含量的BP-ANN和LSSVM預(yù)測模型如表3所示, 表3給出了對不同TFS信息的校準集和預(yù)測集的性能。 結(jié)果表明, IVSO-TF1-BP-ANN圖譜融合模型穩(wěn)健性較好, 其Rp=0.891 6, 較特征波段提高0.028 6, 圖譜融合模型較單一模型相比提高了預(yù)測能力。 紋理是肉樣的外部屬性, 是顏色灰度空間產(chǎn)生的圖像模式, 融合后的模型具有更好的預(yù)測能力, 說明融合肉樣的外部TFS可行。
表3 不同TFS融合BP-ANN和LSSVM模型對TEAC的評價結(jié)果
采用Vis/NIR高光譜技術(shù)結(jié)合圖像紋理信息建立灘羊肉中TEAC預(yù)測模型, 主要結(jié)論如下:
(1)經(jīng)不同算法預(yù)處理后建立PLSR模型, 發(fā)現(xiàn)Baseline-PLSR模型具有最佳性能, 其Rc=0.912 1, RMSEC=0.963 5, RMSECV=1.407 5,Rp=0.868 3, RMSEP=1.277 0。
(2)采用IRF、 VCPA、 CARS和IVSO分別提取出了71、 9、 22和39個代表性特征波長, 占全光譜的56.8%、 7.2%、 17.6%、 31.2%。
(3)評估多種特征波長算法下建立的BP-ANN和LSSVM模型性能, 結(jié)果顯示: 最優(yōu)的TEAC預(yù)測模型為Baseline-IVSO-LVSSM(Rc=0.913 2, RMSEC=0.962 0,Rp=0.864 6, RMSEP=1.288 3)。
(4)TEAC圖譜融合模型IVSO-TF1-BP-ANN顯示出較好的效果, 其Rp為0.891 6, 相比于單一的光譜信息模型提高了0.028 6。
采用Vis/NIR高光譜成像技術(shù), 將光譜信息融合圖像TFS建立了羊肉樣品中TEAC的定量預(yù)測模型, 取得了較好的預(yù)測效果, 但仍有以下可改進的方面:
(1)可以優(yōu)化光譜數(shù)據(jù)的采集和處理方法, 以提高數(shù)據(jù)的精確性和穩(wěn)定性。
(2)利用高光譜顯微成像方法, 以在細胞和組織水平上對物質(zhì)進行分析。
(3)雖然光譜與紋理特征相結(jié)合對模型判斷能力具有一定提升, 但如何從高光譜圖像中提取與肉質(zhì)高度相關(guān)的特征并進行融合, 有待進一步研究。