陳杰 張曉 姚娜 王亞明
(塔里木大學(xué)信息工程學(xué)院,新疆 阿拉爾 843300)
與豬肉、牛肉相比,羊肉肉質(zhì)較細(xì)膩,蛋白質(zhì)和維生素的含量都很高,并且它的脂肪和膽固醇等物質(zhì)含量較低。常吃羊肉對(duì)增強(qiáng)人體免疫能力和能提高整體的身體素質(zhì)都有很好的幫助。在新疆南部地區(qū),由于維吾爾族同胞比例相對(duì)較大,對(duì)羊肉的需求量更是大于其他地區(qū)。南疆塔里木河流域出產(chǎn)的羊肉品質(zhì)最優(yōu),它不僅肉質(zhì)細(xì)膩,而且膻味和腥味較小,受到各族人們的喜愛(ài)[1]。隨著民眾生活消費(fèi)水準(zhǔn)的提升,人們對(duì)肉的品質(zhì)要求越來(lái)越高。在羊肉的品質(zhì)特性中,嫩度是評(píng)判羊肉質(zhì)量的重要指標(biāo)之一,也是消費(fèi)者最重視的感官指標(biāo),其高低直接影響著肉的食用價(jià)值和經(jīng)濟(jì)價(jià)值。肉的嫩度是指肉在食用時(shí)對(duì)肌纖維碎裂的抵抗力,反映了肉的質(zhì)地,是肌肉中各種蛋白質(zhì)結(jié)構(gòu)特性的總體概括。嫩度的客觀(guān)評(píng)價(jià)是對(duì)定型肉塊進(jìn)行剪切力測(cè)定,剪切力值越低肉嫩度越好[2]。
近幾年,近紅外光譜技術(shù)的發(fā)展較快,它具有快速高效檢測(cè)的優(yōu)點(diǎn),已經(jīng)在肉制品品質(zhì)檢測(cè)中廣泛的應(yīng)用[3-4],這種無(wú)損快速檢測(cè)技術(shù)也較多的用于肉品的嫩度檢測(cè)研究[5]。關(guān)于肉類(lèi)嫩度研究大多是針對(duì)牛肉和豬肉嫩度檢測(cè)和嫩度分級(jí)[6],羊肉的嫩度研究較少。Park等[7]使用波長(zhǎng)為1 100~2 498 nm內(nèi)獲得的近紅外光譜,來(lái)分析測(cè)定牛肉背長(zhǎng)肌的嫩度,得到的嫩度值相關(guān)系數(shù)為0.692,并且建立了預(yù)測(cè)牛肉嫩度的模型;趙杰文等[8]采用多元線(xiàn)性回歸方法對(duì)新鮮牛肉所吸收的近紅外光譜曲線(xiàn)和剪切力的值建立了牛肉嫩度預(yù)測(cè)模型;張德權(quán)等[9]曾使用偏最小二乘法分析研究了羊肉的近紅外光譜和嫩度的關(guān)系,所建立的模型相關(guān)性達(dá)到0.862,但是,文中僅使用相關(guān)性對(duì)建立的模型進(jìn)行了研究,沒(méi)有涉及到交叉驗(yàn)證均方差、預(yù)測(cè)均方差、預(yù)測(cè)精度。本文使用連續(xù)投影算法結(jié)合最小二乘法建立羊肉嫩度和近紅外光譜的模型,評(píng)價(jià)指標(biāo)使用交叉驗(yàn)證均方差、預(yù)測(cè)均方差、預(yù)測(cè)精度和相關(guān)系數(shù)來(lái)衡量。連續(xù)投影算法(SPA)[10-11]的優(yōu)點(diǎn)是可以提取全波段的幾個(gè)特征波長(zhǎng),這種算法能夠消除原始光譜數(shù)據(jù)中冗余的信息,預(yù)測(cè)速度相對(duì)較快[12],近年來(lái),國(guó)內(nèi)外學(xué)者在利用光譜分析技術(shù)檢測(cè)作物和食品中某些重要成分的含量時(shí)利用了連續(xù)投影算法做有效波長(zhǎng)的選?。?3-14]。
常見(jiàn)的數(shù)據(jù)建模方法有多元線(xiàn)性回歸法、主成分分析法、主成分回歸法、偏最小二乘法、人工神經(jīng)網(wǎng)絡(luò)方法和支持向量機(jī)等方法[15]。最小二乘法集成了典型相關(guān)分析、主成分分析以及線(xiàn)性回歸分析的優(yōu)點(diǎn),它能解決的最典型的問(wèn)題就是自變量之間的多重相關(guān)性。很多時(shí)候,樣例很少,甚至比變量的維度還少,變量之間又存在多重相關(guān)性的問(wèn)題,這時(shí)最小二乘法就開(kāi)始發(fā)揮它的作用[16]。
一個(gè)建模算法預(yù)測(cè)評(píng)價(jià)指標(biāo)的衡量參數(shù)有:交叉驗(yàn)證均方差、預(yù)測(cè)均方差、預(yù)測(cè)精度和相關(guān)系數(shù)。交叉驗(yàn)證均方差、預(yù)測(cè)均方差可以用來(lái)定量分析模型的性能以及評(píng)價(jià)指標(biāo),而最小二乘法就是為了尋求一條直線(xiàn)來(lái)擬合所有的點(diǎn),使得這條直線(xiàn)到所有的點(diǎn)之間的均方根誤差最?。幌嚓P(guān)系數(shù)的絕對(duì)值是在區(qū)間[0,1]分布的數(shù)值,越接近1,說(shuō)明數(shù)據(jù)相關(guān)性越強(qiáng),預(yù)測(cè)精度就越高。
本研究在前人對(duì)鮮肉研究的基礎(chǔ)上以南疆小尾寒羊后腿肉的嫩度為研究對(duì)象,使用近紅外光譜儀進(jìn)行采集光譜數(shù)據(jù),使用C-LM4型數(shù)顯式肌肉嫩度儀進(jìn)行肌肉嫩度測(cè)量,根據(jù)光譜數(shù)據(jù)和肌肉嫩度數(shù)據(jù),采用連續(xù)投影法選取特征波長(zhǎng)分布對(duì)原始光譜數(shù)據(jù)和經(jīng)過(guò)多元散射校正預(yù)處理后的光譜數(shù)據(jù)進(jìn)行提取特征波長(zhǎng),根據(jù)提取出來(lái)的特征波長(zhǎng)采用偏最小二乘法針對(duì)訓(xùn)練集建立嫩度和近紅外光譜的嫩度模型,并對(duì)預(yù)測(cè)集進(jìn)行嫩度預(yù)測(cè),采用評(píng)價(jià)指標(biāo)的衡量參數(shù)來(lái)檢驗(yàn)?zāi)P褪欠窈细瘛?/p>
近紅外光譜儀(JDSU-MicroNIR 1700),北京凱元盛世,掃描波長(zhǎng)900~1 800 nm;剪切儀(C-LM4),沃-布;手術(shù)刀;無(wú)菌刀;保鮮袋;電熱恒溫水浴鍋(HH-M4,四孔),上海赫田;冰箱(BCD-329),海爾;溫度計(jì)和干燥切板。
試驗(yàn)樣品使用宰后24 h排酸后的小尾寒羊的新鮮羊后腿肉,切成6 cm×6 cm×4 cm的塊狀,共180塊肉樣,保存在4℃的冰箱中,逐一取出,擦干表面水分進(jìn)行采集光譜數(shù)據(jù)和嫩度數(shù)據(jù)。
(1)近紅外光譜儀打開(kāi)預(yù)熱30 min后將白板放在光譜儀器下2 mm處進(jìn)行校光;
(2)取下白板,放鮮羊肉樣品,肉表面要平整,與鏡頭仍保持2 mm的距離;測(cè)量在900~1 700 nm之間的光譜數(shù)據(jù);(測(cè)量三次,測(cè)量間隔是5 s,取平均值)
(3)采集完光譜信息的羊肉裝入保鮮袋包好,肉樣中心插入溫度計(jì),放進(jìn)恒溫水浴鍋中加熱(水浴鍋溫度設(shè)定為80℃恒溫狀態(tài));
(4)當(dāng)溫度計(jì)讀數(shù)達(dá)到70℃(此溫度和恒溫鍋的溫度根據(jù)NY/T 1180—2006農(nóng)業(yè)行業(yè)標(biāo)準(zhǔn)選取)時(shí),取出肉樣放到冰箱冷卻到4℃,放置時(shí)間為24 h。取出后順著肌肉纖維取樣,樣本大小3 cm×3 cm×4 cm,樣本數(shù)為3;
(5)使用剪切儀垂直肌肉纖維方向剪切肉條,記錄數(shù)據(jù),數(shù)據(jù)單位為kgf,剪切三次取平均值。
近紅外光譜主要是由于分子振動(dòng)的非諧振性使得分子從基態(tài)向高能級(jí)躍遷產(chǎn)生的,主要是對(duì)含氫基團(tuán)振動(dòng)的倍頻和合頻的吸收,由于不同基團(tuán)產(chǎn)生的光譜在吸收強(qiáng)度上是不同的,因此隨著樣品組成的變化及其光譜特性也發(fā)生變化,從而為近紅外光譜分析樣品的物理性質(zhì)提供了基礎(chǔ)[17]。近紅外光譜分析不同于化學(xué)分析方法,它是一種間接分析技術(shù),需要用統(tǒng)計(jì)方法在樣品的嫩度屬性與近紅外光譜數(shù)據(jù)建立一個(gè)訓(xùn)練模型,這就需要采集一些樣本的光譜和嫩度數(shù)據(jù)建立訓(xùn)練集,一般采集的近紅外光譜會(huì)包含一些與待測(cè)樣本性質(zhì)無(wú)關(guān)的因素帶來(lái)的干擾,導(dǎo)致基線(xiàn)漂移、高頻隨機(jī)噪聲和光散射[18],此外在采集的過(guò)程中沒(méi)有經(jīng)過(guò)化學(xué)處理,所以直接采集的近紅外光譜數(shù)據(jù)可能會(huì)出現(xiàn)背景復(fù)雜化的情況,因此對(duì)原始近紅外光譜數(shù)據(jù)進(jìn)行預(yù)處理是非常有必要的。采用上述實(shí)驗(yàn)方法獲得180組羊肉的近紅外光譜數(shù)據(jù),得到有效數(shù)據(jù)174組,采用matlab2016軟件進(jìn)行分析處理,原始光譜曲線(xiàn)如圖1所示。原始嫩度數(shù)據(jù)的直方圖如圖2所示,它顯示了整體嫩度數(shù)據(jù)的分布情況,可以看出數(shù)據(jù)的產(chǎn)生過(guò)程比較穩(wěn)定。數(shù)據(jù)預(yù)處理方法有很多種,如一階導(dǎo)數(shù)法、二階導(dǎo)數(shù)法、S-G平滑法、小波變換法、多元散射校正等,本文在對(duì)比了多種預(yù)處理方法之后決定使用多元散射校正法進(jìn)行數(shù)據(jù)預(yù)處理,這種方法能有效地去除外在因素對(duì)光譜造成的影響,可以從圖3看出這種預(yù)處理方法消除了很多冗余信息,對(duì)整個(gè)數(shù)據(jù)的影響較大。
圖2 羊肉嫩度直方圖圖
圖3 多元散射校正預(yù)處理之后的光譜
根據(jù)交叉驗(yàn)證法中的留一法的算法[19],即把整個(gè)數(shù)據(jù)分成N組,每組選一個(gè)數(shù)據(jù)作為測(cè)試集,最終通過(guò)比較,174組數(shù)據(jù)中分成7組,選24個(gè)樣本作為測(cè)試集時(shí)最合適的。
文中采用SPA算法對(duì)原始數(shù)據(jù)和多元散射校正預(yù)處理后的數(shù)據(jù)分別進(jìn)行數(shù)據(jù)處理。對(duì)原始數(shù)據(jù)的處理中,在RMSE=0.573 26的情況下選取了五個(gè)特征波長(zhǎng),如圖4和圖5所示,波長(zhǎng)分別是907 nm、967 nm、1 264 nm、939 nm和1 511 nm。對(duì)從原始數(shù)據(jù)獲取的特征波長(zhǎng)使用最小二乘法進(jìn)行建模,從174組實(shí)驗(yàn)樣品數(shù)據(jù)中選取150組進(jìn)行建模,其他24組樣品用來(lái)驗(yàn)證模型。圖8為使用特征波長(zhǎng)對(duì)原始數(shù)據(jù)的最小二乘法建模預(yù)測(cè)效果圖,交叉驗(yàn)證均方差為0.121 62,預(yù)測(cè)均方差為0.573 26,預(yù)測(cè)精度為0.958 47,相關(guān)系數(shù)的數(shù)值是0.859 41,滿(mǎn)足了建模和預(yù)測(cè)的基本需求。
圖4 SPA對(duì)原始數(shù)據(jù)選取的特征變量數(shù)目
圖5 SPA對(duì)原始數(shù)據(jù)選取的特征變量
結(jié)合最小二乘法使用特征波長(zhǎng)對(duì)多元散射校正(MSC)預(yù)處理后的數(shù)據(jù)進(jìn)行處理,在RMSE=0.508 73的情況下選取了五個(gè)特征波長(zhǎng),如圖6和圖7所示,波長(zhǎng)分別是 907 nm、989 nm、1 117 nm、939 nm和1 735 nm。對(duì)上述特征波長(zhǎng)使用最小二乘法進(jìn)行建模,從174組實(shí)驗(yàn)樣品數(shù)據(jù)中選取150組進(jìn)行建模,其他24組樣品用來(lái)驗(yàn)證模型。圖9為使用特征波長(zhǎng)對(duì)多元散射校正預(yù)處理后的數(shù)據(jù)的最小二乘法建模預(yù)測(cè)效果圖,交叉驗(yàn)證均方差為0.181 25,預(yù)測(cè)均方差為0.508 73,預(yù)測(cè)精度為0.963 29,預(yù)測(cè)精度明顯提高,相關(guān)系數(shù)的數(shù)值提升到0.877 5,可見(jiàn),多元散射校正在去噪聲、去散射等方面有很好的作用。表1給出了兩種數(shù)據(jù)進(jìn)行建模的預(yù)測(cè)情況,可以更直觀(guān)的看出對(duì)多元散射校正預(yù)處理后建立的模型的預(yù)測(cè)效果明顯好于對(duì)原始信號(hào)進(jìn)行建模。
圖6 SPA對(duì)MSC預(yù)處理后的數(shù)據(jù)特征變量選取的數(shù)目
圖7 SPA對(duì)MSC預(yù)處理后的數(shù)據(jù)選取的特征變量情況
圖8 特征波長(zhǎng)對(duì)原始數(shù)據(jù)建立模型圖
圖9 特征波長(zhǎng)對(duì)MSC預(yù)處理過(guò)的數(shù)據(jù)建立模型
表1 羊肉訓(xùn)練集和預(yù)測(cè)集嫩度信息表
文中使用SPA對(duì)原始數(shù)據(jù)和經(jīng)過(guò)多元散射校正預(yù)處理之后的數(shù)據(jù)進(jìn)行篩選特征波長(zhǎng),選中的特征波長(zhǎng)個(gè)數(shù)均為5,篩選出的特征波長(zhǎng)有兩對(duì)是相同的,可見(jiàn)多元散射校正預(yù)處理方法在去掉冗余信息的同時(shí)能保存數(shù)據(jù)的原始狀態(tài)。針對(duì)篩選的特征波長(zhǎng)使用最小二乘法進(jìn)行建模,174組數(shù)據(jù)隨機(jī)選出150組用作訓(xùn)練集,24組用作測(cè)試集。從建模后的嫩度預(yù)測(cè)的參數(shù)可以看出使用多元散射校正預(yù)處理數(shù)據(jù)建立的模型預(yù)測(cè)能力明顯優(yōu)于原始數(shù)據(jù)。這一結(jié)論對(duì)相關(guān)方面的研究有很好的指導(dǎo)作用。