白宗秀,朱榮光,王世昌,鄭敏沖,顧劍峰,崔曉敏,張垚鑫
(石河子大學(xué)機(jī)械電氣工程學(xué)院,石河子 832003)
羊肉因其營養(yǎng)豐富、脂肪含量低,且具有獨(dú)特的風(fēng)味和細(xì)膩的口感而深受人們的喜愛[1]。近年來羊肉價(jià)格不斷上漲,一些不法商家在巨大經(jīng)濟(jì)利益誘惑下,鋌而走險(xiǎn)用狐貍?cè)獾鹊蛢r(jià)值肉類冒充羊肉。將狐貍?cè)鈸饺胙蛉?,其微生物?yán)重超標(biāo),投入市場不僅嚴(yán)重影響消費(fèi)者身體健康,同時(shí)也擾亂了肉類食品市場秩序[2]。因此,亟待尋求一種快速無損檢測羊肉中狐貍?cè)鈸郊俚姆椒ā?/p>
傳統(tǒng)肉類摻假檢測手段主要包括感官檢驗(yàn)、色譜分析、免疫分析、DNA分析等[3-5]。隨著肉類摻假手段提高,感官檢驗(yàn)已無法適應(yīng)需求,而色譜分析的適用對象受限、免疫分析和DNA分析均有技術(shù)要求高、操作復(fù)雜的缺點(diǎn)也無法滿足檢測要求。近年來,光譜技術(shù)由于操作簡單、快速、無損等特點(diǎn)而被廣泛應(yīng)用于肉及肉制品摻假檢測[6-7]。其中,高光譜成像(HyperspectralImaging,HSI)技術(shù)能夠通過光譜信號檢測樣本化學(xué)成分,在肉品品質(zhì)檢測如新鮮度[8]、水分[9]、脂肪[10]、嫩度[11]、菌落總數(shù)[12]和摻假[13-15]檢測中均取得了較多研究成果。
高光譜圖像由高維空間數(shù)據(jù)和光譜數(shù)據(jù)組成,其中包含了波長間的冗余信息,為了提高數(shù)據(jù)處理效率,需進(jìn)行特征波長篩選。傳統(tǒng)的特征波長篩選方法主要有遺傳算法(Genetic Algorithm,GA)、競爭性自適應(yīng)重加權(quán)算法(Competitive Adaptive Reweighted Sampling,CARS)、連續(xù)投影法和無信息變量消除法等。選擇合適的特征波長篩選方法可以有效改善模型性能。二維相關(guān)光譜分析(Two-Dimensional Correlation Spectroscopy,2D-COS)是對被測樣品體系在受擾動過程中的光譜進(jìn)行相關(guān)性分析,得到光譜的二維尺度信息,包括同步和異步相關(guān)光譜,運(yùn)用相關(guān)分析對該過程中的譜圖進(jìn)行處理,可以得到與外部擾動密切相關(guān)的特征波長[16]。2018年,王文秀等[17-18]以貯藏時(shí)間為外擾,利用二維相關(guān)可見/近紅外光譜法優(yōu)選豬肉揮發(fā)性鹽基氮(Total Volatile Basic Nitrogen,TVB-N)特征變量,并利用二維相關(guān)可見-近紅外光譜結(jié)合支持向量機(jī)評價(jià)了豬肉新鮮度。同年,Cheng等[19]利用近紅外光譜數(shù)據(jù)結(jié)合異譜二維相關(guān)分析建立了豬肉肌原纖維冷凍貯藏過程中氧化損傷監(jiān)測模型。2019年,Jiang等[20]采用HSI技術(shù)結(jié)合2D-COS方法對牛肉中鴨肉摻假現(xiàn)象進(jìn)行了檢測和可視化研究。同年,王偉等[21]基于高光譜成像結(jié)合2D-COS方法對生鮮雞肉糜中大豆蛋白含量進(jìn)行了檢測。以上研究表明,HSI結(jié)合2D-COS方法在肉類摻假檢測中具有很好的應(yīng)用前景,但目前大部分研究僅是驗(yàn)證了2D-COS提取光譜特征變量的可行性,并未將其與傳統(tǒng)特征波長篩選方法進(jìn)行比較,且目前探討高光譜定量檢測羊肉糜中狐貍?cè)鈸郊俚目尚行匝芯繄?bào)道較為鮮見。
綜上,本研究利用HSI結(jié)合特征變量篩選對羊肉糜中狐貍?cè)鈸郊龠M(jìn)行了定量檢測。通過采集不同含量等級摻假樣品的高光譜圖像信息并獲取其代表性光譜數(shù)據(jù),建立光譜和摻假含量之間的定量關(guān)系,比較GA、CARS和2D-COS方法選擇的特征波長所建偏最小二乘回歸(Partial Least Squares Regression,PLSR)和支持向量回歸(Support Vector Regression,SVR)模型性能,選擇羊肉糜中狐貍?cè)鈸郊俸康淖顑?yōu)檢測模型。本研究建立的羊肉中狐貍?cè)鈸郊俸靠焖贆z測模型為其他肉類摻假檢測提供參考,同時(shí)為低成本肉類摻假快速檢測系統(tǒng)研發(fā)提供相應(yīng)的技術(shù)支持和理論依據(jù)。
試驗(yàn)所用羊肉樣品取自羊后腿部位,采購于新疆石河子西部牧業(yè)喀爾萬公司(中國),狐貍?cè)鈽悠啡∽?只冷凍狐貍,購于新疆生產(chǎn)建設(shè)兵團(tuán)六師六運(yùn)湖農(nóng)場(中國)。肉品運(yùn)至實(shí)驗(yàn)室后去除明顯脂肪和結(jié)締組織,切塊并充分絞碎成2~3 mm粒徑的肉糜,按照5%、10%、15%、20%、25%、30%、35%、40%、45%和50%的質(zhì)量分?jǐn)?shù)將狐貍?cè)饷訐饺胙蛉饷又?,每個(gè)樣品質(zhì)量約為20g,充分混勻后平鋪于直徑為10 cm,底面積為50 cm2的表面皿中,得到圓形或近圓形的餅狀肉樣,每個(gè)含量等級制備12個(gè)樣品,共得到120個(gè)摻假羊肉樣本。將試驗(yàn)樣品裝入真空袋密封包裝,標(biāo)號后放置于0 ℃冰柜內(nèi)待測。
本研究采用的高光譜圖像采集系統(tǒng)主要包括成像光譜儀(ImSpector V10E-QE,ImSpector公司,芬蘭)、線陣電荷耦合器件(Charge Coupled Device, CCD)相機(jī)(Infinity 3-1,Lumenera,加拿大)、光源(Fiber-Lter DC950型,DolanJenner公司,美國)、脈沖輸送裝置(SC300-1A,Zolix公司,中國)、暗箱和計(jì)算機(jī)等,如圖1所示,高光譜圖像數(shù)據(jù)采集軟件為SpecView。
1.3.1 高光譜圖像信息采集
高光譜圖像數(shù)據(jù)采集前,打開光源和相機(jī)預(yù)熱30 min,將樣品取出冰柜在室溫下放置5 min,恢復(fù)樣品顏色等理化性質(zhì)。高光譜圖像采集系統(tǒng)參數(shù)設(shè)置如下:光源角度與水平面約為60°,曝光時(shí)間為0.016 s,樣品與鏡頭間的距離為33.5 cm,圖像采集速度1.35 mm/s。試驗(yàn)過程中,用黑色卡紙盛放樣品。
為了消除光照不均勻和外部環(huán)境因素的影響,在數(shù)據(jù)處理前需對高光譜圖像數(shù)據(jù)進(jìn)行黑白校正[22]。保持與采集樣品圖像時(shí)的條件相同,通過遮蓋鏡頭并關(guān)閉光源獲得全黑標(biāo)定圖像IB、取下鏡頭蓋打開光源掃描標(biāo)準(zhǔn)白板獲得全白圖像IW,然后對原始圖像IR按照式(1)進(jìn)行黑白校正。
式中I為黑白校正后的圖像數(shù)據(jù),IR為采集的樣品原始光譜圖像數(shù)據(jù),IB為遮蓋鏡頭并關(guān)閉光源采集的黑校正標(biāo)定圖像數(shù)據(jù)(反射率接近0),IW為打開鏡頭蓋和光源采集的聚四氟乙稀白板標(biāo)定圖像數(shù)據(jù)(反射率接近99%)。
1.3.2 樣品代表性光譜信息的提取
對校正后的樣品圖像利用圖像分割法選擇樣品感興趣區(qū)域(Region of Interest,ROI),并提取各樣品代表性光譜信息[23]。代表性樣品原始圖像如圖2a所示,由于樣品在544.15和818.98 nm波長下的圖像灰度值相差較大,背景、陰影部分灰度值相差較小,因此利用波段減法使背景和陰影部分趨于全黑,然后通過二值化和掩膜處理得到去除背景和陰影后的樣品圖像如圖2b所示,同理利用波段加法運(yùn)算和掩膜處理去除樣品中明顯的脂肪與亮點(diǎn),得到樣品純肌肉部分(圖2c),以此作為樣品ROI(圖2d),提取ROI內(nèi)所有像素點(diǎn)平均光譜作為樣品代表性光譜數(shù)據(jù)。每個(gè)樣品的光譜包含953個(gè)波長,由于小于473 nm波長的光譜噪聲較大,故本研究選擇473~1 013 nm范圍內(nèi)的全部846個(gè)波長進(jìn)行特征波長的篩選及后續(xù)分析。
1.3.3 高光譜檢測羊肉中狐貍?cè)鈸郊俚臋C(jī)理分析
本研究使用的高光譜波段范圍為400~1 000 nm,主要包括可見光波段(400~700 nm)和近紅外波段(700~1 000 nm),其中,可見光波段的光譜特征主要是由樣本顏色特征引起的。近紅外波段的光譜特征主要與樣品中有機(jī)分子含氫基團(tuán)(O-H、N-H、C-H)振動的合頻和各級倍頻的吸收區(qū)有關(guān)。羊肉與狐貍?cè)饩鶎儆诩t肉,主要由蛋白質(zhì)、脂肪和水等組成,兩者在顏色和成分含量方面存在一定差異,將狐貍?cè)鈸饺胙蛉庵?,可以引起顏色和化學(xué)成分的變化,所以本研究利用高光譜檢測羊肉中 狐貍?cè)獾膿郊俸吭诶碚撋鲜强尚械摹?/p>
1.4.1 光譜信息預(yù)處理
獲取光譜數(shù)據(jù)時(shí),光譜曲線易受到外界因素的影響而包含大量噪聲和其他干擾信息,因此需對光譜進(jìn)行預(yù)處理,去除無關(guān)信息的干擾。本研究利用一階導(dǎo)數(shù)(First Derivative,1D)、中心化(Mean Center,MC)、多元散射校正(Multiplicative Scattering Correction,MSC)和標(biāo)準(zhǔn)正態(tài)變量變換(Standard Normalized Variate,SNV)4種常用的光譜預(yù)處理方法對原始光譜數(shù)據(jù)進(jìn)行預(yù)處理,并利用原始光譜和經(jīng)過預(yù)處理后的光譜數(shù)據(jù)建立羊肉中狐貍?cè)鈸郊俚腜LSR模型,采用留一法對其進(jìn)行內(nèi)部交叉驗(yàn)證,選擇交叉驗(yàn)證集決定系數(shù)(coefficient of determination,R2)最大和均方根誤差(Root Mean Square Error,RMSE)最小的模型對應(yīng)的方法為最優(yōu)光譜預(yù)處理方法[24]。
1.4.2 特征波長篩選
用傳統(tǒng)特征篩選方法GA、CARS和2D-COS方法篩選與羊肉中狐貍?cè)鈸郊俸棵芮邢嚓P(guān)的特征波長,并對特征波長所建模型性能進(jìn)行比較。GA算法篩選特征波長主要借鑒了生物界自然選擇和進(jìn)化機(jī)制,可以進(jìn)行自適應(yīng)全局優(yōu)化,通過交叉、選擇、變異實(shí)現(xiàn)群體中個(gè)體結(jié)構(gòu)的重組迭代優(yōu)化,淘汰掉較差的變量,保留好的變量,最終篩選出特征波長,其在光譜數(shù)據(jù)處理中得到了廣泛應(yīng)用[25]。CARS算法是以達(dá)爾文生物進(jìn)化理論為原則的變量篩選方法,其篩選變量的具體步驟如下:首先,隨機(jī)抽取樣本建立偏最小二乘模型,并計(jì)算回歸系數(shù)和每個(gè)變量對應(yīng)的權(quán)重;采用自適應(yīng)重加權(quán)采樣和指數(shù)衰減函數(shù)選擇每次循環(huán)中權(quán)重值大的變量,對變量進(jìn)行逐步淘汰,最終根據(jù)交互驗(yàn)證集RMSE最小的原則優(yōu)選出最佳的變量集合作為特征波長[26]。
該研究中2D-COS分析方法是以羊肉中摻入狐貍?cè)獾牟煌繛橥鈹_變量,利用經(jīng)1D預(yù)處理后的代表性樣品光譜數(shù)據(jù)進(jìn)行二維相關(guān)光譜分析,得到同步二維相關(guān)譜圖和自相關(guān)譜圖。同步二維相關(guān)譜圖是關(guān)于主對角線對稱分布的,在主對角線上出現(xiàn)的譜峰稱為自相關(guān)峰,即自相關(guān)譜圖的峰值。自相關(guān)峰表示樣本中化學(xué)基團(tuán)對摻假含量擾動的敏感程度,峰值越高,表明該處波長對摻假含量越敏感。結(jié)合同步二維相關(guān)譜圖中的等高線密集中心點(diǎn)位置和自相關(guān)譜峰強(qiáng)度即可確定與羊肉中狐貍?cè)夂棵芮邢嚓P(guān)的特征波長[27]。2D-COS分析過程所使用軟件為2D-Shige。
1.4.3 回歸模型構(gòu)建與模型評價(jià)
采用隔三選一法分別將每個(gè)含量等級中的12個(gè)樣品(共120個(gè)樣本)按照9∶3的比例分為校正集(90個(gè)樣本)和預(yù)測集(30個(gè)樣本)。利用PLSR和SVR建立羊肉中狐貍?cè)鈸郊俣款A(yù)測模型,并分別利用留一法和十折交叉法對PLSR模型和SVR模型進(jìn)行內(nèi)部交叉驗(yàn)證。
PLSR算法是一種多元數(shù)據(jù)分析方法,可以同時(shí)實(shí)現(xiàn)回歸建模、數(shù)據(jù)結(jié)構(gòu)簡化以及兩組變量間的相關(guān)分析,在光譜數(shù)據(jù)建模中得到了廣泛應(yīng)用[28]。本研究中PLSR算法是對摻假羊肉樣品的光譜反射率值矩陣和羊肉中狐貍?cè)鈸郊俚暮繕?biāo)簽矩陣同時(shí)進(jìn)行分解,在分解過程中考慮光譜信息和摻假含量信息之間的相互關(guān)系,加強(qiáng)對應(yīng)計(jì)算關(guān)系,從而保證獲得最佳的校正模型。
SVR算法是解決模式識別回歸問題的一種方法,其原理是將原問題通過一系列非線性變換轉(zhuǎn)化為高維空間的線性問題,并進(jìn)行線性求解,以解決多個(gè)特征因子的回歸問題[29]。本研究建立的SVR模型核函數(shù)選擇徑向基函數(shù)(Radial Basis Function, RBF),同時(shí)利用GA優(yōu)化算法尋求其核函數(shù)參數(shù)(g)、懲罰因子參數(shù)(c)和基本參數(shù)(p)的最優(yōu)參數(shù)組合。
回歸模型建立之后,通過數(shù)據(jù)集R2、RMSE和相對分析誤差(Residual Predictive Deviation,RPD)來評價(jià)模型預(yù)測效果,其中RPD計(jì)算如式(2)所示:
式中yi是第i個(gè)樣本的實(shí)際值,y?i是第i個(gè)樣本的預(yù)測值,是實(shí)際平均值,n是樣本個(gè)數(shù)。
當(dāng)R2值越大,RMSE值越小,代表回歸模型的效果越好。RPD為預(yù)測集標(biāo)準(zhǔn)差與RMSE的比值,用于證明模型的預(yù)測能力,當(dāng)RPD>2.5表示預(yù)測效果良好;當(dāng)1.5<RPD<2.5時(shí),表明模型預(yù)測能力是可信的,但預(yù)測精度有待提高;當(dāng)RPD<1.5時(shí),表明該預(yù)測模型不可接受,還需進(jìn)一步優(yōu)化。
本研究中摻假樣品光譜信息提取使用高光譜圖像處理軟件ENVI 4.7,光譜數(shù)據(jù)預(yù)處理、特征波長篩選及模型建立過程使用MATLAB 7.8軟件。
120個(gè)不同含量的羊肉中狐貍?cè)鈸郊贅悠返墓庾V反射率曲線如圖3a所示。其光譜曲線整體趨勢一致,光譜吸收峰主要出現(xiàn)在550、570、765和970 nm波長處。結(jié)合羊肉與狐貍?cè)饣瘜W(xué)成分和光學(xué)特性,570 nm波長處的吸收峰是由肉類所含高鐵肌紅蛋白引起的,765 nm波長處的吸收峰與羊肉摻假狐貍?cè)馄返鞍踪|(zhì)分子結(jié)構(gòu)中碳-氫(C-H)鍵和水中氧-氫(O-H)鍵的伸縮振動倍頻有關(guān),970 nm波長處出現(xiàn)的吸收峰與羊肉摻假狐貍?cè)馄分械乃置芮邢嚓P(guān),主要由水中O-H鍵伸縮振動的二級倍頻引起[30]。純羊肉與純狐貍?cè)獾钠骄庾V曲線如圖3b所示,2種純?nèi)獾钠骄庾V曲線趨勢一致,但其反射值存在顯著差異,說明羊肉和狐貍?cè)庠诨瘜W(xué)成分及結(jié)構(gòu)信息方面存在一定差異。以上結(jié)果表明,該研究獲取的樣本光譜信息能夠反映羊肉中不同含量狐貍?cè)鈸郊俚男畔ⅰ?/p>
本研究分別利用1D、MC、MSC和SNV4種方法對原始光譜進(jìn)行預(yù)處理,基于原始光譜和經(jīng)過不同方法處理后的光譜建立羊肉中狐貍?cè)鈸郊俸康腜LSR模型評價(jià)結(jié)果如表1所示。
表1 不同預(yù)處理方法下的摻假羊肉樣品的偏最小二乘回歸模型評價(jià)結(jié)果Table 1 Partial Least Squares Regression (PLSR) model evaluation results of adulterated mutton sample under different pre-processing methods
由表1可知,利用不同預(yù)處理方法處理后的光譜信息建立羊肉中狐貍?cè)鈸郊俸縋LSR模型時(shí),基于1D預(yù)處理后的光譜模型效果最優(yōu),其交叉驗(yàn)證集R2最大,RMSE最小,較無預(yù)處理相比可顯著改善模型預(yù)測性能,校正集、交叉驗(yàn)證集和預(yù)測集R2分別由0.925、0.894、0.896上升至0.940、0.911和0.912,RPD由2.37上升至2.73,表明1D預(yù)處理可以有效實(shí)現(xiàn)光譜數(shù)據(jù)基線校正并去除背景干擾,增強(qiáng)模型預(yù)測能力。經(jīng)該方法預(yù)處理后的光譜曲線如圖4所示,與原始平均光譜曲線比較發(fā)現(xiàn)(圖3a),經(jīng)過1D與處理后的光譜曲線有效加強(qiáng)了光譜數(shù)據(jù)差異(圖4),分別在526.82、572.10、629.64、750.14、826.10和949.57 nm波長處出現(xiàn)了明顯的吸收帶,并分別在553.45、590.18、656.09、771.94 nm波長處出現(xiàn)了明顯的反射帶。說明該預(yù)處理方法達(dá)到了很好的效果,后續(xù)本研究所用光譜數(shù)據(jù)均為經(jīng)過1D方法預(yù)處理后的數(shù)據(jù)。
2.3.1 遺傳算法(GA)篩選特征波長
利用GA算法進(jìn)行特征波長篩選,其主要參數(shù)設(shè)置如下:初始種群為50,變異概率為0.005,遺傳迭代次數(shù)為100、收斂率為0.5。利用GA算法篩選的特征波長在可見光波段主要分布在480、505 nm和528~695 nm波段范圍內(nèi),其對應(yīng)的光譜吸收峰主要與羊肉中的脫氧肌紅蛋白、硫肌紅蛋白和氧肌紅蛋白有關(guān)[31]。在近紅外區(qū)域(700~1 100 nm),特征波長分布較為密集,其中750 nm波長處的吸收帶與羊肉摻假狐貍?cè)馄分兴值腛-H三級倍頻有關(guān),910 nm波長與其所含醇類物質(zhì)的光譜吸收特性相關(guān),950 nm波長與其所含水密切相關(guān)[32]。以上研究結(jié)果表明利用GA算法進(jìn)行特征波長篩選,能夠得到與羊肉中狐貍?cè)鈸郊俸棵芮邢嚓P(guān)的特征波長信息,得到207個(gè)特征波長在全部846個(gè)波長光譜曲線的分布情況如圖5a所示。
2.3.2 競爭性自適應(yīng)重加權(quán)(CARS)算法篩選特征波長
利用CARS 算法對摻假羊肉光譜數(shù)據(jù)進(jìn)行特征波長篩選,其蒙特卡洛采樣次數(shù)設(shè)置為50。經(jīng)CARS算法篩選特征波長后得到34個(gè)特征波長在全部846個(gè)波長光譜曲線的分布情況如圖5b所示。主要分布在484~494、608~655、755~794、910~944和999~1 008 nm波段范圍內(nèi),同時(shí)在567和897 nm波長處也得到了特征波長。其中,567 nm波長是肉中高鐵肌紅蛋白的特征波長,765 nm波長與肉品蛋白質(zhì)分子結(jié)構(gòu)中C-H鍵和水中O-H鍵的伸縮振動倍頻有關(guān),900~950 nm波段范圍之間觀察到的吸收帶通常與水和脂肪中C-H三級倍頻有關(guān)[32],說明隨著羊肉中狐貍?cè)鈸郊俸康淖兓?,羊肉樣品中蛋白質(zhì)和水分含量也在發(fā)生變化。
2.3.3 二維相關(guān)光譜分析(2D-COS)方法篩選特征波長
為了更加清晰地得到二維相關(guān)光譜的自動峰,本研究將473~1 013 nm波段范圍劃分為473~600、600~700、700~800、800~900和900~1 013 nm 5個(gè)波段范圍,利用2D-COS分析方法選擇每個(gè)范圍內(nèi)與狐貍?cè)鈸郊俸肯嚓P(guān)的特征波長,各波段范圍2D-COS分析得到的自相關(guān)譜如圖6所示,自相關(guān)譜圖的峰值對應(yīng)的波長為與狐貍?cè)鈸郊俸棵芮邢嚓P(guān)的特征波長,峰值強(qiáng)度越高,表明該波長對摻假含量越敏感。由圖6可知,在473~600 nm波段范圍內(nèi),自相關(guān)譜圖中出現(xiàn)2個(gè)較強(qiáng)的峰值,分別在524.9和590.8 nm波長處,表明這2個(gè)波長與狐貍?cè)鈸郊俸孔兓休^強(qiáng)的相關(guān)性。在600~700 nm波段范圍內(nèi),分別在610.20和657.35 nm波長處有2自相關(guān)峰值,其中650 nm波長左右的吸收峰與羊肉中的脫氧肌紅蛋白、硫肌紅蛋白和氧肌紅蛋白有關(guān)[31]。在700~800 nm波段范圍內(nèi),分別在在710.57、722.67、752.06、772.58 nm波長處出現(xiàn)4個(gè)峰值,750 nm波長左右的吸收帶與O-H三級倍頻有關(guān)。在800~900 nm波段范圍內(nèi),在828.68 nm波長處出現(xiàn)一個(gè)較強(qiáng)的峰值,同時(shí)在846.85、869.62、886.58、896.38 nm波長處出現(xiàn)較弱峰值。在900~1 013 nm波段范圍內(nèi),僅在950.23 nm處出現(xiàn)1個(gè)峰值,其主要是與樣品中水的含量有關(guān)[32]。由此可得,利用2D-COS算法共篩選出14個(gè)特征波長,分析上述峰值對應(yīng)的波長,多與顏色、C-H和氮-氫(N-H)鍵有關(guān),主要是由與狐貍?cè)鈸饺胙蛉庖鸺〖t蛋白和水分變化有關(guān)。研究結(jié)果表明通過對不同摻假含量光譜進(jìn)行二維同步光譜特性解析,可以辨析出與之相關(guān)的特征波長。
2.4.1 偏最小二乘回歸(PLSR)模型結(jié)果與分析
分別利用經(jīng)1D方法處理后的全部846個(gè)波長和經(jīng)GA、CARS算法和2D-COS方法篩選的特征波長建立PLSR模型,對羊肉中不同含量的狐貍?cè)鈸郊龠M(jìn)行預(yù)測,根據(jù)模型回歸效果得到適用于羊肉中狐貍?cè)鈸郊俸繖z測的優(yōu)選模型,模型評價(jià)結(jié)果如表2所示。由表2可知,與全部波長相比,利用特征波長建立的PLSR模型輸入變量個(gè)數(shù)較少,模型性能有所提高。其中,GA算法篩選的特征波長個(gè)數(shù)為207,占全部波長總數(shù)的24.47%,其所建PLSR模型的校正集、交叉驗(yàn)證集和預(yù)測集的R2分別提高了1.86%、3.38%、2.44%,RPD由2.72上升至3.19,說明模型預(yù)測性能提升。CARS算法篩選的特征波長個(gè)數(shù)僅占全部波長總數(shù)的4.02%,其所建的PLSR模型的校正集、交叉驗(yàn)證集和預(yù)測集的R2值分別由0.940、0.911和0.912上升至0.969、0.958和0.937,RPD由2.72上升至3.35,表明模型性能顯著改善。利用2D-COS方法篩選后得到14個(gè)特征波長,與GA和CARS算法相比,特征波長個(gè)數(shù)減少,但其所建PLSR模型回歸性能較差。由此可得,當(dāng)利用全部波長和特征波長建立羊肉中狐貍?cè)鈸郊俸康腜LSR模型時(shí),CARS算法篩選的34個(gè)特征波長建立的模型性能最優(yōu),表明利用高光譜結(jié)合CARS-PLSR模型可以有效實(shí)現(xiàn)羊肉中狐貍?cè)鈸郊俚亩繖z測。
表2 不同數(shù)量波長的摻假羊肉樣品的偏最小二乘回歸模型評價(jià)結(jié)果Table 2 Partial Least Squares Regression (PLSR) model evaluation results of adulterated mutton sample under different number of wavelengths
2.4.2 支持向量回歸(SVR)模型結(jié)果與分析
利用全部波長和特征波長建立羊肉中狐貍?cè)鈸郊俸康腟VR模型時(shí),首先利用GA算法對SVR模型的參數(shù)g、c和p進(jìn)行尋優(yōu),目標(biāo)為交叉驗(yàn)證集RMSE最小,尋優(yōu)過程中,將GA算法的種群數(shù)量設(shè)置為20,終止迭代次數(shù)設(shè)為100,選擇十折交叉驗(yàn)證。SVR模型尋優(yōu)后的參數(shù)與模型評價(jià)結(jié)果如表3所示。由表3可知,基于不同數(shù)量波長所建的羊肉中狐貍?cè)鈸郊俸縎VR模型效果均較好,所有模型RPD均大于2.5,說明模型預(yù)測效果均良好。其中, CARS和2D-COS方法篩選的34和14個(gè)特征波長所建模型性能較優(yōu)。其中,CARS-SVR模型的校正集R2和RMSE分別為0.973和1.11%,交叉驗(yàn)證集R2和RMSE分別為0.951和2.53%,預(yù)測集R2、RMSE分別為0.937、3.33%,RPD為4.39。2D-COS-SVR模型校正集R2和RMSE分別0.976和0.99%,交叉驗(yàn)證集R2和RMSE分別為0.950和3.03%,預(yù)測集R2、RMSE分別為0.928、3.00%,RPD為4.85。兩模型的數(shù)據(jù)集R2均大于0.928,RPD均大于2.5,表明CARS-SVR和2D-COS-SVR兩種模型預(yù)測效果都較優(yōu)。
為了驗(yàn)證模型效率,對SVR模型預(yù)測時(shí)間也進(jìn)行了統(tǒng)計(jì)(表3),隨著特征波長個(gè)數(shù)的減少,模型預(yù)測時(shí)間逐漸縮短,采用2D-COS方法篩選特征波長的個(gè)數(shù)占全部波長總數(shù)的1.65%,其所建SVR模型運(yùn)行時(shí)間為利用全部波長所建模型的11.85%,與利用全部波長所建模型相比,預(yù)測模型效率顯著提升;與CARS-SVR模型相比, 2D-COS-SVR模型預(yù)測時(shí)間縮短13.09 s。
表3 不同數(shù)量波長的摻假羊肉樣品的支持向量回歸模型參數(shù)和評價(jià)結(jié)果Table 3 Support Vector Regression (SVR) model parameters and evaluation results of adulterated mutton sample under different number of wavelengths
綜上所得,2D-COS-SVR模型的預(yù)測性能優(yōu)于CARS-SVR模型,表明高光譜結(jié)合2D-COS-SVR模型可以有效實(shí)現(xiàn)羊肉中狐貍?cè)鈸郊俚亩繖z測。
2.4.3 偏最小二乘回歸(PLSR)和支持向量回歸(SVR)模型結(jié)果的比較
比較表2和表3結(jié)果可知,基于不同方法篩選的特征波長所建的羊肉中狐貍?cè)鈸郊俸康腟VR模型性能均優(yōu)于PLSR模型。其中,利用全部波長和2D-COS方法篩選的特征波長所建模型性能差異較為顯著。利用全部波長建立的PLSR模型校正集R2和RPD分別為0.912和2.72,而SVR模型校正集R2和RPD分別為0.971和4.16,較PLSR模型分別提升了0.059和1.44,結(jié)果表明基于全部波長建模時(shí),SVR較PLSR模型性能大幅提升。2D-COS方法篩選特征波長建立的PLSR模型預(yù)測集R2、RMSE和RPD分別為0.869、5.90%和2.48,而SVR模型預(yù)測集R2、RMSE和RPD分別為0.928、3.00%和4.85,表明經(jīng)2D-COS方法篩選的特征波長后SVR模型回歸性能顯著優(yōu)于PLSR模型。而GA和CARS算法篩選的特征波長所建PLSR和SVR模型的RPD分別由3.19和3.35上升至4.00和4.39,表明較PLSR模型相比,SVR模型回歸性也能得到改善。綜合分析各模型R2、RMSE和RPD可知,采用2D-COS方法篩選特征波長所建SVR模型性能最優(yōu),且模型預(yù)測時(shí)間最短,效率最高。由此可得,高光譜結(jié)合2D-COS-SVR模型可以有效實(shí)現(xiàn)羊肉中狐貍?cè)鈸郊俚亩繖z測。
本研究以羊肉糜中狐貍?cè)鈸郊贋檠芯繉ο?,基于可見近紅外高光譜成像技術(shù)結(jié)合特征變量篩選對其進(jìn)行了定量檢測研究,主要結(jié)論如下:
1)基于可見近紅外高光譜成像技術(shù)獲得羊肉中不同狐貍?cè)鈸郊俸康臉悠饭庾V信息,比較了原始光譜和不同方法預(yù)處理后的光譜建立的偏最小二乘回歸(Partial Least Squares Regression,PLSR)模型性能,確定一階導(dǎo)數(shù)(First Derivative,1D)為最優(yōu)光譜預(yù)處理方法。
2)對1D預(yù)處理后的光譜信息進(jìn)行特征波長篩選,利用遺傳算法篩選后得到207個(gè)特征波長,利用競爭性自適應(yīng)重加權(quán)算法篩選后得到34個(gè)特征波長,利用二維相關(guān)光譜分析(Two-Dimensional Correlation Spectroscopy,2D-COS)方法得到14個(gè)與羊肉中狐貍?cè)鈸郊俸坑嘘P(guān)的特征波長。
3)基于全部846個(gè)波長和不同方法篩選出的特征波長所建立的支持向量回歸(Support Vector Regression,SVR)模型性能均優(yōu)于PLSR模型,其中,利用2D-COS方法提取的14個(gè)特征波長建立的SVR模型性能最優(yōu),且模型效率最高,其相對分析誤差為4.85,校正集、交叉驗(yàn)證集和預(yù)測集的決定系數(shù)分別為0.976、0.950和0.928,均方根誤差分別為0.99%、3.03%和3.00%。
研究表明高光譜結(jié)合2D-COS-SVR模型可有效實(shí)現(xiàn)羊肉中狐貍?cè)鈸郊俚亩繖z測,為羊肉中狐貍?cè)鈸郊贆z測和開發(fā)低成本肉類摻假檢測系統(tǒng)提供技術(shù)支持和參考依據(jù)。