孫宗保,梁黎明,李君奎,鄒小波,劉小裕,王天真
江蘇大學(xué)食品與生物工程學(xué)院,江蘇 鎮(zhèn)江 212013
三文魚由Salmo salar音譯而來,其味道鮮美、營養(yǎng)豐富,在世界范圍內(nèi)廣受消費(fèi)者喜愛。而三文魚是一種高度易腐的食品,市場上為了延長其貨架期,通常采用冷凍的方式進(jìn)行存儲。冷凍儲藏可以大大延長其貨架期,且成本低、操作方便。但冷凍會破壞三文魚的組織結(jié)構(gòu),使口感變差,并且解凍時(shí)伴隨大量的汁液流失,降低了營養(yǎng)物質(zhì)含量。冰鮮三文魚能夠更好的保留三文魚的優(yōu)良品質(zhì),但同時(shí)成本更高,售價(jià)更貴。這使部分不法商販將冷凍三文魚解凍后(凍融三文魚)貼上冰鮮的標(biāo)簽冒充成冰鮮三文魚進(jìn)行售賣,以此賺取更多的利益,這種行為嚴(yán)重?fù)p害了消費(fèi)者的利益,也造成了不公平的市場競爭,阻礙國內(nèi)三文魚產(chǎn)業(yè)的健康發(fā)展。因此對冰鮮和凍融三文魚的快速鑒別研究具有重要的意義。
當(dāng)前常規(guī)的三文魚品質(zhì)檢測方法有感官評價(jià)法、微生物檢測法以及理化檢測等方法。其中,感官評價(jià)是一種將統(tǒng)計(jì)分析和實(shí)驗(yàn)設(shè)計(jì)應(yīng)用在人類感官的學(xué)科,該方法簡單易行,但主觀性太強(qiáng);微生物檢測和理化檢測在魚類品質(zhì)評價(jià)中起著重要的作用,其檢測結(jié)果準(zhǔn)確可靠,很多被用作國家標(biāo)準(zhǔn)或其他規(guī)范方法,但存在耗時(shí)、費(fèi)力的缺點(diǎn),難以實(shí)現(xiàn)大規(guī)模檢測。高光譜成像技術(shù)因檢測快速無損且同時(shí)具有圖像和光譜信息的優(yōu)點(diǎn)而廣泛應(yīng)用在肉類品質(zhì)檢測領(lǐng)域。Sivertsen[1]等采用高光譜成像技術(shù)結(jié)合K最近鄰法(KNN)區(qū)分了新鮮和凍融鱈魚片,并評估了冰鮮樣本的新鮮度;Khojastehnazhand[2]等采用高光譜成像技術(shù)結(jié)合偏最小二乘法 (PLS) 對虹鱒魚的存儲時(shí)間進(jìn)行了鑒別;Cheng[3]等采用高光譜成像技術(shù)結(jié)合PLS對鮭魚在存儲過程中DHA和EPA變化進(jìn)行分析和預(yù)測。以上研究表明高光譜成像技術(shù)在魚類品質(zhì)檢測中具有巨大潛力。本研究采用高光譜成像技術(shù)對冰鮮與凍融三文魚進(jìn)行鑒別,為模擬實(shí)際冷鏈運(yùn)輸過程中樣品可能存在多次凍融的情況,凍融組樣本包含一次凍融組、兩次凍融組和三次凍融組,并基于高光譜成像技術(shù)對其凍融次數(shù)進(jìn)行鑒別,旨在建立一種高效、無損且通用性強(qiáng)的冰鮮與凍融三文魚鑒別方法。
樣本來自法羅群島當(dāng)?shù)刈畲蟮娜聂~養(yǎng)殖公司Bakkafrost。三文魚被捕撈后,由加工廠在3 h內(nèi)將鮮活三文魚屠宰加工為冰鮮三文魚。然后全程4 ℃冷鏈空運(yùn)至上海純爾貿(mào)易發(fā)展有限公司,再通過冷藏車運(yùn)送至鎮(zhèn)江麥德龍超市,真空包裝后,置放在鋪滿碎冰的保鮮盒中快速運(yùn)送到實(shí)驗(yàn)室,整個(gè)運(yùn)輸過程大約4~5 d。
三文魚去皮清洗干凈后,用滅菌后的刀片取中段魚塊,切成長3 cm、寬3 cm、高2 cm的魚片,個(gè)體質(zhì)量約(20±5) g,真空包裝。將分割好的三文魚樣本按圖1分為兩組,第一組命名為C組,即冰鮮組,共90個(gè)樣品,此組三文魚樣本在當(dāng)天進(jìn)行分析。第二組命名為FT組,即凍融組。參考Ali[4]等的循環(huán)凍融方法,F(xiàn)T組分為FT-1組、FT-2組和FT-3組,即一次凍融組、兩次凍融組以及三次凍融組,每組30個(gè)樣本,凍藏時(shí)間均為30 d。其中FT-1組在零下30 ℃下冷凍30 d后取出解凍分析;FT-2組在第15天從冷凍層取出,在4 ℃環(huán)境下解凍12 h,之后再繼續(xù)冷凍,在第30天取出解凍分析,為兩次凍融循環(huán)組;FT-3在第10和20天取出進(jìn)行一次凍融循環(huán),最后在第30天取出分析,為三次凍融循環(huán)組。
圖1 樣本制備流程圖Fig.1 The flow chart of sample preparation
1.2.1 高光譜成像采集系統(tǒng)
高光譜成像采集系統(tǒng)主要由高光譜相機(jī)(ImSpector V10E, Spectral Imaging Ltd, Oulu, Finland)、石英鹵素?zé)?Fiber-LiteDC-950Illuminator, Dolan-Jenner Industries Inc, America)、精密自動(dòng)平移裝置(SC30021 A, Zolix Instruments co. Ltd., China) 以及裝配了圖像采集卡的電腦(P4P800-X型號,Asus computer co. Ltd., Taiwan, China)組成。系統(tǒng)硬件部分主要組成示意圖見圖2。
圖2 高光譜成像系統(tǒng)Fig.2 Hyperspectral imaging system
1.2.2 高光譜圖像的采集與校正
儀器預(yù)熱后,將樣品放置于樣品臺上,并設(shè)置系統(tǒng)參數(shù):樣品臺的平移速度為90 mm·s-1;行程為180 mm;相機(jī)曝光時(shí)間設(shè)置為50 ms。對原始高光譜圖像進(jìn)行黑白校正,以降低在采集過程中由于暗電流和光照不均勻等因素產(chǎn)生的噪聲。
1.3.1 光譜提取和預(yù)處理方法
采用ENVI 4.5軟件選取樣品中心附近200 pixel×200 pixel的范圍作為感興趣區(qū)域(region of interest, ROI),對ROI范圍內(nèi)所有像素點(diǎn)的光譜值進(jìn)行平均,作為該樣本的光譜值。
為篩選出效果較好的預(yù)處理方法,選用了一階導(dǎo)數(shù)(first derivative, 1st Der)、二階導(dǎo)數(shù)(second derivativ, 2nd Der)、多元散射校正(multiplicative scatter correction, MSC)、標(biāo)準(zhǔn)正態(tài)變量變換(standard normal variate transformation, SNVT)、歸一化(normalization, N) 和均值中心化(mean centering, MC) 共6種預(yù)處理方法。
1.3.2 光譜信息中特征變量的篩選方法
由于光譜數(shù)據(jù)變量繁多,可能存在冗余信息和噪聲,若將每個(gè)光譜值都代入模型進(jìn)行分析,不僅影響模型的準(zhǔn)確率,也會增加模型的運(yùn)算量,降低模型運(yùn)算速度,因此有必要通過變量篩選的方法對光譜進(jìn)行特征波長篩選[5]。
(1)競爭性自適應(yīng)重加權(quán)算法(competitive adaptive reweighted sampling, CARS):競爭性自適應(yīng)重加權(quán)算法是一種基于“適者生存”思想,結(jié)合了蒙特卡羅采樣和偏最小二乘回歸系數(shù)的變量篩選方法。在進(jìn)行變量篩選時(shí),剔除變量的數(shù)量由指數(shù)衰減函數(shù)(exponentially decreasing function, EDF)來確定。變量剔除后,將保留的變量數(shù)據(jù)利用自適應(yīng)重加權(quán)采樣(adaptive reweighted sampling, ARS) 建立PLS模型,比較模型的交叉驗(yàn)證均方根誤差RMSECV值,選出RMSECV值最小時(shí)對應(yīng)的PLS模型,其對應(yīng)的子集變量即CARS方法最終篩選出的特征變量[6]。
(2)連續(xù)投影算法(successive projections algorithm, SPA):連續(xù)投影算法可以從一組數(shù)據(jù)中篩選出一組子集,使子集中的變量含有最少的重復(fù)和無用特征值,從而可以減少后續(xù)建立的模型輸入變量,提高模型效率[7]。
(3)競爭性自適應(yīng)重加權(quán)-連續(xù)投影算法 (competitive adaptive reweighted sampling-successive projections algorithm, CARS-SPA):競爭性自適應(yīng)重加權(quán)-連續(xù)投影算法是將CARS方法篩選出的波長繼續(xù)用SPA方法進(jìn)行二次篩選的波長選擇方法。
1.3.3 高光譜圖像紋理特征值的提取
魚肉品質(zhì)的改變在一定程度上與人的感官有較高的相關(guān)性,通過食品的紋理信息能夠?qū)ζ淦焚|(zhì)進(jìn)行評估和檢測。采用灰度共生矩陣方法(gray-level co-occurrence matrix,GLCM) 對高光譜數(shù)據(jù)的前幾個(gè)主成分圖像紋理信息進(jìn)行提取。分別以0°, 45°, 90°和135°四個(gè)不同角度從圖像中計(jì)算紋理特征,提取了樣品高光譜圖像的相關(guān)性(correlation,COR)、對比度(contrast,CON)、熵(entropy,ENT)、角二階矩(angular second moment,UNI)以及逆差矩(inverse difference moment,IDM)五個(gè)紋理特征值。每幅圖片共采集20個(gè)紋理特征值,這20個(gè)特征值在后續(xù)的研究中作為變量建立冰鮮與凍融三文魚定性鑒別模型。
1.3.4 樣本集劃分
光譜-理化值共生距離法(sample set partitioning based on joint x-y distances, SPXY)方法是在Kennard-Stone方法的基礎(chǔ)上提出的,與后者不同的是,SPXY方法在校正集樣本的選擇上能夠兼顧變量矩陣X及待測指標(biāo)矩陣Y,因此能夠保證獲取的校正集數(shù)據(jù)代表性更強(qiáng)[8]。
1.3.5 定性模型建立方法
定性模型按分類函數(shù)的類型可分為非線性定性模型和線性定性模型,本研究選用了反向傳播人工神經(jīng)網(wǎng)絡(luò)(back-propagation artificial neural network, BPANN)、線性判別分析(linear discriminant analysis, LDA)、極限學(xué)習(xí)機(jī)(extreme learning machine, ELM) 以及隨機(jī)森林(random forest,RF)四種定性判別模型,其中,BPANN,RF和ELM為非線性分類模型,LDA為線性分類模型[9-12]。
2.1.1 冰鮮與凍融三文魚光譜差異分析
圖3(a)為180個(gè)樣品的原始光譜圖。為方便對冰鮮與凍融三文魚的光譜差異進(jìn)行比較和分析,本研究分別對C,F(xiàn)T-1,F(xiàn)T-2以及FT-3組的光譜值求平均并做出平均光譜圖,如圖3(b)。在圖3(b)中,四組樣品光譜曲線呈現(xiàn)相似的趨勢,但C組光譜值在431~570和610~962 nm波長范圍內(nèi)的光譜值大小與三組凍融樣品具有較明顯的差異,此結(jié)果與Pu[13]的研究結(jié)果類似,并且C組樣品光譜值在大部分波段上要要高于FT-1,F(xiàn)T-2和FT-3樣品,此結(jié)果與Sánchez-Alonso[14]、Qu[15]等的研究結(jié)果一致,這種差異意味著三文魚的凍融過程引起了樣品品質(zhì)的明顯變化,而這種變化可以通過光譜信息來檢測。樣品光譜在700和800 nm波長附近具有較明顯的峰值,其中,700nm波長附近的光譜峰值與樣品的蛋白質(zhì)組分中的NH3鍵的三級倍頻伸縮振動(dòng)有關(guān),而800 nm波長附近的光譜峰值與樣品水分中的O—H鍵的二級倍頻伸縮振動(dòng)有關(guān)[13]。
圖3 冰鮮與凍融三文魚的原始光譜圖(a)與平均光譜圖(b)
2.1.2 基于全光譜建模結(jié)果分析
樣品光譜經(jīng)過預(yù)處理后,采用SPXY方法將180個(gè)樣本按2∶1的比例進(jìn)行劃分,即120個(gè)樣品為校正集和60個(gè)樣品為預(yù)測集。將PCA得到的前15個(gè)主成分作為變量分別代入BPANN,LDA,ELM以及RF判別模型,結(jié)果如表1所示。由表中可以看出,基于MSC預(yù)處理方法的ELM模型對冰鮮與凍融三文魚識別效果最佳,為冰鮮與凍融三文魚研究中的最優(yōu)預(yù)處理方法,因此在后續(xù)的變量篩選研究中,采用經(jīng)MSC預(yù)處理的原始光譜。
表1 基于全光譜變量的冰鮮與凍融三文魚鑒別結(jié)果Table 1 Identification results of chilled and frozen-thawed salmon based on full spectrum variables
2.1.3 光譜特征波長篩選與建模分析
高光譜數(shù)據(jù)具有高維性和共線性,去除冗余波長和噪聲有助于建立更準(zhǔn)確、更高效的識別模型。選用了CARS,SPA以及CARS-SPA三種方法對光譜波長進(jìn)行篩選。
(1)CARS方法
利用CARS對波長進(jìn)行篩選時(shí),采樣次數(shù)設(shè)置為100。圖4為基于CARS的光譜波長篩選結(jié)果,圖4(a)表示各個(gè)采樣次數(shù)下被選中的波長數(shù)量。圖4(b)中可以看出,隨著采樣次數(shù)的增加,RMSECV值由于冗余波長和噪聲的去除先呈下降趨勢,隨后在不斷地變量篩選過程中可能存在一些有用信息被去除的情況,導(dǎo)致RMSECV值逐漸上升。圖4(c)表示在波長篩選過程中選取的光譜變量的回歸系數(shù)變化,其中*標(biāo)注的位置代表此時(shí)的RMSECV值最小,此時(shí)共篩選出60個(gè)特征波長。
圖4 CARS方法的波長選擇Fig.4 Wavelength selection results of CARS
(2)SPA方法
利用SPA對光譜波長進(jìn)行篩選時(shí),將提取的特征波長數(shù)區(qū)間設(shè)置為2~25,圖5為基于SPA的變量篩選結(jié)果。圖5(a)表示篩選的特征波長個(gè)數(shù)對應(yīng)的RMSE值,橫坐標(biāo)為選取的特征波長數(shù),最優(yōu)波長數(shù)為圖中的正方形塊對應(yīng)的橫坐標(biāo),由圖中可以看出SPA方法最終篩選出了14個(gè)特征波長。圖5(b)為選取的特征波長,由選取的特征波長也可以看出最能反映數(shù)據(jù)信息的波段,圖中可以看出選取的波長大部分集中在兩個(gè)波峰處,由圖3(a)的原始光譜圖可知,這兩個(gè)波峰分別位于700和800 nm附近。700 nm波長附近的光譜峰值與樣品中蛋白質(zhì)組分的三級倍頻伸縮振動(dòng)有關(guān),而800 nm波長附近的光譜峰值與樣品水分中的O—H鍵的二級倍頻伸縮振動(dòng)有關(guān)[13]。
圖5 SPA方法的波長選擇(a): 特征波長篩選;(b): 選取的特征波長Fig.5 Wavelength selection results of SPA(a): Characteristic wavelength screening;(b): Selected characteristic wavelength
(3)CARS-SPA方法
利用SPA方法對CARS方法篩選的變量進(jìn)行二次篩選,以期能夠獲得更少的變量輸入和更高識別率的鑒別模型。SPA從CARS方法提取的60個(gè)波長中二次篩選出18個(gè)特征波長。
基于波長篩選后光譜所建模型識別效果如表2所示。通過與基于全光譜建立的模型結(jié)果對比可以看出,經(jīng)CARS方法對光譜波長進(jìn)行篩選后,四種模型對冰鮮與凍融三文魚的識別效果均有所提高,表明CARS方法能夠有效的減少原始光譜中的冗余信息和噪聲,有助于建立更準(zhǔn)確、高效的識別模型。識別效果最優(yōu)的為CARS-ELM模型,其校正集和測試集的識別率分別達(dá)到了100.00%和95.00%,可以較準(zhǔn)確的區(qū)分冰鮮與凍融三文魚。
表2 基于波長篩選后光譜建立的鑒別模型結(jié)果Table 2 Identification model results based on spectrum after wavelength screening
在對圖像紋理特征值提取過程中,首先通過主成分分析方法提取最能表征原始數(shù)據(jù)信息的主成分圖像。研究發(fā)現(xiàn)前三個(gè)主成分圖像(如圖6)的累計(jì)貢獻(xiàn)率為97.36%。隨后利用GLCM對前三個(gè)主成分圖像紋理特征指標(biāo)進(jìn)行提取,每個(gè)樣品三個(gè)主成分圖像共提取60個(gè)特征變量。
圖6 前三個(gè)主成分圖像(從左至右依次為PC1,PC2,PC3)Fig.6 The first three principal component images (PC1, PC2, PC3 in turn from left to right)
模型識別結(jié)果見表3。表中可看出,ELM模型對冰鮮與凍融三文魚鑒別效果最佳,其校正集和測試集的識別率分別為83.33%和78.33%,而LDA模型對冰鮮與凍融三文魚鑒別效果最差,原因可能是冰鮮與凍融三文魚的紋理變化不是線性。
表3 基于光譜信息和紋理信息的的冰鮮與凍融三文魚鑒別結(jié)果
本節(jié)將2.1.3中CARS篩選的60個(gè)光譜值與2.2中提取的樣品紋理特征值歸一化后進(jìn)行融合,探測基于光譜+紋理信息的冰鮮與凍融三文魚鑒別效果。樣本集的劃分和模型建立過程同前文,鑒別結(jié)果見表3。結(jié)果表明,基于紋理信息的模型識別效果較差,而基于光譜+紋理信息的四種模型對冰鮮與凍融三文魚的鑒別效果較單紋理信息均有所提高。其中基于光譜+紋理信息的ELM模型對冰鮮與凍融三文魚識別效果最好,校正集和預(yù)測集的識別率分別達(dá)到了96.67%和91.67%。
綜合基于光譜、紋理以及光譜+紋理信息的模型鑒別結(jié)果表明,光譜結(jié)合CARS-ELM模型對冰鮮與凍融三文魚的識別效果最佳,校正集和預(yù)測集的識別率分別可以達(dá)到100%和95.00%。光譜信息識別效果較佳的原因可能是冰鮮與凍融三文魚之間的化學(xué)成分差異較大,外觀差異較小,而光譜對樣品的化學(xué)組分變化較敏感,圖像信息則與樣品的外觀如形狀、大小等因素相關(guān)性較高。
利用光譜信息、圖像信息以及光譜+圖像信息建立對三文魚凍融次數(shù)的識別模型。選用前文中效果較優(yōu)的CARS作為光譜波長的篩選方法,篩選過程同2.1.3,每個(gè)樣品共提取出77個(gè)特征波長;圖像紋理信息提取方法同2.2。樣本集經(jīng)過SPXY劃分后,分別利用光譜變量、圖像變量以及光譜+圖像變量建立BPANN,LDA,ELM和RF識別模型,模型建立方法和步驟同2.1.3,模型結(jié)果如表4所示。
表4 基于光譜信息和紋理信息的的三文魚凍融次數(shù)鑒別結(jié)果
由表4可以看出,對三文魚凍融次數(shù)識別效果最好的是基于光譜信息建立的ELM模型,校正集和測試集識別率分別為97.50%和91.67%;基于圖像信息和融合信息的模型識別效果較差,可能是由于不同凍融次數(shù)三文魚間的紋理特征差異不明顯,從而模型效果不理想。綜上,基于光譜信息建立的CARS-ELM模型對三文魚凍融次數(shù)的鑒別效果最優(yōu),實(shí)現(xiàn)了基于高光譜成像的三文魚凍融次數(shù)的鑒別。
利用高光譜成像技術(shù)結(jié)合化學(xué)計(jì)量學(xué)方法對冰鮮與凍融三文魚進(jìn)行了鑒別研究。通過對比基于光譜信息、圖像信息和光譜+圖像融合信息建立的識別模型效果發(fā)現(xiàn),基于光譜信息建立的CARS-ELM模型對冰鮮與凍融三文魚識別效果最佳,其校正集和預(yù)測集的識別率分別為100.00%和95.00%。此外,還利用高光譜成像對三文魚的凍融次數(shù)進(jìn)行了鑒別,基于光譜信息建立CARS-ELM模型對三文魚凍融次數(shù)識別效果最佳,其校正集和預(yù)測集的識別率分別為97.50%和91.67%。結(jié)果表明利用高光譜信息能夠較好的實(shí)現(xiàn)冰鮮與凍融三文魚及其凍融次數(shù)的鑒別。