原 帥, 張 娟, 劉美娟, 張 駿
(1.煙臺大學文經(jīng)學院信息工程系,山東煙臺 264005;2.煙臺汽車工程職業(yè)學院電子系,山東煙臺 265500;3.煙臺大學光電信息學院,山東煙臺 264005)
煙臺大櫻桃已獲得地理標志保護,其營養(yǎng)價值高,深受廣大消費者喜愛。但現(xiàn)階段對櫻桃糖度的檢測方法主要采用化學測定法,不能在線檢測且效率低。近紅外光譜技術(shù)能夠?qū)崿F(xiàn)無污染性和在線分析[1,2],在水果和蔬菜等產(chǎn)品的品質(zhì)分析上被廣泛應用。但是傳統(tǒng)的傅里葉變換光譜儀體積大,移動很不方便,幾乎不能實現(xiàn)野外檢測。而便攜式光譜儀方便快捷、費用低,已有文獻報道在食品和農(nóng)產(chǎn)品品質(zhì)檢測中得到廣泛的應用[3,4]。
目前近紅外光譜檢測中常用的建模方法很多,最常用的有主成分回歸(PCR)法[5]和偏最小二乘回歸(PLSR)法[6,7]。國內(nèi)利用可見-近紅外光譜技術(shù)檢測水果糖度的報道雖很多,但是基于可見-近紅外光譜對櫻桃糖度進行檢測的方法研究很少。郭衛(wèi)東等人[8]基于連續(xù)小波變換(CWT)和GRNN的可見-近紅外漫反射光譜研究櫻桃糖度,本文首先利用小波變換多尺度分析對櫻桃可見-近紅外光譜進行預處理(濾波去噪),然后分別采用PCR和PLSR法建立櫻桃糖度預測模型,并對兩種模型進行驗證。
實驗樣品采自煙臺福山大櫻桃園,隨機選取50個樣本為校正集,20樣本為驗證集。對樣品清洗后晾干,然后在實驗室放置12 h以上,以使樣品與光譜儀的環(huán)境條件相一致。實驗前使用酒精消毒的刀片對每個樣品切取2 mm左右的薄片,將它們分別編號后置于實驗室內(nèi)(室溫20 ℃)備用。
AvaSpec-2048光纖光譜儀(荷蘭,Avantes公司)。該光譜儀測量波段為600~1 100 nm,且體積小、使用靈活,可快速測量。系統(tǒng)采用與光譜儀配套的AvaSoft-Basic標準版軟件進行光譜采集。在每個切片樣品表面不同點掃描3次求平均值,并作為一次測定的數(shù)據(jù)。采集完光譜后,將每個切片樣品榨汁,采用折射式糖度計進行糖度測定。
本文采用PCR法和PLSR法來建立校正模型。用相關系數(shù)(R)、校正均方根誤差(RMSEC)和預測均方根誤差(RMSEP)來評價該兩種模型性能的優(yōu)劣[9]。
本文采用極差標準歸一化[10]的方法對原始光譜數(shù)據(jù)進行預處理。歸一化處理后,能使每條光譜數(shù)據(jù)值限定在(0,1)之間,數(shù)據(jù)分布更加均衡,為樣品的特征提取提供可靠的數(shù)據(jù)源[5,9,10]。極差為每一條光譜的最大值和最小值之差:
(1)
利用極差將原光譜數(shù)據(jù)進行標準化處理:
(2)
由于各種干擾的存在,櫻桃光譜特征很微弱且不穩(wěn)定。為了抑制噪聲干擾,本文采用小波變換多尺度分析對櫻桃光譜進行濾波,以增強櫻桃光譜的內(nèi)在特征。本文采用小波Daubechies5濾波器對極差標準歸一化后的光譜數(shù)據(jù)進行處理。
圖1是樣本校正集中某一樣品的原始反射率光譜圖,由于噪聲的存在,很難辨別出櫻桃的特征光譜。利用光譜預處理方法對原始光譜進行預處理。如圖2所示,預處理后的櫻桃光譜比較平滑,光譜形狀沒有改變,噪聲被很好地抑制,櫻桃樣品光譜的內(nèi)在特征被很好地反映出來。從圖2中可以看出,在630 nm、970 nm附近有明顯的特征峰值。
圖1 櫻桃的原始反射率光譜Fig.1 The original reflectance spectrum of cherry
圖2 櫻桃光譜歸一化后小波分解的第6階信號Fig.2 The sixth order signal of normalized wavelet decomposition for cherry spectrum
要利用PCR進行建模,必須將預處理后的光譜進行主成分分析,以降低光譜數(shù)據(jù)的維度、簡化識別模型。主成分分析的結(jié)果顯示:前4個主成分的方差貢獻率分別為58.92%、39.59%、1.26%、0.19%。由此得知,前3個主成分的累計貢獻率已達99.77%,能夠很好地表征原光譜的信息。因此本文利用前3個主成分得分值來建立主成分回歸方程。
分別利用PCR法和PLSR法建立櫻桃糖度校正模型,通過Matlab編程[12],校正集50個樣品糖度的預測值與實測值的對應關系如圖3所示,其中圖3(a)為PCR所建模型的相關圖,圖3(b)為PLSR所建模型的相關圖。從兩圖中可以看出,由兩種方法建立模型所得的預測值和實測值具有較好的相關性,各點均勻的分布在趨勢線兩側(cè),而且兩個圖形非常相似。通過計算得出,由PCR得出50個集樣品的糖度預測值與實測值的R為0.9394,RMSEC為0.1384;而由PLSR所建模型的R為0.9396,RMSEC為0.1382。顯然這兩種方法得出的結(jié)果很相近,PLSR模型的性能稍微優(yōu)于PCR模型。
圖3 校正集樣品的主成分回歸(a)與偏最小二乘回歸(b)模型糖度的預測值與實測值相關圖Fig.3 Calibration sample sets predicted sugar degree of correlation diagram and the measured value based on PCR (a) and PLSR (b)
將20個預測樣本的光譜數(shù)據(jù)導入所建的校正模型中以預測其糖度,用來驗證該模型的穩(wěn)定性和可靠性。圖4為20個預測樣品糖度的預測值與實測值的對應關系。其中,圖4(a)為PCR所建模型的相關圖,圖4(b)為PLSR所建模型的相關圖。從兩圖中可以看出,兩種方法得出的模型相關圖非常相似,預測值和實測值具有較好的相關性。由PCR得出20個預測樣本的糖度預測值與實測值的R為0.9071,RMSEP為0.1495;由PLSR得出的R為0.9074,RMSEP為0.1492。從數(shù)據(jù)上可以看出,PLSR模型的性能稍微優(yōu)于PCR模型。通過分析3.3與3.4節(jié)可知,利用PCR和PLSR建立的櫻桃糖度校正模型是穩(wěn)定且可靠的,能夠較好地預測櫻桃糖度。
圖4 預測樣品集的主成分回歸(a)與偏最小二乘回歸(b)模型糖度的預測值與實測值相關圖Fig.4 Prediction samples set predicted sugar degree of correlation diagram and measured values based on PCR (a) and PLSR (b)
本文利用極差標準歸一化方法和小波濾波對原始反射率光譜進行預處理,分別利用主成分回歸(PCR)法和偏最小二乘回歸(PLSR)法建立了基于可見-近紅外光譜測定櫻桃糖度的定量分析模型。結(jié)果表明,利用便攜式可見-近紅外光譜技術(shù)對櫻桃糖度進行檢測是可行且可靠的;兩種方法所建模型都能很好地預測櫻桃糖度,但是PLSR模型性能略高于PCR模型??傊?,便攜式可見-近紅外光譜技術(shù)由于其無污染、快捷、輕便等特點為野外檢測櫻桃糖度提供了可能,并為野外在線動態(tài)檢測其它水果的內(nèi)在品質(zhì)奠定基礎。