張 旭,張?zhí)祛?,穆維松,傅澤田,3,張小栓,3*
1. 中國(guó)農(nóng)業(yè)大學(xué)信息與電氣工程學(xué)院,北京 100083 2. 中國(guó)農(nóng)業(yè)大學(xué)工學(xué)院,北京 100083 3. 中國(guó)農(nóng)業(yè)大學(xué)食品質(zhì)量與安全北京實(shí)驗(yàn)室,北京 100083
以優(yōu)質(zhì)的釀酒葡萄為原料才能釀造優(yōu)質(zhì)葡萄酒。釀酒葡萄的成熟度影響著葡萄的質(zhì)量,同時(shí)成熟度的判別對(duì)葡萄園安排采摘和葡萄酒廠安排生產(chǎn)非常重要[1]??扇苄怨绦挝锖?soluble solids content,SSC)是測(cè)定葡萄成熟度的關(guān)鍵參數(shù)[2],決定著葡萄酒釀造的種類及工藝。通常釀酒葡萄采摘前SSC的檢測(cè)過程是在葡萄園中均勻選取植株,并從每穗葡萄上摘取1~3粒葡萄果實(shí),破碎、取汁后采用折光儀測(cè)定SSC。檢測(cè)過程耗時(shí)費(fèi)力,需要消耗一定葡萄原料,同時(shí)存在取樣面積大、葡萄品種多樣等難點(diǎn)。
可見/近紅外(Vis/NIR)光譜技術(shù)具有檢測(cè)快速、高效等特點(diǎn),是近年來快速發(fā)展的新興無損檢測(cè)技術(shù),越來越多地應(yīng)用于農(nóng)產(chǎn)品品質(zhì)檢測(cè)和評(píng)價(jià)領(lǐng)域。通過全光譜或特征波長(zhǎng)進(jìn)行定量或定性分析,對(duì)被測(cè)對(duì)象的成熟度[3]、新鮮度[4-6]、霉變度、感官特性[7]等品質(zhì)指標(biāo)以及顏色[8]、淀粉、SSC[9-10]等理化指標(biāo)進(jìn)行檢測(cè)。
本研究將針對(duì)葡萄園釀酒葡萄成熟度檢測(cè)中存在的問題,結(jié)合Vis/NIR光譜檢測(cè)技術(shù)及化學(xué)計(jì)量學(xué)方法,在葡萄大田中獲取5個(gè)品種釀酒葡萄及其葉片的光譜數(shù)據(jù),討論不同光譜預(yù)處理算法建模效果,確立釀酒葡萄SSC的最優(yōu)預(yù)測(cè)模型并進(jìn)行驗(yàn)證,為采用Vis/NIR技術(shù)預(yù)測(cè)釀酒葡萄成熟度判別提供理論依據(jù)。
實(shí)驗(yàn)樣本5個(gè)品種為赤霞珠、品麗珠、梅樂、霞多麗、小芒森,樣品均取自山東省煙臺(tái)市君頂葡萄酒酒莊。
光譜數(shù)據(jù)由Vis/NIR光譜儀USB2000+(美國(guó)Ocean Optics公司)測(cè)得。SSC由手持式糖度儀PAL-1(日本Atago公司)測(cè)得。
葡萄樣品均來自君頂葡萄酒酒莊,于2016年和2017年先后在4個(gè)不同成熟階段分別對(duì)5種釀酒葡萄進(jìn)行光譜數(shù)據(jù)采集,根據(jù)葡萄園大小和葡萄藤生長(zhǎng)狀況均勻選取12個(gè)采樣位點(diǎn),如圖1所示。
圖1 釀酒葡萄樣本采集位點(diǎn)Fig.1 Sampling sites of wine grape
采集光譜數(shù)據(jù)前先使用漫反射標(biāo)準(zhǔn)白板進(jìn)行校正,再采集暗電流。校正操作完成后,設(shè)定儀器參數(shù)為: 波長(zhǎng)范圍350~1 050 nm,積分時(shí)間10 ms,掃描次數(shù)32。隨后進(jìn)行樣本采集,首先選取采集位點(diǎn)生長(zhǎng)狀況良好的葡萄藤及葡萄果實(shí)采摘漿果樣本。之后沿葡萄藤向上尋找生長(zhǎng)良好的冠層枝葉采摘葉片樣本。運(yùn)送至實(shí)驗(yàn)室后進(jìn)行光譜數(shù)據(jù)采集。采樣設(shè)備為ISP-REF型反射用積分球,內(nèi)置鹵鎢燈光源,采樣孔直徑為10.32 mm。
利用主成分分析法(principle component analysis,PCA)消除異常樣本,以提高釀酒葡萄可見/近紅外光譜SSC預(yù)測(cè)模型的精確性和可靠性。
樣品光譜數(shù)據(jù)往往受到隨機(jī)噪聲、基線漂移、樣品均勻性等因素影響,需要預(yù)處理光譜來消除這些干擾。一階導(dǎo)數(shù)(first derivative,F(xiàn)D)可以降低低頻噪音、放大高頻噪聲; Savitzky-Golay卷積平滑(S-G)可有效消除基線漂移; 多元散射校正(multiple scattering correction,MSC)和標(biāo)準(zhǔn)正態(tài)變換(standard normal variate,SNV)可消除樣品均勻性對(duì)漫反射光的影響。采用它們組合的4種不同方法對(duì)樣本進(jìn)行光譜預(yù)處理,以找到最佳預(yù)處理方法。
應(yīng)用偏最小二乘(partial least squared,PLS)方法建立校正模型。模型性能評(píng)估指標(biāo)為相關(guān)系數(shù)R、校正集均方根誤差RMSEC、驗(yàn)證集均方根誤差RMSEV,其計(jì)算公式如式(1)—式(4)所示
(1)
(2)
(3)
(4)
將釀酒葡萄校正集樣本在400~1 000 nm區(qū)間的Vis/NIR光譜數(shù)據(jù)導(dǎo)出,應(yīng)用OMNIC 8.0軟件(美國(guó)Thermo Nicolet公司)進(jìn)行光譜提取。光譜在400~450 nm處噪音明顯,若用此波段建模將降低模型的精度。因此選取450~1 000 nm波段的數(shù)據(jù),使用TQ Analyst 8.0(美國(guó)Thermo Nicolet公司)光譜處理軟件預(yù)處理光譜數(shù)據(jù)及建立校正模型。
以赤霞珠葡萄果實(shí)為例,釀酒葡萄的Vis/NIR吸收率原始光譜如圖2所示,各樣本不同成熟階段的光譜變化趨勢(shì)基本一致,呈現(xiàn)的吸收特征變化反映了葡萄內(nèi)部不同組分信息含量的差異。光譜在小于450 nm和大于1 000 nm存在較多噪聲。小于780 nm的吸收主要是樣品在可見光區(qū)的電子躍遷,主要表征果皮顏色特征,超過780 nm屬于近紅外短波波段。在波長(zhǎng)680和980 nm附近均有明顯吸收峰。由于赤霞珠果實(shí)的果皮呈紫黑色,對(duì)所有顏色均有吸收,因此可見光區(qū)無明顯波谷。在680 nm附近的吸收峰可能是由果實(shí)中的葉綠素分子吸收引起的。960~1 000 nm間的吸收峰歸屬于分子振動(dòng)的三級(jí)倍頻吸收帶,主要是由水分振動(dòng)引起的。
圖2 葡萄漿果樣本吸收率光譜圖Fig.2 The absorbance spectra of grape berries
圖3為霞多麗葉片原始光譜吸收率圖,可以看出,不同生長(zhǎng)時(shí)期的葉片樣本的光譜吸收率變化趨勢(shì)基本相同。在葉片光譜可見光波段,在450 nm附近出現(xiàn)藍(lán)光波段吸收峰。在520~570 nm形成明顯的吸收谷,由于葉綠素在綠光波段的強(qiáng)反射所致。在650 nm處為紅光波段吸收峰。吸收率在670~720 nm波段快速下降,表現(xiàn)出綠色植物的紅邊特征。在980 nm附近出現(xiàn)水的弱吸收峰。
圖3 霞多麗冠層葉片樣本吸收率光譜圖Fig.3 The absorbance spectra of canopy leaves of grape
采用PCA方法檢測(cè)異常樣本,對(duì)光譜的全部波段提取主成分,原始光譜信息被主成分替代,若某光譜樣本得分因子與其他光譜差異大時(shí),則認(rèn)定該光譜樣本為異常樣本,予以剔除。如圖4所示為霞多麗樣本的第一、第二主成分的得分因子分布圖,圖中有4個(gè)樣本差異較大位于置信區(qū)間以外,判定為異常樣本,據(jù)此準(zhǔn)則依次剔除5種釀酒葡萄漿果及其葉片的異常光譜數(shù)據(jù)。
圖4 霞多麗漿果樣本主成分得分圖Fig.4 PCA score plot of Chardonnay grape
2.3 樣本集劃分
剔除光譜數(shù)據(jù)異常值后,SSC數(shù)據(jù)集按校正集∶驗(yàn)證集=3∶1的比例隨機(jī)劃分,然后進(jìn)行建模分析。用于漿果光譜特征建模和冠層葉片光譜特征建模的釀酒葡萄SSC含量統(tǒng)計(jì)結(jié)果見表1。
表1 樣品集SSC統(tǒng)計(jì)Table 1 Statistics results of SSC of sample sets
分別采用S-G平滑、S-G平滑+FD、S-G平滑+FD+SNV、S-G平滑+FD+MSC等4種組合預(yù)處理光譜數(shù)據(jù),并利用PLS進(jìn)行建模分析。表2是5種釀酒葡萄漿果的光譜信息通過不同預(yù)處理后的PLS建模結(jié)果對(duì)比,可以看出,F(xiàn)D的處理方法可以顯著提高模型R值,降低均方根誤差,求導(dǎo)后再使用SNV或MSC的方法可以進(jìn)一步提高模型R值,其中赤霞珠樣本光譜使用SNV處理時(shí)模型性能最佳,其余4種使用MSC時(shí)最佳,5種釀酒葡萄驗(yàn)證集RV均達(dá)到0.86以上,模型預(yù)測(cè)能力較強(qiáng)。
分別選取光譜數(shù)據(jù)最優(yōu)預(yù)處理方法,并建立基于釀酒葡萄漿果光譜的SSC預(yù)測(cè)模型,圖5至圖9分別為霞多麗、小芒森、梅洛、赤霞珠、品麗珠的預(yù)測(cè)模型散點(diǎn)圖,SSC預(yù)測(cè)模型相關(guān)系數(shù)R分別達(dá)到了0.93,0.95,0.96,0.97和0.96,相關(guān)性很高,RMSEC均不超過0.30,散點(diǎn)圖離散程度低。利用驗(yàn)證集樣本評(píng)價(jià)SSC預(yù)測(cè)模型,5種釀酒葡萄驗(yàn)證集R依次達(dá)到0.86,0.86,0.88,0.88和0.86,相關(guān)性較好,且RMSEV最高為0.48,預(yù)測(cè)值與真實(shí)值離散程度較低,模型效果優(yōu)良。對(duì)比文獻(xiàn),陳辰等[2]研究中的模型性能同樣優(yōu)良,但結(jié)果表現(xiàn)出差異性可能是由于品種以及建模方法的不同。
表2 四種預(yù)處理方式的PLS預(yù)測(cè)模型比較Table 2 Comparison of PLS prediction models withfour different pretreatment methods
圖5 霞多麗葡萄漿果SSC模型校正與驗(yàn)證結(jié)果
表3是5種釀酒葡萄冠層葉片的樣本光譜經(jīng)過不同預(yù)處理后的PLS建模結(jié)果對(duì)比,從表3中可以看出,F(xiàn)D的處理方法可以降低均方根誤差,但對(duì)R的改善效果小于基于葡萄漿果光譜數(shù)據(jù)所建立的預(yù)測(cè)模型,原因可能是冠層葉片攜帶與SSC有關(guān)的信息有限,近紅外波段漫反射信息采集較少,更多的采集到了可見光部分光譜信息,而可見光波段數(shù)據(jù)較為穩(wěn)定,噪聲較少。求導(dǎo)后再使用SNV或MSC的方法可以進(jìn)一步提高模型相關(guān)性,5種葡萄葉片的預(yù)測(cè)模型均使用MSC處理效果最佳,驗(yàn)證集RV均不低于0.65,模型具有一定預(yù)測(cè)能力。
圖6 小芒森葡萄漿果SSC模型校正與驗(yàn)證結(jié)果
圖7 梅洛葡萄漿果SSC模型校正與驗(yàn)證結(jié)果
圖8 赤霞珠葡萄漿果SSC模型校正與驗(yàn)證結(jié)果
圖9 品麗珠葡萄漿果SSC模型校正與驗(yàn)證結(jié)果
表3 四種預(yù)處理方式的PLS預(yù)測(cè)模型比較Table 3 Comparison of PLS prediction models withfour different pretreatment methods
基于冠層葉片光譜數(shù)據(jù)采用最優(yōu)預(yù)處理方法,分別建立了SSC的PLS預(yù)測(cè)模型,圖10至14分別為霞多麗、小芒森、梅洛、赤霞珠、品麗珠葉片的預(yù)測(cè)模型散點(diǎn)圖,SSC預(yù)測(cè)模型R分別達(dá)到了0.76,0.80,0.78,0.73和0.78,相關(guān)性較高,RMSEC均低于0.95,預(yù)測(cè)值與真實(shí)值之間離散程度小。利用驗(yàn)證集樣本對(duì)基于冠層葉片的SSC預(yù)測(cè)模型進(jìn)行模型評(píng)價(jià),5種冠層葉片驗(yàn)證集RV依次達(dá)到0.67,0.66,0.66,0.69和0.65,具有一定相關(guān)性,RMSEV均在0.75以下,散點(diǎn)圖效果相對(duì)離散,模型效果較好。
圖10 霞多麗葡萄葉片SSC模型校正與驗(yàn)證結(jié)果
圖11 小芒森葡萄葉片SSC模型校正與驗(yàn)證結(jié)果
圖12 梅洛葡萄葉片SSC模型校正與驗(yàn)證結(jié)果
隨機(jī)采集5種釀酒葡萄的漿果樣本各20個(gè),采集方法與預(yù)測(cè)建模實(shí)驗(yàn)數(shù)據(jù)采集方法相同,利用所建立的基于釀酒葡萄漿果光譜特征的SSC預(yù)測(cè)模型對(duì)外部未知樣本進(jìn)行SSC含量預(yù)測(cè),驗(yàn)證結(jié)果見表4。從結(jié)果中可以看出,葡萄漿果外部試驗(yàn)樣本的SSC預(yù)測(cè)值與真實(shí)值之間RE較小,驗(yàn)證樣本RE均表現(xiàn)良好,品麗珠品種的平均RE最高,達(dá)到0.43%,小芒森和赤霞珠樣本的預(yù)測(cè)結(jié)果表現(xiàn)優(yōu)秀,RE接近于0。
圖13 赤霞珠葡萄葉片SSC模型校正與驗(yàn)證結(jié)果
圖14 品麗珠葡萄葉片SSC模型校正與驗(yàn)證結(jié)果
表4 釀酒葡萄漿果葉片樣本的外部驗(yàn)證結(jié)果Table 4 External validation results of samplesof berry and canopy leaves
采集了5種釀酒葡萄漿果及冠層葉片的Vis/NIR光譜數(shù)據(jù),利用PLS方法建立釀酒葡萄的SSC預(yù)測(cè)模型,主要結(jié)論如下:
(1)將釀酒葡萄光譜信息經(jīng)過PCA方法剔除異常數(shù)據(jù)后,對(duì)比四種光譜預(yù)處理方法的建模效果。結(jié)果表明大多數(shù)預(yù)測(cè)模型采用S-G平滑+FD+MSC的預(yù)處理方法時(shí)效果最好。
(2)選取最優(yōu)光譜數(shù)據(jù)預(yù)處理方法,分別建立了各品種基于釀酒葡萄漿果和冠層葉片光譜特征的SSC預(yù)測(cè)模型。5種釀酒葡萄漿果的RV最低為0.86,且RMSEV均不超過0.48。5種釀酒葡萄冠層葉片的RV最高為0.69,RMSEV均在0.75以下,模型性能均低于各品種漿果所建立模型的性能。
(3)利用外部試驗(yàn)樣品對(duì)模型總體預(yù)測(cè)能力進(jìn)行評(píng)價(jià)。5種葡萄漿果試驗(yàn)樣本預(yù)測(cè)值與真實(shí)值間的平均RE在-0.44%~0.43%之間?;卺劸破咸褲{果光譜的SSC預(yù)測(cè)模型具備良好的預(yù)測(cè)能力,SSC預(yù)測(cè)模型能夠?yàn)獒劸破咸殉墒於仍u(píng)價(jià)提供理論參考。