高 升 ,徐建華
(1.青島理工大學(xué)信息與控制工程學(xué)院,山東青島 266520;2.青島國(guó)際機(jī)場(chǎng)集團(tuán)有限公司運(yùn)行指揮中心,山東青島 266000)
紅提營(yíng)養(yǎng)豐富,鮮嫩多汁,深受消費(fèi)者喜愛(ài)[1-2]??扇苄怨绦挝铮⊿SC)、總酸(TA)、pH、硬度(FI)和含水率(MC)決定了果實(shí)的口味,可反映紅提的感官性能、商品價(jià)值、水果成熟度[3-4]。FI和MC也是評(píng)價(jià)果蔬貯藏及運(yùn)輸運(yùn)品質(zhì)的重要參考[5]。掌握紅提的含水率能及時(shí)挑選出將要腐爛的果實(shí),對(duì)減少腐爛蔓延至關(guān)重要[6]。傳統(tǒng)的水果內(nèi)部品質(zhì)檢測(cè)為破壞性抽樣檢測(cè),檢測(cè)后的樣本遭到嚴(yán)重破壞而無(wú)法銷售和食用,且只能通過(guò)抽樣檢測(cè)來(lái)對(duì)整體進(jìn)行評(píng)價(jià),而每個(gè)果實(shí)的品質(zhì)無(wú)法進(jìn)行準(zhǔn)確評(píng)價(jià)[7-9]。測(cè)定紅提的SSC、TA、pH、FI和MC含量需要獨(dú)立的實(shí)驗(yàn),常規(guī)檢測(cè)方法無(wú)法一次性獲得。市場(chǎng)迫切需要一種無(wú)損、快速準(zhǔn)確的檢測(cè)方法,實(shí)現(xiàn)對(duì)紅提內(nèi)部品質(zhì)的檢測(cè)。
光譜技術(shù)已在果蔬品質(zhì)檢測(cè)方面得到廣泛應(yīng)用[10-12]。劉燕德等[13]利用近紅外光譜技術(shù)建立了不同產(chǎn)地蘋果糖度的在線檢測(cè)通用模型,實(shí)現(xiàn)蘋果糖度的快速在線無(wú)損檢測(cè)。王轉(zhuǎn)衛(wèi)等[14]利用近紅外光譜技術(shù)建立了蘋果可溶性固形物含量、硬度、pH和含水率的最小二乘支持向量機(jī)和極限學(xué)習(xí)機(jī)模型,實(shí)現(xiàn)了蘋果各內(nèi)部品質(zhì)指標(biāo)的檢測(cè)。羅一甲等[15]利用近紅外光譜技術(shù)結(jié)合GA-ELM預(yù)測(cè)模型實(shí)現(xiàn)了對(duì)赤霞珠葡萄總酚含量快速準(zhǔn)確檢測(cè)。Mza等[16]利用近紅外光譜技術(shù)實(shí)現(xiàn)了蘋果成熟度無(wú)損檢測(cè),選定的特征波長(zhǎng)和光譜指數(shù)可以為開(kāi)發(fā)測(cè)定蘋果成熟度的無(wú)損設(shè)備提供參考。Byun等[17]利用近紅外光譜技術(shù)研制了一種用于蘋果糖含量的近紅外(NIR)光譜儀器,實(shí)現(xiàn)了對(duì)蘋果糖含量的無(wú)損檢測(cè)。近紅外光譜技術(shù)逐漸應(yīng)用于葡萄品質(zhì)的檢測(cè)[18-19]。Luo等[20]提出了一種基于近紅外光譜的快速方法來(lái)測(cè)定整串赤霞珠葡萄的可溶性固體含量(SSC)、pH和總酚含量(TPC)的方法,實(shí)現(xiàn)了對(duì)赤霞珠葡萄整串的化學(xué)參數(shù)無(wú)損檢測(cè)。此外,近紅外光譜技術(shù)在獼猴桃、葡萄等食品已經(jīng)證明預(yù)測(cè)的可行性[21-23]。目前大多數(shù)的研究都側(cè)重于采后和貯藏[24-26]中果蔬內(nèi)部品質(zhì)指標(biāo)的檢測(cè)與變化。檢測(cè)的指標(biāo)大多為單個(gè),檢測(cè)指標(biāo)相對(duì)較少[27-28],利用近紅外光譜技術(shù)對(duì)生長(zhǎng)期紅提SSC、TA、pH、FI和MC等五個(gè)內(nèi)部指標(biāo)的研究還未見(jiàn)報(bào)道。
本文以生長(zhǎng)期紅提為研究對(duì)象,利用近紅外光譜技術(shù)分別建立準(zhǔn)確檢測(cè)紅提各內(nèi)部指標(biāo)(SSC、TA、pH、FI和MC)的最優(yōu)無(wú)損檢測(cè)模型,所建最優(yōu)模型可為生長(zhǎng)期紅提內(nèi)部品質(zhì)SSC、TA、pH、FI和MC的無(wú)損快速檢測(cè)提供新的方法。
生長(zhǎng)期紅提 從葡萄園選取10棵紅提植株并逐一進(jìn)行編號(hào),紅提生長(zhǎng)的周期大約為兩個(gè)月,實(shí)驗(yàn)從紅提開(kāi)花后的第61 d開(kāi)始,每隔5 d進(jìn)行1次樣本采集,每次采集10串葡萄,共采集12次。樣本于實(shí)驗(yàn)當(dāng)天采摘并進(jìn)行編號(hào),之后保存于恒溫恒濕箱。
Antaris II傅里葉變換近紅外光譜儀 美國(guó)Thermo Fisher;HPX-25085H-Ⅲ恒溫恒濕箱 上海新苗醫(yī)療器械制造有限公司;WAY(2WAJ)阿貝爾折射儀 申光;TMS-PRO型質(zhì)構(gòu)儀 美國(guó)FTC公司;XGQ-2000電熱鼓風(fēng)干燥箱 余姚市星辰儀表廠。
1.2.1 樣品的選擇 在每串葡萄串的頂部、中部、底部各挑選5粒大小相近、完好無(wú)損的果粒,每串共采集15粒果粒作為實(shí)驗(yàn)材料。因單個(gè)果粒進(jìn)行擠壓后擠出的果汁較少,無(wú)法利用實(shí)驗(yàn)方法同時(shí)對(duì)紅提SSC、TA、pH指標(biāo)的測(cè)定,所以在實(shí)驗(yàn)材料中挑選3粒紅提作為紅提SSC、TA、pH指標(biāo)檢測(cè)的1個(gè)樣本,每串測(cè)定3個(gè)樣本,需要9粒紅提。從每串紅提采集的實(shí)驗(yàn)材料中分別挑選3粒作為紅提硬度和含水率的實(shí)驗(yàn)樣本,每次試驗(yàn)分別取用1粒紅提,兩個(gè)指標(biāo)各進(jìn)行3次實(shí)驗(yàn)。
1.2.2 近紅外光譜數(shù)據(jù)采集 將經(jīng)過(guò)恒溫恒濕箱處理后的樣本用Antaris II傅里葉變換近紅外光譜儀進(jìn)行光譜采集。選擇積分球模塊,利用該儀器采集樣本10000~4000 cm-1范圍的漫反射光譜信息。
1.2.3 標(biāo)準(zhǔn)理化值測(cè)定 對(duì)樣本進(jìn)行完光譜采集后,立即對(duì)樣本進(jìn)行標(biāo)準(zhǔn)理化值測(cè)定,各指標(biāo)檢測(cè)方法如下:
SSC測(cè)定:將樣本放入到紅提果粒擠壓裝置榨汁,測(cè)定經(jīng)紗布過(guò)濾后的果汁的SSC值。樣本SSC測(cè)定參照NY/T 2637-2014《水果、蔬菜制品可溶性固形物含量的測(cè)定——折射裝置法》。
TA測(cè)定:TA測(cè)定方法與SSC測(cè)定方法基本相同,參照GB/T 12456-2008《食品中總酸的測(cè)定》方法。
pH測(cè)定:利用校準(zhǔn)后的pH計(jì)對(duì)測(cè)定完SSC和總酸剩余后的果汁進(jìn)行pH的測(cè)定。
FI測(cè)定:將進(jìn)行光譜檢測(cè)后的紅提樣本橫向放置在質(zhì)構(gòu)儀的實(shí)驗(yàn)臺(tái)上,采用P100/R探頭進(jìn)行壓縮。設(shè)置質(zhì)構(gòu)儀的測(cè)前速度為2.0 mm/s,測(cè)試速度為1.0 mm/s,測(cè)后速度為2.0 mm/s,起始力設(shè)置為0.05 N,壓縮距離為8.0 mm。FI的測(cè)定值為壓縮過(guò)程中樣本承受的最大壓力值
MC測(cè)定:含水率采用國(guó)標(biāo)GB 5009.3-2016《食品中水分的測(cè)定》進(jìn)行測(cè)定。
PLSR算法是一種較優(yōu)的通過(guò)最小化偏差平方和實(shí)現(xiàn)對(duì)曲線進(jìn)行線性擬合的算法,具有較多的優(yōu)點(diǎn)。各指標(biāo)均建立PLSR模型。模型的評(píng)價(jià)由預(yù)測(cè)集相關(guān)系數(shù)(Rp)、均方根誤差(RMSEP)和殘差預(yù)測(cè)偏差(RPD)進(jìn)行模型性能的評(píng)價(jià)[1]。
由圖1可知,樣本光譜曲線中存在4個(gè)明顯波谷,分別為 4520、6000、7900、9350 cm-1。為消除噪聲等干擾信息,本研究選擇標(biāo)準(zhǔn)正態(tài)變量變換(Standard Normal Variable transformation,SNV)等預(yù)處理方法對(duì)原始光譜(RAW)進(jìn)行處理[29-30]。采用不同預(yù)處理方法對(duì)RAW進(jìn)行處理后所建PLSR檢測(cè)模型的結(jié)果如表1所示。
圖1 原始光譜信息Fig.1 Raw spectral information
表1 采用不同預(yù)處理方法的全波長(zhǎng)PLSR檢測(cè)模型Table 1 Full-band PLSR prediction model using different preprocessing methods
對(duì)于SSC、TA、FI、MC來(lái)說(shuō),經(jīng)過(guò)SG預(yù)處理后的原始光譜所建PLSR模型的Rc(每個(gè)模型對(duì)應(yīng)的Rc值分別為0.9834、0.9799、0.9241、0.9223)和Rp(每個(gè)模型對(duì)應(yīng)的Rp值分別為0.9444、0.9697、0.9155、0.8812)較大,且校正集和預(yù)測(cè)集的均方根誤差較小。因此,針對(duì)SSC、TA、FI、MC四個(gè)指標(biāo),下文選取SG預(yù)處理后進(jìn)行優(yōu)化。對(duì)于pH經(jīng)MA預(yù)處理后所建PLSR效果較好,選取MA預(yù)處理后進(jìn)行優(yōu)化。
實(shí)驗(yàn)中每個(gè)指標(biāo)各采集360個(gè)樣本,利用SPXY算法按照3:1比例劃分為校正集和預(yù)測(cè)集[31]。SSC、pH、TA、FI和MC分布范圍、校正集及預(yù)測(cè)集的平均值如表2所示。SSC、pH、TA、FI和MC校正集的分布范圍大于預(yù)測(cè)集的分布范圍,證明通過(guò)SPXY算法劃分后校正集的樣本更具有代表性,校正集樣本分布的范圍更廣對(duì)根據(jù)校正集所建模型的穩(wěn)定性及準(zhǔn)確性都會(huì)有所提升,利用SPXY算法劃分樣本集達(dá)到了較好的效果。
表2 生長(zhǎng)期紅提樣本利用SPXY算法劃分樣本集的數(shù)據(jù)統(tǒng)計(jì)Table 2 Growth statistics of red globe grape extract samples during growing period using SPXY algorithm to divide the sample set
將經(jīng)過(guò)光譜預(yù)處理的原始光譜利用CARS算法、SPA算法和UVE算法提取特征波長(zhǎng),以下以SSC特征波長(zhǎng)提取過(guò)程舉例說(shuō)明[32]。
CARS的提取過(guò)程見(jiàn)圖2,蒙特卡羅采樣設(shè)置為50次,5折交叉驗(yàn)證。當(dāng)RMSECV值達(dá)到最小值時(shí),為所建PLSR模型的最優(yōu)結(jié)果,當(dāng)運(yùn)行為圖中豎線的位置時(shí),RMSECV值最小值時(shí),采樣運(yùn)行了18次。
圖2 基于CARS算法的樣本的SSC特征波長(zhǎng)提取圖Fig.2 Characteristic wavelength selection chart of SSC content in red globe grape extraction based on CARS algorithm
SPA算法[33]提取過(guò)程見(jiàn)圖3,根據(jù)RMSE的變化來(lái)確定被選取的特征變量,隨著變量個(gè)數(shù)的增加,RMSE先迅速下降,表明光譜中的無(wú)用信息被高效剔除,然后趨于平穩(wěn)。圖4(a)中RMSE取得最小值24為選定的波長(zhǎng)個(gè)數(shù),最終選取的波長(zhǎng)點(diǎn)索引見(jiàn)圖3(b),模型取得最好的效果。
圖3 基于SPA算法的紅提SSC含量特征波長(zhǎng)選取圖Fig.3 Characteristic wavelength selection chart of SSC content in red globe grape extraction based on SPA algorithm
UVE提取特征波長(zhǎng)的后選取的結(jié)果見(jiàn)圖4,設(shè)定噪聲矩陣最大穩(wěn)定性絕對(duì)值的99%作為剔除閾值,左側(cè)黃色曲線為光譜信息,右側(cè)紅色曲線為添加的噪聲信息,只保留兩條虛線外側(cè)的有用信息。
圖4 基于UVE算法的紅提SSC含量特征波長(zhǎng)選取圖Fig.4 Characteristic wavelength selection chart of SSC content in red globe grape extraction based on UVE algorithm
結(jié)合表1選取的最優(yōu)預(yù)處理方法,對(duì)于SSC、TA、FI、MC來(lái)說(shuō),經(jīng)過(guò)SG預(yù)處理后的原始光譜所建PLSR效果最佳;對(duì)于pH指標(biāo),原始光譜進(jìn)行MA預(yù)處理后所建PLSR模型效果最佳。本文對(duì)預(yù)處理后的光譜采用UVE算法、CARS算法和SPA算法等一次降維算法提取特征波長(zhǎng)后建立PLSR模型。由表3可知,一次降維算法對(duì)樣本的SSC、TA指標(biāo)的提取效果較差。經(jīng)過(guò)二次降維算法提取特征波段后,樣本SSC和TA的CARS-SPA模型的RPD分別為4.8637和4.9006,模型的性能得到了提升。原始光譜經(jīng)過(guò)MA預(yù)處理建立的pH的PLSR模型也需要進(jìn)行二次特征波長(zhǎng)提取,二次降維后建立的CARS-SPA模型的 RPD為 6.0939。對(duì)于 FI和MC兩個(gè)指標(biāo),經(jīng)過(guò)CARS特征波段提取后,F(xiàn)I和MC的RPD達(dá)到3.4453和2.5825,所建模型的效果較好。
表3 基于不同特征波段提取方法建立的PLSR模型效果Table 3 Effects of PLSR models based on different feature band extraction methods
對(duì)于紅提SSC、TA和pH,CARS-SPA組合降維算法提取特征波長(zhǎng)效果最佳;對(duì)于紅提FI和MC,一次降維算法CARS提取特征波長(zhǎng)效果最佳。在特征波長(zhǎng)提取的基礎(chǔ)上建立的紅提的SSC、TA的最優(yōu)檢測(cè)模型為SG-CARS-SPA-PLSR模型,pH的最優(yōu)檢測(cè)模型為MA-CARS-SPA-PLSR模型,F(xiàn)I和MC的最優(yōu)檢測(cè)模型為SG-CARS-PLSR模型。所建立的紅提的SSC、TA、pH、FI和MC的最優(yōu)PLSR模型的RPD值均大于2.5,說(shuō)明模型檢測(cè)效果較好。圖5為樣本的檢測(cè)效果圖,五個(gè)模型的Rc的值分別為:0.9811、0.9816、0.9878、0.9579、0.9384,五個(gè)模型的Rp的值分別為:0.9787、0.9811、0.9870、0.9568、0.9329,五個(gè)模型的RPD的值分別為:4.4837、4.9006、6.0939、3.4453、2.5825。
圖5 基于最優(yōu)特征波長(zhǎng)組合建立的紅提內(nèi)部品質(zhì)各指標(biāo)的PLSR模型Fig.5 PLSR model of various indexes of internal quality of red globe grape extract based on optimal characteristic wavelength combination
利用近紅外光譜技術(shù)對(duì)生長(zhǎng)期的紅提進(jìn)行光譜實(shí)驗(yàn)采集后,不同生長(zhǎng)期紅提的光譜曲線都呈現(xiàn)出相同的變化趨勢(shì),波峰及波谷的位置比較固定,光譜曲線的變化產(chǎn)生的原因?yàn)榧t提內(nèi)部物質(zhì),主要是含氫基團(tuán)的物質(zhì)對(duì)不同波段光譜的吸收和反射特性不同,SSC、TA、pH、FI和MC等指標(biāo)因內(nèi)部各物質(zhì)的不同而有所差異。說(shuō)明光譜在進(jìn)行紅提內(nèi)部各指標(biāo)檢測(cè)時(shí)光譜曲線比較穩(wěn)定,也從另外一個(gè)方面說(shuō)明了用近紅外光譜技術(shù)進(jìn)行檢測(cè)的可靠性和穩(wěn)定性。紅提生長(zhǎng)過(guò)程中內(nèi)部品質(zhì)的變化會(huì)引起光譜曲線的變化,可通過(guò)本文建立的最優(yōu)模型實(shí)現(xiàn)對(duì)紅提各內(nèi)部品質(zhì)指標(biāo)的無(wú)損檢測(cè)。在紅提生長(zhǎng)過(guò)程中內(nèi)部物質(zhì)會(huì)發(fā)生一定的轉(zhuǎn)化,SSC、TA、pH、FI和MC等指標(biāo)因內(nèi)部各物質(zhì)的不同而有所差異,隨著果實(shí)的成熟,SSC和pH逐漸的增加,TA、FI和MC逐漸的減小,說(shuō)明果實(shí)品嘗的甜度會(huì)慢慢增加,果實(shí)逐漸成熟。后期將在本文的研究基礎(chǔ)上,深入探究紅提成熟度各內(nèi)部指標(biāo)的轉(zhuǎn)化特性,建立紅提成熟度與近紅外光譜特征波長(zhǎng)的對(duì)應(yīng)關(guān)系模型。
本文選取生長(zhǎng)期內(nèi)的紅提作為研究對(duì)象,利用Antaris II近紅外光譜儀采集了360個(gè)紅提樣本的近紅外光譜信息。通過(guò)光譜預(yù)處理和各種降維算法提取光譜信息的特征波長(zhǎng)建立了紅提的SSC、TA、pH、FI和MC的最優(yōu)PLSR檢測(cè)模型。得到的結(jié)論如下:
對(duì)于紅提SSC、TA和pH,CARS-SPA組合降維算法提取特征波長(zhǎng)效果最佳;對(duì)于紅提FI和MC,一次降維算法CARS提取特征波長(zhǎng)效果最佳。
紅提的SSC、TA的最優(yōu)檢測(cè)模型為SG-CARSSPA-PLSR模型,pH的最優(yōu)檢測(cè)模型為MA-CARSSPA-PLSR模型,F(xiàn)I和MC的最優(yōu)檢測(cè)模為SG-CARSPLSR模型。
紅提SSC、TA、pH、FI和MC的最優(yōu)檢測(cè)模型的 RPD 的值分別為:4.4837、4.9006、6.0939、3.4453、2.5825,各指標(biāo)最優(yōu)檢測(cè)模型的Rp都大于0.93,RPD均高于2.5,表明以上模型均具有較好的檢測(cè)效果,實(shí)現(xiàn)了各內(nèi)部指標(biāo)的準(zhǔn)確檢測(cè)。本文建立的各指標(biāo)檢測(cè)模型可為生長(zhǎng)期紅提內(nèi)部品質(zhì)的無(wú)損快速檢測(cè)提供新的方法。