孟慶龍,尚靜,黃人帥,張艷
1(貴陽學院 食品與制藥工程學院,貴州 貴陽,550005)2(貴陽學院 農產品無損檢測工程研究中心,貴州 貴陽,550005)
獼猴桃屬于后熟型水果,為了延長其貯藏期,經常采摘還未成熟的果實,但是如果過早采摘,果實就會特別生硬,影響口感,果實也易受冷害;若過晚采摘,果實十分柔軟就會因為易腐爛而難以貯藏[1]。獼猴桃的硬度是衡量其成熟度的關鍵指標之一,因此,開展獼猴桃硬度的快速無損檢測對于指導其采收時間、采后儲藏和加工具有重要意義。
水果硬度的傳統(tǒng)檢測方法是將果實硬度計的檢測探頭壓入水果果肉中檢測其硬度[2],然而這種方法最大的缺點是破損樣本。基于光譜技術的無損檢測方法具有諸多優(yōu)勢,如分析速度快、無污染、無損傷等,近年來,這種方法已被廣泛地用于水果品質的快速檢測,引起國內外研究學者的頗多關注[3-8]。目前,研究人員已開展了關于香蕉[9]、蘋果[10]、桃[11]、李子[2,12]、梨[13-14]和藍莓[15]等水果硬度的無損檢測,并取得了一定的成果。邵園園等[16]利用高光譜成像技術快速無損檢測了獼猴桃貨架期,研究發(fā)現獼猴桃的硬度值隨著貨架期的延長而逐漸減小,與貨架期表現出負相關性。HU等[17]無損監(jiān)測了1-甲基環(huán)丙烯對成熟期獼猴桃中糖分積累的誘導機制。尚靜等[18]采用光纖光譜技術結合化學計量學實現了李子硬度的無損檢測,其連續(xù)投影算法-誤差反向傳播網絡(successive projections algorithm-back propagation,SPA-BP)模型的預測集相關系數(rp)和均方根誤差(root mean square error of prediction,RMSEP)分別為0.70和1.61 kg/cm2。但是,關于不同成熟期獼猴桃硬度無損檢測的研究卻未見報道,而且在水果品質無損檢測中應用光譜技術存在數據量冗余的問題,嚴重影響了預測模型的檢測效率。
本文采用光纖光譜采集系統(tǒng)獲取不同成熟期“貴長”獼猴桃的反射光譜;為預測獼猴桃硬度分別構建基于全光譜數據的主成分回歸(principal component regression,PCR)和偏最小二乘回歸模型(partial least square regression,PLSR);然后分別利用競爭性自適應重加權算法(competitive adaptive reweighted sampling,CARS)以及連續(xù)投影算法(successive projection algorithm,SPA)對全光譜數據進行降維,并基于特征光譜構建獼猴桃硬度的多元線性回歸(multiple linear regression,MLR)預測模型,以期為獼猴桃硬度無損檢測裝備的開發(fā)提供理論基礎。
不同成熟期(未熟期、半熟期、成熟期、過熟期)“貴長”獼猴桃于2019年9月17日至2019年10月19日分4批次采自貴州省修文縣龍關口獼猴桃果園,樣品從不同的果樹上隨機采摘,每批次采摘50個無病蟲害且無機械損傷的樣品,共計200個。樣品采摘后立即運到實驗室,在實驗室溫度為(22±2) ℃條件下貯藏,用柔軟的紙品輕輕擦掉獼猴桃樣品表面的塵土等雜物,依次對其編號后采集光譜并測量硬度。
光纖光譜采集系統(tǒng),蔚海光學儀器(上海)有限公司,該系統(tǒng)主要由QEPro光譜儀(波長為198.2~1 006.4 nm,分辨率為2.84~3 nm)、R600-7-VIS-125F光纖(直徑為600 μm)、HL-2000鹵鎢燈光源(波長為360~2 400 nm)、RPH-1反射探頭支架、RPH-ADP適配器、WS-1標準反射白板以及Lenovo計算機等構成,系統(tǒng)結構如圖1所示。
圖1 光纖光譜采集系統(tǒng)Fig.1 Optical fiber spectroscopy acquisition system
GY-4數顯果實硬度計,杭州綠博儀器有限公司。
將待測獼猴桃緊貼在反射探頭支架RPH-1上(通過RPH-ADP適配器將反射探頭固定在反射探頭支架RPH-1上,反射探頭支架表面距離樣本約1 cm),光譜采集部位為獼猴桃赤道位置,5次采集的平均值作為該樣本的光譜數據。系統(tǒng)的積分時間為110 ms,掃描平均次數為8,滑動平均寬度為1,光譜采集由軟件OceanView控制完成。
實驗使用數顯果實硬度計測量獼猴桃樣本的硬度,硬度計的探針直徑為7.9 mm,探頭壓入果子的深度約10 mm,計量單位為kg/cm2。測量時先將獼猴桃樣本測量部位去皮,然后將探頭正對果肉處,緩慢勻速壓入,至刻線處止,每個獼猴桃樣本分別測量3個位置,3次測量結果的平均值作為該樣本的實測值。
1.5.1 特征光譜提取
實驗采取SPA和CARS選取特征波長。SPA是一種將矢量空間共線性最小化的前向變量選擇方法,其優(yōu)點在于從全光譜中選取若干個特征波長,來消除原始光譜中的多余信息,通常依據預測集均方根誤差的最小值來選定最佳的特征波長數;CARS依靠指數衰減函數對每一次循環(huán)建立的偏最小二乘模型中回歸系數絕對值最大的因數進行選擇,同時采用自適應重加權采樣技術去掉權重小的因數,經過多次重復選擇,選出交互驗證均方根誤差值最小的變量子集。特征光譜的提取在MATLAB R2016b軟件中執(zhí)行。
1.5.2 建模方法及模型評價
對全光譜數據進行降維處理后,分別基于全光譜和特征光譜數據建立了獼猴桃硬度PCR、PLSR和MLR模型。PCR方法的主體思路是先將自變量進行主成分分析,然后用主成分替換原自變量后與因變量做多元線性回歸,而PLSR是同時對自變量和因變量做主成分分析的一種多元線性回歸分析方法。當有m個自變量X(光譜數據),即X1,X2,X3,…,Xm,則自變量X和因變量Y(硬度實測值)之間具有線性回歸方程,如公式(1)所示:
Y=β0+β1X1+...+βmXm+ε
(1)
設觀察值為{(Yi,Xi1,…,Xim),i=1,2,…,n},則MLR模型可以表示成如公式(2)所示方程:
(2)
(3)
(4)
(5)
(6)
(7)
式中:nC和nP為校正集和預測集中的樣本數,yact和ymean為樣本參考值實測值和平均值,ycal和ypre為校正集和預測集中樣本預測值,SD表示預測集中樣本實測值的標準偏差。
不同成熟期獼猴桃硬度的統(tǒng)計結果如表1所示,獼猴桃的硬度值隨著其逐漸成熟而減小。在構建回歸預測模型之前,需要基于采集的光譜數據和測量的硬度值將所有獼猴桃樣本劃分為校正樣本集和預測樣本集,校正集中硬度值的范圍要比預測集的范圍寬是劃分樣本集的評判標準。本文利用SPXY(sample set partitioning based on jointx-ydistances)方法[20]將200個獼猴桃樣本按照3∶1劃分成150個校正樣本集以及50個預測樣本集。校正樣本集和預測樣本集中獼猴桃硬度統(tǒng)計數據見表2,頻率分布圖如圖2所示,校正集中獼猴桃硬度的范圍比預測集中的范圍寬,這樣劃分的樣本集有助于后期建立較優(yōu)的預測模型。
表1 不同成熟期獼猴桃硬度統(tǒng)計結果 單位:kg/cm2
表2 校正集和預測集中獼猴桃硬度統(tǒng)計結果 單位:kg/cm2
圖2 獼猴桃硬度頻率分布圖Fig.2 The probability distribution of the firmness of kiwifruit
由于原始光譜的首末兩頭含有較多的噪聲,因此剔除前10個和后10個波長,選擇波段為206.33~999.06 nm的作為有效光譜,該區(qū)域共有1 024個波長。為了提升預測模型的精確度和穩(wěn)定性,在建模之前采取多元散射校正(multiplicative sactter correction,MSC)對原始光譜數據進行預處理。圖3給出了獼猴桃樣本的原始反射光譜(圖3-a)以及經過MSC(圖3-b)預處理后的相對反射光譜。由圖3可知,在波長675 nm附近的吸收峰是由表面葉綠素的吸收而產生的,反映了獼猴桃表面的顏色信息,波長980 nm附近的吸收峰則是由水分的吸收而產生的,體現了獼猴桃的水分含量信息。
a-原始光譜;b-MSC預處理后光譜圖3 獼猴桃反射光譜Fig.3 Reflectance spectra of kiwifruit
表3 PCR和PLSR模型對獼猴桃硬度的預測結果Table 3 Firmness prediction results of kiwifruit by PCR and PLSR model
2.4.1 采用SPA提取特征波長
利用SPA提取特征波長時,通常依據RMSEP的最小值來選定最優(yōu)的特征波長數。RMSEP隨SPA中有效波長數的變化情況如圖4-a所示,表明RMSEP隨有效波長數的增加而減小,當有效波長數>7時,RMSEP減小的趨勢不明顯,因此將這7個波長(占總波長量的0.68%)作為特征光譜。圖4-b給出了提取的特征波長分布圖。
a-RMSEP隨SPA中有效波長數的變化情況;b-提取的特征波長圖4 SPA算法提取特征波長結果Fig.4 The results of characteristic wavelengths selection by SPA algorithm
2.4.2 采用CARS選取特征波長
利用CARS選取特征波長時,其蒙特卡洛取樣次數設定為50次,利用5折交叉驗證方法計算所建立的偏最小二乘(partial least squares,PLS)模型的交叉驗證均方根誤差(root mean square error of cross validation,RMSECV)。圖5給出采用CARS算法提取特征波長的結果,其中不同采樣次數下RMSECV的變化規(guī)律如圖5-c所示,可以看出第26次采樣獲得的RMSECV值最小,有42個特征波長(占總波長量的4.1%)包含在該最優(yōu)波長集中(如圖5-b所示),圖5-d給出了提取的特征波長分布圖。
a-回歸系數變化路徑;b-每次采樣中變量的變化情況;c-不同采樣次數下RMSECV的變化情況;d-提取的特征波長圖5 CARS算法提取特征波長結果Fig.5 The results of characteristic wavelengths selection by CARS algorithm
表4 基于特征光譜構建的MLR模型對獼猴桃硬度的預測結果Table 4 Firmness prediction results of kiwifruit by MLR model based on the characteristic spectra
圖6 硬度實測值與預測值散點圖Fig.6 The scatter plot of the measured versus predicted values of the firmness
為解決光纖光譜技術應用在水果品質無損檢測中存在數據量冗余的難題,對全光譜數據降維結果表明應用SPA和CARS分別在1 024條全波長里挑選出7個和42個特征波長,明顯提升了預測模型的運行效率。