牛瑞敏,張淑娟,陳彩虹,孫海霞,高庭耀
(山西農(nóng)業(yè)大學(xué)農(nóng)業(yè)工程學(xué)院,山西 晉中 030800)
我國是世界上最大的核桃生產(chǎn)國和消費(fèi)國,鮮核桃仁具有豐富的營養(yǎng)價值,口感脆嫩香甜,近年來在市場上掀起了一股鮮食核桃的消費(fèi)熱潮[1-3]。貨架期是影響水果品質(zhì)的重要因素,目前,核桃在采后的貯運(yùn)銷環(huán)節(jié),所處狀態(tài)基本為室溫下的貨架期狀態(tài)[4]。而貨架期的核桃仍具有活性,青皮會發(fā)生失水皺縮,甚至產(chǎn)生褐變,使其售賣價值下降。同時,核桃仁的水分含量也會隨貯藏時間的變化而變化,而鮮食核桃仁的含水量不得低于17%[5]。因此,探究青皮的光譜信息與核桃仁水分含量的關(guān)系成為很多學(xué)者關(guān)注的技術(shù)問題。
高光譜技術(shù)具有波段多、光譜分辨率高等特點(diǎn),可以實(shí)現(xiàn)簡便、快速、無損和準(zhǔn)確檢測[6-9]。目前,高光譜技術(shù)已經(jīng)成功應(yīng)用于果蔬等農(nóng)副產(chǎn)品的貨架期預(yù)測和判別。邵園園等[10]采用高光譜成像結(jié)合化學(xué)計(jì)量學(xué)方法對不同儲存條件下的保鮮獼猴桃進(jìn)行了貨架期預(yù)測。李雄等[11]利用高光譜成像技術(shù),結(jié)合偏最小二乘判別法和偏最小二乘支持向量機(jī)算法對酥梨貨架期進(jìn)行了判別。周莉萍等[12]利用高光譜技術(shù)對覆蓋保鮮膜的新鮮菠菜葉片貨架期進(jìn)行預(yù)測,建立了偏最小二乘法判別分析模型。
現(xiàn)有的研究主要針對干食核桃,而利用高光譜成像技術(shù)預(yù)測貨架期青皮核桃的核桃仁水分含量鮮見報道[13-15]。本試驗(yàn)利用高光譜成像技術(shù)結(jié)合化學(xué)計(jì)量學(xué)方法對貨架期青皮核桃的核桃仁水分進(jìn)行快速預(yù)測,為食品加工企業(yè)和消費(fèi)者在購買青皮核桃時對其品質(zhì)的判斷提供參考依據(jù)。
本試驗(yàn)所用“禮品2號”核桃樣本采摘自山西省汾陽市協(xié)和堡村。采摘時挑選大小相近、表面光滑、無缺陷損傷的青皮核桃,采后裝于墊有泡沫的紙箱內(nèi),采摘當(dāng)天運(yùn)回實(shí)驗(yàn)室。將精選出的240個核桃樣品分別編號和標(biāo)記,并在常溫條件下儲藏。采后的第1、5、9、13、17天從常溫儲藏的樣品中每次隨機(jī)抽取48個樣品,采用Kennard-Stone算法按3∶1劃分樣本,其中,校正集180個,預(yù)測集60個[15]。分別對其進(jìn)行光譜采集,再進(jìn)行青皮及核桃仁水分含量的測定。
本試驗(yàn)采用北京卓立公司開發(fā)的“蓋亞”高光譜分選儀,儀器主要由Image-λ-N17E光譜相機(jī)、4個35 W溴鎢燈、暗箱、電移動平臺和計(jì)算機(jī)組成,波長范圍900~1 700 nm。為防止采集信息過度飽和而出現(xiàn)失真現(xiàn)象,需要先調(diào)整儀器的曝光時間和平臺移動速度,設(shè)置曝光時間20 ms,平臺移動速度2 cm/s,樣本與鏡頭距離22 cm。
為了消除鏡頭暗電流、光照不均等對所采數(shù)據(jù)的影響,需要在對數(shù)據(jù)進(jìn)行分析處理前進(jìn)行黑白校正[16]。通過掃描標(biāo)準(zhǔn)白板及遮擋鏡頭分別獲得全白圖像W和全黑圖像B。校正公式如式(1)所示。
(1)
式中R——校正后圖像
I——原始圖像
采集高光譜圖像時,正反兩面各采集1次。利用ENVI 5.1提取感興趣區(qū)域(ROI)時,選擇20×20像素的區(qū)域作為感興趣區(qū)域,以正反感興趣區(qū)域的平均反射值作為該樣本的原始光譜信息。青皮核桃不同貨架期的平均光譜如圖1所示。
圖1 青皮核桃貨架期平均光譜曲線Fig.1 Average spectral curve of fresh walnut during shelf life
測定所有樣本的青皮含水率。通過手工破殼取仁并保持核桃仁的完整性,測定對應(yīng)的核桃仁含水率。按照國家標(biāo)準(zhǔn)GB/T 5009.3—2016中的“直接干燥法”測定水分含量,結(jié)果如表1所示。
表1 貨架期青皮及核桃仁含水率統(tǒng)計(jì)Tab.1 Statistics of moisture content of green skin and walnut kernel during shelf life
模型的好壞由校正集相關(guān)系數(shù)(RC)、校正集均方根誤差(RRMSEC)、預(yù)測集相關(guān)系數(shù)(RP)和預(yù)測集均方根誤差(RRMSEP)評價。以RC和RP越接近1,RRMSEC和RRMSEP越小為標(biāo)準(zhǔn)選擇最優(yōu)模型。
核桃青皮與核桃仁的貨架期平均含水率如圖2所示。
圖2 貨架期平均含水率Fig.2 Average moisture content in shelf life
由圖2可知,核桃青皮與核桃仁的含水率均隨著貨架期的增加而逐漸降低。為進(jìn)一步確定兩者的關(guān)系,采用SPSS statistics 26軟件對青皮及核桃仁的含水率進(jìn)行相關(guān)性分析。采用斯皮爾曼(spearman)相關(guān)性系數(shù)表示青皮及核桃仁含水率之間的相關(guān)關(guān)系。其計(jì)算公式如(2)所示。
(2)
式中ρ——相關(guān)性系數(shù)
xi——第i個樣本青皮含水率
yi——第i個樣本核桃仁含水率
青皮含水率與核桃仁含水率的相關(guān)性分析如表2所示。由表2可知,青皮含水率與核桃仁含水率相關(guān)性系數(shù)ρ=0.614,說明這兩者的含水率在0.01水平相關(guān)性顯著。
表2 含水率相關(guān)性分析Tab.2 Correlation analysis of water content
連續(xù)投影法(SPA)算法是基于不同波長變量之間投影的大小來選擇候選特征波長,不僅可以消除冗余信息的共線性,而且可以避免有效信息的重疊問題[13]。所選出的特征波長如圖3所示。由圖3可知,選出11個特征波長,分別為963、1 010、1 100、1 154、1 189、1 275、1 345、1 373、1 653、1 685和1 700 nm。
圖3 特征波長分布Fig.3 Characteristic wavelength distribution
建模方法主要采用偏最小二乘回歸法(PLS)、多元線性回歸(MLR)和最小二乘支持向量機(jī)(LS-SVM)。
PLS回歸廣泛應(yīng)用于光譜分析,是一種線性回歸模型,其核心思想是把觀測到的數(shù)據(jù)分成多個部分,每部分?jǐn)?shù)據(jù)進(jìn)行不同權(quán)重的線性組合后可用來表示該區(qū)域的相應(yīng)值。
MLR較PLS計(jì)算簡單,模型易于理解,并且在實(shí)際生產(chǎn)要求不太高時,這種方式能夠降低模型復(fù)雜程度,并最終提高模型的速率。
LS-SVM是非線性回歸模型,是一種高效的算法,可減少訓(xùn)練時間,提升運(yùn)行速度,簡化計(jì)算復(fù)雜度,在模式識別、回歸分析等方面應(yīng)用廣泛。
本研究用SPA法提取特征波長后的特征值作為輸入量,分別建立PLS、MLR和LS-SVM模型,含水率預(yù)測結(jié)果如圖4所示。其中,PLS、MLR和LS-SVM模型的RP分別為0.771 6、0.771 9和0.800 7,RRMSEP分別為2.302 9、2.300 7和2.189 7。PLS和MLR預(yù)測精度相差不多,LS-SVM預(yù)測效果最好。
圖4 PLS、MLR、LS-SVM模型預(yù)測結(jié)果Fig.4 Prediction results of PLS,MLR and LS-SVM models
本文以采后第1、5、9、13、17天的青皮核桃為研究對象,利用SPA提取特征波長,分別建立PLS、MLR、LS-SVM模型。PLS模型的RP=0.771 6,RRMSEP=2.302 9;MLR模型的RP=0.771 9,RRMSEP=2.300 7;LS-SVM模型的RP=0.800 7,RRMSEP=2.189 7。所建LS-SVM預(yù)測效果最好。因此,利用高光譜成像技術(shù)可以實(shí)現(xiàn)貨架期青皮核桃的核桃仁水分快速預(yù)測。