孟慶龍,尚靜,黃人帥,陳露濤,張艷
1(貴陽學(xué)院 食品與制藥工程學(xué)院,貴州 貴陽,550005) 2(貴陽學(xué)院 農(nóng)產(chǎn)品無損檢測工程研究中心,貴州 貴陽,550005)
我國是水果生產(chǎn)大國,其中蘋果的種植面積以及總產(chǎn)量排名世界第一,但是因我國蘋果的采后分級技術(shù)相對落后,使其品質(zhì)難以把控,不能滿足高端市場的需求。水果果實(shí)的可溶性固形物含量(soluble solids content, SSC)是衡量水果口感和營養(yǎng)價(jià)值的關(guān)鍵指標(biāo),也是判斷水果成熟度的主要依據(jù),所以檢測蘋果的SSC對于判斷其內(nèi)部品質(zhì)和采收時(shí)間具有非常重要的意義。
近年來,諸多學(xué)者采用折射儀測量果汁的糖度來獲取水果的SSC[1-2],該方法的最大缺點(diǎn)就是有損檢測,需要破壞被檢測對象,而基于高光譜成像技術(shù)的無損檢測恰好可以彌補(bǔ)不足。高光譜成像技術(shù)集圖像信息和光譜信息于一體,具有分析速度快、無污染、無損傷等優(yōu)勢,深受國內(nèi)外學(xué)者的青睞,被廣泛應(yīng)用于工業(yè)[3]、食品業(yè)[4-9]、農(nóng)業(yè)[10-11]等領(lǐng)域。近年來,國內(nèi)外科研工作者已利用高光譜技術(shù)開展了關(guān)于獼猴桃[1,12]、梨[13-15]、荔枝[16]和藍(lán)莓[17-18]等水果SSC的無損檢測研究,并取得了較好的研究成果。而采用高光譜成像技術(shù)結(jié)合誤差反向傳播(error back propagation, BP)網(wǎng)絡(luò)以及多元線性回歸(multiple linear regression, MLR)對蘋果SSC的無損檢測研究相對較少。
本文采用高光譜圖像采集系統(tǒng)采集采后儲(chǔ)藏期間“富士”蘋果的高光譜圖像,并提取感興趣區(qū)域的反射光譜;應(yīng)用連續(xù)投影算法(successive projection algorithm,SPA)和競爭性自適應(yīng)重加權(quán)算法(competitive adaptive reweighted sampling,CARS)對預(yù)處理后的光譜數(shù)據(jù)進(jìn)行降維,最終基于特征光譜建立了預(yù)測蘋果SSC的BP網(wǎng)絡(luò)模型以及MLR模型,以期為蘋果SSC的檢測提供一種快速、無損的方法。
新鮮“富士”蘋果,購買于超市,選取表面無損傷的蘋果120個(gè),將其編號儲(chǔ)藏在室溫(22±2)℃條件下,取樣間隔為1 d,每次取樣30個(gè),共取樣4次,這樣目的是使建立的預(yù)測模型可以預(yù)測范圍相對較大的SSC值,增加其適用性。
高光譜圖像采集系統(tǒng)(GaiaField-F-V10),四川雙利合譜科技有限公司,系統(tǒng)結(jié)構(gòu)如圖1所示。
1-CCD相機(jī);2-成像光譜儀(圖像空間分辨率為696×700); 3-鏡頭;4-溴鎢燈光源;5-電動(dòng)平移臺(tái);6-暗箱;7-高性能計(jì)算機(jī)圖1 高光譜圖像采集系統(tǒng)示意圖Fig.1 Schematic diagram of hyperspectral imaging acquisition system
ATAGO PAL-α數(shù)字手持袖珍折射儀,日本Atago公司;TD4Z-WS臺(tái)式低速離心機(jī),湖南湘立科學(xué)儀器有限公司;JYZ-V911榨汁機(jī),九陽股份有限公司。
1.2.1 高光譜圖像采集與校正
將蘋果樣品放在暗箱中的電動(dòng)平移臺(tái)上,調(diào)整采集系統(tǒng)的參數(shù)確保能采集到清晰又不失真的高光譜圖像。相機(jī)的曝光時(shí)間是9.5 ms,蘋果樣本距離鏡頭約40 cm,電動(dòng)平移臺(tái)的移動(dòng)速度是1.35 cm/s。然后,對待檢測樣本逐一掃描,采集所有蘋果樣本的高光譜圖像。最后,采集全白和全黑的標(biāo)定圖像對原始高光譜圖像進(jìn)行校正。
1.2.2 蘋果SSC的測定
在獲取蘋果高光譜圖像后立即進(jìn)行SSC的測定。先將蘋果樣本切成小塊后榨汁,于3 000 r/min下離心5 min,然后將蘋果汁涂抹在折光棱鏡的鏡面上,連續(xù)按測量鍵按鈕多次,當(dāng)最后液晶顯示屏3次顯示值一致時(shí)記錄該值,每個(gè)樣本分別測量多次的平均值作為其實(shí)測值。
1.2.3 樣本集劃分
采用基于聯(lián)合X-Y距離的樣本劃分法(sample set partitioning based on joint x-y distances,SPXY)[19]將120個(gè)蘋果樣本劃分為90個(gè)校正集樣本和30個(gè)預(yù)測集樣本。蘋果SSC的統(tǒng)計(jì)結(jié)果見表1。從表1可知,校正集中蘋果樣本SSC相比預(yù)測集具有較寬的范圍,有助于后續(xù)建立良好的預(yù)測模型。
表1 蘋果可溶性固形物含量的統(tǒng)計(jì)結(jié)果Table 1 Statistics results of SSC of apples
1.3.1 光譜預(yù)處理
在建模之前需對光譜數(shù)據(jù)進(jìn)行預(yù)處理,試驗(yàn)采用二階導(dǎo)數(shù)(second derivative, SD)、標(biāo)準(zhǔn)正態(tài)變換(standard normal variation, SNV)、多元散射校正(multi-scatter calibration, MSC)3種光譜預(yù)處理方法[20]對光譜數(shù)據(jù)進(jìn)行預(yù)處理,并比較它們對全光譜模型的影響。光譜數(shù)據(jù)處理在ENVI 5.4和MATLAB R2016b軟件平臺(tái)中完成。
1.3.2 建模方法及模型評價(jià)
試驗(yàn)采用SPA和CARS對原始光譜數(shù)據(jù)進(jìn)行降維。采用BP網(wǎng)絡(luò)和MLR建立蘋果SSC的預(yù)測模型,其中BP網(wǎng)絡(luò)是一種多層前饋神經(jīng)網(wǎng)絡(luò),其輸入信號從輸入層經(jīng)隱含層到輸出層,能夠?qū)崿F(xiàn)輸入與輸出之間的高度非線性映射,而MLR是建立自變量X(光譜數(shù)據(jù))和因變量Y(SSC實(shí)測值)之間的線性回歸方程。以校正集的相關(guān)系數(shù)(rc)及其均方根誤差(root mean square error of calibration set,RMSEC)和預(yù)測集的相關(guān)系數(shù)(rp)及其均方根誤差(root mean square error of prediction set,RMSEP)作為判別模型性能的指標(biāo)。
蘋果樣本的原始光譜以及經(jīng)過SNV、MSC和SD預(yù)處理后的反射光譜(感興趣區(qū)域?yàn)檎麄€(gè)蘋果樣本)如圖2所示。為了進(jìn)一步分析3種光譜預(yù)處理方法(SNV、MSC和 SD)對BP網(wǎng)絡(luò)預(yù)測模型的檢測效果,分別將原始光譜以及經(jīng)過3種光譜預(yù)處理后的光譜輸入BP網(wǎng)絡(luò)模型中建模,其結(jié)果如表2所示。從表2可知,經(jīng)SD預(yù)處理后建立的BP預(yù)測模型具有最高的rp(0.87)以及最小的RMSEP(0.52),說明相比于SNV和MSC,SD光譜預(yù)處理方法更好,因此本文采用SD對原始光譜數(shù)據(jù)進(jìn)行預(yù)處理。
2.2.1 采用SPA篩選特征光譜
采用SPA篩選特征光譜時(shí),計(jì)算不同有效波長對應(yīng)的RMSEP,常常依據(jù)最小的RMSEP值選定最有效的特征光譜。RMSEP隨SPA中有效波長數(shù)的變化規(guī)律如圖3-a所示,RMSEP值隨有效波長數(shù)的增加而減小,當(dāng)有效波長數(shù)超過5時(shí),RMSEP變化不明顯,因此選取5個(gè)波長作為特征光譜,采用SPA選取的5個(gè)特征光譜分布如圖3-b所示。
a-原始光譜;b-SNV預(yù)處理;c-MSC預(yù)處理;d-SD預(yù)處理圖2 經(jīng)過不同光譜預(yù)處理后得到的反射光譜Fig.2 Reflectance spectra after different spectra preprocessings
表2 基于不同光譜預(yù)處理方法的BP模型對蘋果 可溶性固形物含量的檢測結(jié)果Table 2 SSC prediction results of apples by BP model based on different spectra preprocessing methods
a-RMSEP隨SPA中有效波長數(shù)的變化規(guī)律; b-選取的特征波長圖3 基于SPA算法從全光譜中提取特征波長Fig.3 Characteristic wavelengths selection from full spectra by SPA algorithm
2.2.2 采用CARS篩選特征光譜
在采用CARS篩選特征光譜時(shí),將蒙特卡洛采樣次數(shù)設(shè)定為50次,利用5折交叉驗(yàn)證法計(jì)算所建立的PLS模型中的交叉驗(yàn)證均方根誤差(root mean square error of cross-validation,RMSECV),結(jié)果如圖4所示。從圖4-a可知,RMSECV值隨著采樣次數(shù)的增加呈先減小后增加的趨勢,當(dāng)采樣次數(shù)達(dá)到19時(shí),RMSECV值最小,本文得到的最優(yōu)波長集包含有43個(gè)特征波長,提取的特征光譜分布如圖4-b所示。
a-不同采樣次數(shù)下RMSECV的變化規(guī)律; b-選取的特征波長圖4 基于CARS算法從全光譜中提取特征波長Fig.4 Characteristic wavelengths selection from full spectra by CARS algorithm
分別將經(jīng)SPA和CARS篩選的特征光譜輸入BP網(wǎng)絡(luò)模型以及MLR模型中,基于不同波長選取方法的BP網(wǎng)絡(luò)模型以及MLR模型對蘋果SSC的檢測結(jié)果見表3。
表3 基于不同波長選取方法的BP和MLR模型對蘋果 可溶性固形物含量的檢測結(jié)果Table 3 SSC prediction results of apples by BP and MLR model based on different variable selection methods
從表3可知,SPA-BP模型具有最高的rp(0.87)和最小的RMSEP(0.52),說明SPA-BP模型具有最好的預(yù)測性能。SPA-MLR模型的校正性能和預(yù)測性能均劣于SPA-BP模型。雖然CARS-MLR模型的校正性能較好(rc=0.95,RMSEC=0.33),但是其預(yù)測性能劣于SPA-BP模型。另外采用SPA特征波長選擇方法從256個(gè)全光譜波段中提取了5個(gè)特征變量作為BP網(wǎng)絡(luò)的光譜輸入,明顯提升了BP網(wǎng)絡(luò)模型的運(yùn)行效率。由此表明基于SPA提取的特征光譜建立的BP網(wǎng)絡(luò)模型對蘋果SSC的無損檢測具有良好的預(yù)測能力,可實(shí)現(xiàn)蘋果SSC的快速無損檢測。蘋果SSC的實(shí)測值和預(yù)測值如圖5所示。
圖5 蘋果可溶性固形物含量的預(yù)測結(jié)果Fig.5 Prediction results of SSC of apples
(1)原始光譜中除了包含自身有用信息外,外界不確定因素(如光的散射以及環(huán)境噪聲等)也會(huì)對建模效果產(chǎn)生一定影響,因此通過綜合比較3種光譜預(yù)處理方法(SD、SNV和MSC)對預(yù)測模型的檢測效果表明,SD預(yù)處理方法相比于SNV和MSC更好。
(2)為解決高光譜成像技術(shù)在水果品質(zhì)無損檢測中存在數(shù)據(jù)量冗余的難題,對預(yù)處理后的光譜數(shù)據(jù)降維,結(jié)果表明,應(yīng)用SPA和CARS分別從256個(gè)全光譜中篩選了5個(gè)和43個(gè)特征波長,明顯提升了預(yù)測模型的運(yùn)行效率。
(3)為得到蘋果SSC最優(yōu)預(yù)測模型,采用BP網(wǎng)絡(luò)模型和MLR模型對SPA和CARS算法提取的特征光譜分別建模,結(jié)果表明:基于特征光譜建立的SPA-BP網(wǎng)絡(luò)模型預(yù)測性能最優(yōu),其相關(guān)系數(shù)rp為0.87,均方根誤差RMSEP為0.52,可應(yīng)用于蘋果SSC的無損檢測。