尚增強,楊東福,馬質(zhì)璞
(南陽農(nóng)業(yè)職業(yè)學(xué)院,河南 南陽473000)
香蕉是全球貿(mào)易量最大的水果之一,其營養(yǎng)價值豐富。香蕉屬于典型的呼吸躍變型果實,因此,在采摘后,易發(fā)生表皮轉(zhuǎn)色快、果肉褐變等軟化腐爛現(xiàn)象[1]。香蕉果實的質(zhì)量參數(shù)分為感官指標(biāo)、理化指標(biāo)和品質(zhì)參數(shù)。感官指標(biāo)包括顏色、光澤度、形狀、缺陷、質(zhì)地(硬度、脆度和韌性)等;理化指標(biāo)包含營養(yǎng)價值、潛在污染物和有毒物質(zhì);品質(zhì)參數(shù)指表征食品整體質(zhì)量的參數(shù)。目前,對于香蕉成熟期的確定有各類檢測方法,但所采用的檢測技術(shù)大多具有破壞性[2-3],試驗成本高、檢測速度慢、不能規(guī)?;瘷z測,而香蕉的最佳成熟期是其品質(zhì)和價格的保證。因此,研究一種快速、無損、高效的檢測方法,對香蕉品質(zhì)的預(yù)測和成熟期鑒別具有重要意義。
機器視覺技術(shù)因能夠識別對象的物理尺寸、形狀、顏色、紋理等屬性,被廣泛應(yīng)用于水果收獲前后的安全檢測、質(zhì)量分類等自動化領(lǐng)域。在機器視覺技術(shù)中,高光譜成像技術(shù)將光譜與傳統(tǒng)圖像相結(jié)合,可同時從物體中獲取空間尺度和光譜信息,具有快速、無損、高效等優(yōu)點,已成功應(yīng)用于水果成熟度檢測和品質(zhì)分析方面[4-7]。Li等[8]采用高光譜成像技術(shù)對櫻桃的成熟期進(jìn)行了鑒別分類,并建立了櫻桃果實中可溶性固形物含量與pH的預(yù)測模型,構(gòu)建了櫻桃品質(zhì)分析平臺。Zhang等[9]采用向量機回歸的方式對草莓高光譜數(shù)據(jù)進(jìn)行回歸建模,一定程度上能對草莓的成熟度進(jìn)行評價。楊蜀秦等[10]運用高光譜成像技術(shù)檢測成熟期葡萄果皮中花色苷含量,建立了花色苷含量的預(yù)測模型。此外,高光譜成像技術(shù)在藍(lán)莓、柿子等水果成熟期鑒別和品質(zhì)評價等方面均有相應(yīng)研究成果[11-12],但以上研究普遍存在識別精度不夠穩(wěn)定、檢測效率不高等問題,且目前關(guān)于香蕉成熟期及品質(zhì)分析的高光譜成像研究鮮有報道。
本文以香蕉為研究對象,采集不同成熟期和不同貯藏溫度下(20、25、30℃)的香蕉果實高光譜信息,建立光譜信息與可溶性固形物含量(SSC)、含水率及硬度的回歸模型,為香蕉成熟期的預(yù)測提供依據(jù)。
在南陽國家農(nóng)業(yè)科技園的溫室中采集未受損的“香芽蕉”的青香蕉果實樣品共270份,并用水果泡沫網(wǎng)套包裹放入保鮮盒。使用體積分?jǐn)?shù)40%的乙烯利稀釋至1 500 mg/kg,浸果30 s后分別裝袋置于黑塑料筐中催熟,并分別在不同溫度(20、25、30℃),相對濕度70%條件下貯藏。使用SHPratt公司提供的比色卡將香蕉成熟度分為6個階段(成熟階段1(Stage 1):綠色;成熟階段2(Stage 2):綠色隱黃;成熟階段3(Stage 3):綠黃偏綠;成熟階段4(Stage 4):綠黃偏黃;成熟階段5(Stage 5):黃色,尾部帶綠;成熟階段6(Stage 6):全黃),每組15份。按照每組順序進(jìn)行理化指標(biāo)的測定和光譜數(shù)據(jù)的采集,每組試驗重復(fù)3次。每隔1 d隨機選擇1組樣品進(jìn)行高光譜成像和理化指標(biāo)測定。將各成熟期試驗的香蕉果實隨機分為兩個亞組:第1組由40個樣本組成,作為建立偏最小二乘模型的訓(xùn)練集;第2組由15個樣本組成,用于建立驗證集模型。
高光譜圖像采集系統(tǒng)組成如圖1所示,主要包括:ImSpector-V10E型高光譜成像儀(光譜分辨率為3.3 nm),1 392像素×1 040像素HSIA-OL23型成像鏡頭,320像素×256像素的面陣CCD探測器,4組HSIA-LS-T-200W型對稱分布專用光源。在高光譜試驗中,相機物距固定為350 mm,曝光時間為20 ms。
圖1 高光譜成像系統(tǒng)Fig.1 Hyperspectral imaging system
將采集的高光譜圖像使用SpecVIEW軟件進(jìn)行處理,并對其進(jìn)行黑白校正[13],以消除相機暗電流及光照對高光譜圖像的影響。校正后的圖像IC為:
式中:Iraw為獲取的高光譜原始圖像;Idark為完全關(guān)閉相機鏡頭并關(guān)閉外部光源所記錄的暗圖像;Iwhite為具有99%反射率的白色參考圖像。校正后的圖像用于光譜特征信息提取、有效波長選擇和品質(zhì)參數(shù)含量的模型預(yù)測。
1.3.1 可溶性固形物含量
使用PAL-1型數(shù)顯折射儀進(jìn)行測定。將果實切分成長度相等的3部分(縱向),每個部分取10 g樣品制成漿,選定3部分相應(yīng)位置上的測量平均值(試驗重復(fù)3次)作為香蕉SSC。
1.3.2 含水率
取一定量香蕉樣品,采用精度0.1 g的電子天平測量其質(zhì)量M1。使用熱風(fēng)爐烘干箱在70℃下將樣品烘干至恒重,測量其質(zhì)量M2。根據(jù)含水率(w)計算公式w(%)=(M1-M2)/M1×100,求得含水率,試驗獨立重復(fù)3次。
1.3.3硬度
使用GY-1型指針式水果硬度計(浙江托普云農(nóng)科技股份有限公司)測定,將香蕉果實切成50 mm小段,用直徑3.5 mm的圓柱形探針以0.5 mm/s的速度測量果肉的硬度,下壓深度設(shè)定為10 mm。選取香蕉縱向區(qū)域中的3個位置進(jìn)行測量,取其平均值作為香蕉硬度值。
采用偏最小二乘分析法(Partial least squares,PLS)建立光譜反射率與果實品質(zhì)參數(shù)(SSC、含水率和硬度)之間的預(yù)測模型。PLS模型通常用于建立基于同一目標(biāo)/樣本的兩個數(shù)據(jù)集(即高光譜值和品質(zhì)參數(shù))的多元模型。PLS可以將大量的高相關(guān)性試驗數(shù)據(jù)轉(zhuǎn)換成獨立的潛在變量[14-15]。
以香蕉果實全光譜826個波長變量作為預(yù)測變量,利用PLS算法,確定屬性X^的預(yù)測值如下:
式中:X^為香蕉果實品質(zhì)參數(shù)的預(yù)測值;T為波長加權(quán)分?jǐn)?shù);a為PLS潛在變量數(shù);β為回歸系數(shù)。
根據(jù)預(yù)測的殘差平方和(PRESS)確定用于建立校正模型的最佳潛在變量數(shù)。
在高光譜圖像處理中,選擇合適的特征波長至關(guān)重要。這些特征波長需要保證不丟失光譜的關(guān)鍵信息和最大限度還原初始數(shù)據(jù),并除去冗余信息以及相應(yīng)噪聲以減少數(shù)據(jù)處理量,為后續(xù)建立預(yù)測模型奠定基礎(chǔ)。本文選擇從PLS校準(zhǔn)模型得到的回歸系數(shù)β最高絕對值作為最佳特征波長[16],然后使用這些選定的最佳特征波長,利用MATLAB建立多元線性回歸模型[17],如下所示:
其中:Y^為最佳特征波長a0的數(shù)目,RλN為預(yù)測模型中第N項波長處的光譜反射率。
為了確定表征不同成熟階段所選波長的可靠性,對反射光譜數(shù)據(jù)進(jìn)行了主成分分析(Principal components analysis,PCA)。主成分分析是將采集的數(shù)據(jù)集轉(zhuǎn)換成一個新的坐標(biāo)系以對其光譜數(shù)據(jù)進(jìn)行降維,該坐標(biāo)系中投影在第一坐標(biāo)系中的數(shù)據(jù)集方差最大,也稱為第一主成分。PCA主要用于香蕉光譜數(shù)據(jù)的相關(guān)性分析,其通過正交變換將存在相關(guān)性的變量轉(zhuǎn)換成彼此間相互獨立的變量,對數(shù)據(jù)集降維,同時得到最能表征樣本屬性的變量。
采集到香蕉全光譜信息后,將圖像導(dǎo)入ENVI 4.7軟件中進(jìn)行數(shù)據(jù)預(yù)處理。由于采集到的高光譜樣本曲線在兩端的噪點較多,為了提高預(yù)測模型的精度,在不同溫度(20、25、30℃)下,從6個不同成熟階段的香蕉果實中收集400~1 000 nm范圍內(nèi)的826個波段光譜數(shù)據(jù)用于后續(xù)處理,其平均光譜反射率曲線如圖2所示。從圖中可以看出,在果實成熟第1階段和第2階段,香蕉果實的水分含量會影響光譜特征吸收帶的形成。與早期成熟階段(Stage 1~Stage 3,下同)的香蕉果實相比,表征4、5、6階段的香蕉果實,其光譜反射率值相對較低。香蕉果實在成熟早期階段有3個寬吸收帶,分別位于450、680、960 nm區(qū)域。
圖2 香蕉不同成熟階段的高光譜反射率曲線Fig.2 Hyperspectral reflectance curves of banana fruits at different mature stages
在670~710 nm光譜范圍內(nèi),香蕉果實在3種不同溫度下貯藏時均能觀察到葉綠素的存在[18]。20℃貯藏的成熟階段1和成熟階段2的香蕉果實中葉綠素含量顯著高于25℃和30℃。在成熟階段4~6未見這種吸收,這主要是因為香蕉果實完成轉(zhuǎn)色過程,葉綠素已完全降解。在不同的貯藏溫度下,與20℃和25℃貯藏的香蕉果實相比,30℃貯藏的香蕉果實在第1成熟階段的葉綠素色素吸收較低,其果實轉(zhuǎn)色較快,中后期成熟階段(Stage 4~Stage 6)的香蕉果實光譜反射率比成熟階段1~3的光譜反射率低,這是因為中后期成熟階段香蕉果實的含糖量較高。
水分是香蕉果肉和果皮中最豐富的成分,800~960 nm的光譜帶表征香蕉果實的含水量,根據(jù)果實中的水分含量清晰地劃分了各個階段。由于未成熟的果皮具有較高的水分,因此表征未成熟階段1和階段2的香蕉果實的光譜反射相對較高,而代表中后期成熟階段(Stage 4~Stage 6)的香蕉果實光譜反射相對較低。這是因為在香蕉果實成熟的中后期,果肉中水分從果皮到果肉的滲透運動,同時存在大量淀粉呼吸分解現(xiàn)象。
不同成熟期香蕉果實理化指標(biāo)存在顯著差異,包括顏色、SSC、硬度和含水率,果實在成熟過程中這些品質(zhì)參數(shù)同時發(fā)生了顯著變化。在果實轉(zhuǎn)色過程中涉及各種酶促反應(yīng),其中糖與淀粉的比例增加,并形成一種特征香氣。之后,果皮會出現(xiàn)褐色斑點,然后完全變?yōu)楹稚?,果肉硬度下降,果肉白色紋理質(zhì)地變?yōu)槟z狀,而光譜吸收帶也在這些過程中發(fā)生相應(yīng)變化。
為了提高數(shù)據(jù)處理速度,挑選共線性最小、冗余最少的波長,通過選擇預(yù)測殘差平方和(Predicted residual error sum of squares,PRESS)的最小值來確定最佳的特征波段。由圖3可知,該模型826個波段降維成10個特征波段,它們大部分都處于光譜曲線的波峰和波谷位置,可以較好地反映出光譜曲線的走勢,極大地減少了冗余信息。
圖3 PLS挑選特征波長過程Fig.3 The process of selecting characteristic wavelength by PLS
基于PLS的β回歸系數(shù)進(jìn)行降維分析,結(jié)果見圖4。預(yù)測含水率、SSC和硬度等內(nèi)在品質(zhì)屬性的香蕉果實成熟期的最佳特征波長分別為440、525、633、665、672、709、760、879、925、984 nm,所選擇的特征波長與β回歸系數(shù)的最高絕對值相對應(yīng)。
圖4 基于PLS的特征降維分析Fig.4 Feature dimension reduction analysis based on PLS
對所選特征波長進(jìn)行主成分分析。由圖5可知,前兩個主成分解釋的香蕉果實成熟期差異累積貢獻(xiàn)率達(dá)到98.26%,其中第1主成分的貢獻(xiàn)率和第2主成分的貢獻(xiàn)率分別為89.88%和8.38%。
圖5 選定特征波長的主成分分析Fig.5 Principal component analysis of selected characteristic wavelength
構(gòu)建PLS優(yōu)選特征波長的MLR模型,并進(jìn)一步建立SSC的PLS模型預(yù)測散點圖(圖6)。MLR模型表明:10個PLS變量的校正模型擁有可靠的精度,SSC訓(xùn)練集和驗證集的決定系數(shù)(R2)分別為0.858 4和0.894 7,說明在20℃下貯藏的香蕉果實在成熟階段使用特征波長預(yù)測SSC與測定的SSC之間具有良好的相關(guān)性,即PLS模型能夠較好地表征光譜圖像與SSC之間存在的復(fù)雜、非線性、高維度映射關(guān)系等問題。
圖6 SSC實測值和預(yù)測值散點圖Fig.6 Scatter plots of SSC measured and predicted values
通過對測得的SSC數(shù)據(jù)進(jìn)行統(tǒng)計分析(表1)可以得出,對于20℃貯藏的香蕉果實,其成熟階段1~4的果實SSC呈顯著升高趨勢(P<0.05),之后在第5、6成熟階段開始顯著下降(P<0.05)。而在25℃和30℃貯藏條件下,由于香蕉果實的快速熟化作用,SSC分別至第3成熟階段和第2成熟階段達(dá)到最高,之后快速下降。
表1 不同成熟階段香蕉的SSC測定值Table 1 SSC values of banana in different maturity stages 單位:°Brix
分析香蕉果實成熟過程中不同貯藏溫度(20、25、30℃)下SSC的變化,以成熟期(x)為橫坐標(biāo),可溶性固形物含量(y)為縱坐標(biāo)進(jìn)行回歸方程擬合,結(jié)果如下:
構(gòu)建PLS優(yōu)選特征波長的MLR模型,并進(jìn)一步建立含水率的PLS模型預(yù)測散點圖。由圖7可知,使用特征波長預(yù)測含水率與測得的含水率之間具有良好的相關(guān)性。在20℃貯藏條件下,香蕉果實含水率的預(yù)測模型與驗證模型的決定系數(shù)R2分別為0.873 5和0.815 5。
圖7 含水率實測值和預(yù)測值散點圖Fig.7 Scatter plots of measured and predicted water contents
對測得的含水率數(shù)據(jù)進(jìn)行統(tǒng)計分析(表2),結(jié)果表明:在第1、2、3成熟階段,香蕉果實的含水率存在顯著差異(P<0.05),但在第4和第5成熟階段,其含水率基本穩(wěn)定不變,在第6成熟階段,香蕉果實的含水率增加明顯,并且含水率隨著成熟度和貯藏溫度的升高而增加,分析其原因主要是在第5成熟階段后加速了果實中淀粉的呼吸分解作用和水分子從果皮到果肉的滲透運動。
表2 不同成熟階段香蕉的含水率測定值Table 2 Moisture contents of banana in different maturity stages 單位:%
在香蕉果實成熟的不同階段,分析了不同貯藏溫度(20、25、30℃)下含水率的變化,以成熟期(x)為橫坐標(biāo),含水率(w)為縱坐標(biāo)進(jìn)行回歸方程擬合,結(jié)果如下:
建立硬度的PLS模型預(yù)測散點圖(圖8)。由圖8可知,使用特征波長預(yù)測硬度與測得的硬度之間具有良好的相關(guān)性。在20℃貯藏條件下,香蕉果實硬度的預(yù)測模型與驗證模型的決定系數(shù)R2分別為0.912 8和0.911 4。
圖8 硬度實測值和預(yù)測值散點圖Fig.8 Scatter plots of measured and predicted hardness
對測得的香蕉果實硬度數(shù)據(jù)進(jìn)行統(tǒng)計分析(表3),結(jié)果表明:香蕉果實的硬度在成熟的各個階段均存在顯著差異(P<0.05),并隨著成熟階段的推進(jìn)和貯藏溫度的升高而顯著降低(P<0.05)。
表3 不同成熟階段香蕉的硬度測定值Table 3 Hardness measurement of banana different maturity stages 單位:kg·cm-2
硬度是香蕉果實重要的品質(zhì)特性,直接影響果實保鮮期和消費者接受度。在香蕉果實成熟的不同階段,分析了不同貯藏溫度(20、25、30℃)下果實硬度的變化。以成熟期(x)為橫坐標(biāo),硬度(F)為縱坐標(biāo)進(jìn)行回歸方程擬合,結(jié)果如下:
為了快速檢測香蕉果實不同成熟階段的SSC、含水率和硬度,本文基于高光譜成像技術(shù)和多元回歸模型,研究并建立了香蕉果實成熟期SSC、含水率和硬度的預(yù)測模型,并得出以下結(jié)論:
(1)為了提升高光譜數(shù)據(jù)處理速度,基于PLS的β回歸系數(shù),將該模型原來的826個波段降維至10個特征波段,有效地減少了冗余信息,提高了無損檢測效率。
(2)以SSC、含水率和硬度為果實品質(zhì)參數(shù),利用8個特征波長來預(yù)測香蕉果實的成熟期,并建立了各品質(zhì)參數(shù)的回歸預(yù)測模型,其SSC、含水率和硬度的預(yù)測決定系數(shù)分別為0.858 4、0.873 5和0.912 8,實現(xiàn)了不同成熟階段香蕉果實SSC、含水率和硬度無損評價,為香蕉果實品質(zhì)在線檢測提供理論基礎(chǔ),同時表明高光譜成像技術(shù)能夠較好地實現(xiàn)香蕉成熟期預(yù)測。