高 升,徐建華
(1.青島理工大學(xué)信息與控制工程學(xué)院,山東 青島 266520;2.中國民航大學(xué)空中交通管理學(xué)院,天津 300300)
葡萄是世界四大水果之一,紅提葡萄又名紅地球葡萄,原產(chǎn)于美國,是美國加利福尼亞州立大學(xué)研究人員通過雜交實(shí)驗(yàn)培育而成的一個(gè)葡萄品種,自1986年引入我國以來,在我國廣泛種植[1]。紅提因含有較豐富的維生素、礦物質(zhì)、氨基酸等,成為我國鮮食葡萄的主要品種之一[2]。紅提果實(shí)飽滿、鮮食可口、營養(yǎng)價(jià)值高,深受人們的喜愛[3]。隨著消費(fèi)者購買能力的提升,紅提的內(nèi)部品質(zhì)成為決定銷售的決定性因素,直接影響商品的價(jià)值。總酸和硬度一直是反映水果成熟度的重要指標(biāo)[4-5]。總酸是水果的重要品質(zhì)之一,決定了果實(shí)的風(fēng)味,是消費(fèi)者進(jìn)行購買時(shí)的重要參考,也是反映水果成熟狀態(tài)的重要指標(biāo)[5-6]。總酸含量是葡萄品質(zhì)和風(fēng)味形成的關(guān)鍵物質(zhì),同時(shí)也影響葡萄酒的結(jié)構(gòu)性和清爽性,此外,葡萄酒中的果香也是由葡萄內(nèi)部的酸在發(fā)酵過程中參與酯化反應(yīng)而產(chǎn)生[7]。水果的硬度是判斷其成熟狀態(tài)和腐爛程度的一個(gè)重要指標(biāo),它決定了水果的耐貯性和成熟度[8],采后紅提果實(shí)質(zhì)地不斷發(fā)生變化,內(nèi)部組織變軟,風(fēng)味變差,特別是在長(zhǎng)距離運(yùn)輸過程中,擠壓易造成果粒機(jī)械損傷,嚴(yán)重影響紅提的感官性能、品質(zhì)和商品價(jià)值[9-10]。因此檢測(cè)紅提的總酸和硬度具有重要意義。傳統(tǒng)檢測(cè)紅提總酸和硬度方法主要是進(jìn)行破壞性生化實(shí)驗(yàn),且存在檢測(cè)時(shí)間長(zhǎng)、步驟繁瑣、只能進(jìn)行抽樣檢測(cè)等弊端[11-12],因此,利用高光譜成像技術(shù)實(shí)現(xiàn)對(duì)紅提硬度和總酸的快速、無損檢測(cè),同時(shí)利用無損檢測(cè)技術(shù),準(zhǔn)確掌握生長(zhǎng)期水果總酸和硬度指標(biāo)及分布規(guī)律,將對(duì)果園合理管理、果實(shí)成熟預(yù)測(cè)、果實(shí)最佳采摘期、產(chǎn)量預(yù)測(cè)及成熟后果實(shí)的質(zhì)量檢測(cè)具有重要的意義[8]。
高光譜成像技術(shù)結(jié)合了機(jī)器視覺技術(shù)和光譜檢測(cè)分析的優(yōu)點(diǎn),能夠同時(shí)獲取樣本的圖像信息和光譜信息[13-15]。具有操作步驟簡(jiǎn)單、檢測(cè)速度快速、檢測(cè)準(zhǔn)確性高、無損環(huán)保的優(yōu)點(diǎn),已成功應(yīng)用于水果和蔬菜等品質(zhì)的分析與檢測(cè)[16-18]。Baiano等[19]利用高光譜成像技術(shù)采集Italia、Baresana、Pizzutello、Red Globe、Michele Palieri、Crimson Seedless和Thompson Seedless七個(gè)葡萄品種的數(shù)據(jù),分析并建立了葡萄的pH值、可溶性固形物和總酸的偏最小二乘回歸(partial least square regression,PLSR)模型,證明光譜信息可以較好地表征每個(gè)理化指標(biāo)的可行性。Nogales-Bueno等[20]利用近紅外高光譜成像技術(shù)建立紅葡萄和白葡萄的總酚含量、糖度、總酸和pH值的PLSR模型,實(shí)現(xiàn)了對(duì)總酚含量、糖度、總酸和pH值的無損檢測(cè)。許鋒等[21]利用光譜儀(400~1000 nm)運(yùn)用競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)算法(competitive adaptive reweighted sampling,CARS)對(duì)預(yù)處理過的光譜進(jìn)行特征波長(zhǎng)篩選,最終構(gòu)建隨機(jī)森林預(yù)測(cè)模型,糖度和總酸的預(yù)測(cè)集相關(guān)系數(shù)(Rp)分別為0.9568和0.9405;預(yù)測(cè)均方根誤差(root mean square error of prediction,RMSEP)分別為0.3185和0.3112,實(shí)現(xiàn)了對(duì)紅提內(nèi)部的糖度和總酸含量進(jìn)行定量預(yù)測(cè)。Dong Jinlei等[11]利用高光譜成像技術(shù)結(jié)合連續(xù)投影法和無信息變量消除法,對(duì)蘋果的可溶性固形物、硬度、水分和pH值進(jìn)行預(yù)測(cè)研究。Leiva-Valenzuela等[22]使用高光譜成像技術(shù)采集在500~1000 nm波段范圍內(nèi)藍(lán)莓高光譜圖像,建立了硬度和可溶性固形物的偏最小二乘預(yù)測(cè)模型。Fan Shuxiang等[23]利用高光譜成像技術(shù)采集梨的反射圖像信息并提取感興趣區(qū)域(region of interest,ROI)的平均光譜,對(duì)比分析利用連續(xù)投影算法(successive projections algorithm,SPA)、CARS等不同特征波長(zhǎng)提取方法的建模效果,最終建立梨的可溶性固形物和硬度的最優(yōu)PLSR預(yù)測(cè)模型。孫紅等[24]利用高光譜成像實(shí)現(xiàn)了對(duì)馬鈴薯葉片含水率進(jìn)行檢測(cè)和可視化研究。陳遠(yuǎn)哲等[25]采用高光譜成像技術(shù)實(shí)現(xiàn)了對(duì)出缸期皮蛋凝膠品質(zhì)的含水率和彈性進(jìn)行可視化檢測(cè)與不同品質(zhì)預(yù)測(cè)。鄭濤等[26]利用高光譜成像技術(shù)實(shí)現(xiàn)了馬鈴薯葉片含量無損檢測(cè)以及葉綠素分布可視化表達(dá)。目前已有研究多集中于紅提采后貯藏期間內(nèi)部品質(zhì)的檢測(cè),而對(duì)生長(zhǎng)期紅提總酸和硬度的研究相對(duì)較少,且利用建立好的總酸和硬度模型實(shí)現(xiàn)生長(zhǎng)期紅提的偽彩色圖像的可視化鮮見報(bào)道。
本實(shí)驗(yàn)以生長(zhǎng)期紅提為研究對(duì)象,利用高光譜結(jié)合紅提硬度和總酸進(jìn)行研究,采集生長(zhǎng)期紅提的高光譜信息,找出能夠表征紅提總酸和硬度最優(yōu)波長(zhǎng)組合,并建立光譜信息與紅提硬度和總酸的最優(yōu)無損預(yù)測(cè)模型,進(jìn)而實(shí)現(xiàn)生長(zhǎng)期紅提硬度和總酸的可視化分析。
紅提果粒樣本均處于生長(zhǎng)期。在武漢小宛葡萄園選取10 棵紅提植株并編號(hào)用來研究紅提硬度和總酸的變化。由紅提開花時(shí)間確定實(shí)驗(yàn)周期為從紅提開花后生長(zhǎng)發(fā)育的第61天持續(xù)到第116天,每隔5 d進(jìn)行1 次采樣,每次采集實(shí)驗(yàn)樣本為10 串紅提,共采樣12 次,在每串的上部、中部、下部,各挑選2 粒(每串共6 粒紅提)大小相近的完整紅提果粒共720 個(gè),各選取360 個(gè)紅提果粒作為紅提總酸和硬度的實(shí)驗(yàn)樣本。為了保證實(shí)驗(yàn)效果,樣本于實(shí)驗(yàn)當(dāng)天采摘,采摘后將紅提樣本進(jìn)行編號(hào),需將編號(hào)后的樣本立即放入溫度設(shè)置為(22±1)℃,相對(duì)濕度為65%的恒溫恒濕箱中保存12 h。
TMS-PRO型高精度專業(yè)食品物性分析儀 美國FTC公司;HPX-25085H-III恒溫恒濕箱 上海新苗醫(yī)療器械制造有限公司。
Zolix Hyper SIS-VNIR-CL高光譜成像系統(tǒng)為美國海洋光學(xué)公司,該系統(tǒng)主要由高光譜成像光譜儀(芬蘭Spectral Imaging Ltd.公司)、CCD相機(jī)(日本Hamamatsu公司)、4 個(gè)50 W的鹵素?zé)簦ū本┳苛h光儀器有限公司)、1 臺(tái)絲桿式位移控制平臺(tái)(北京卓立漢光儀器有限公司)等主要部件組成(圖1)。該系統(tǒng)采集的光譜波長(zhǎng)范圍為391~1043 nm(含有520 個(gè)波長(zhǎng)),分辨率為2.8 nm,整個(gè)采集系統(tǒng)置于暗箱內(nèi)。
圖1 高光譜圖像采集系統(tǒng)Fig.1 Schematic diagram of hyperspectral image acquisition system
1.3.1 高光譜圖像采集與校正
高光譜成像系統(tǒng)的參數(shù)設(shè)置:相機(jī)曝光時(shí)間為0.15 s,平臺(tái)移動(dòng)速率為1.7 mm/s,移動(dòng)范圍0~245 mm,樣本平臺(tái)與鏡頭的距離420 mm。高光譜成像系統(tǒng)在實(shí)驗(yàn)前應(yīng)進(jìn)行預(yù)熱,本實(shí)驗(yàn)設(shè)定預(yù)熱時(shí)間為30 min。受暗電流及CCD相機(jī)芯片不穩(wěn)定的影響,高光譜系統(tǒng)采集到的圖像會(huì)帶有一定噪聲,為保證實(shí)驗(yàn)精度還需提取對(duì)高光譜圖像進(jìn)行黑白校正。黑白校正過程如下:1)將標(biāo)準(zhǔn)白板(聚四氟乙烯長(zhǎng)方形白板)放在圖像信息采集平臺(tái)上,獲得白板的圖像信息IW;2)蓋上相機(jī)蓋,獲得全黑圖像的圖像信息ID;3)將紅提樣本放在采集平臺(tái)上獲得原始高光譜漫反射圖像信息IR。
根據(jù)式(1)得到校正后樣本的圖像信息R[27]:
1.3.2 紅提硬度和總酸的測(cè)定
總酸測(cè)定:將通過擠壓裝置得到的果汁,參照GB/T 12456—2008《食品中總酸的測(cè)定》方法,按式(2)計(jì)算:
式中:c為NaOH標(biāo)準(zhǔn)溶液濃度/(mol/L);V為樣品滴定時(shí)消耗NaOH溶液體積/mL;V0為空白實(shí)驗(yàn)消耗的NaOH溶液體積/mL;K為換算系數(shù)(紅提中主要為酒石酸,K取0.075);m為樣品質(zhì)量/g。
硬度測(cè)定:將進(jìn)行光譜檢測(cè)后的紅提樣品橫向放置在質(zhì)構(gòu)儀的實(shí)驗(yàn)臺(tái)上,采用P100/R探頭,設(shè)置測(cè)前速率為2.0 mm/s,測(cè)試速率為1.0 mm/s,測(cè)后速率為2.0 mm/s,起始力設(shè)置為0.05 N,壓縮距離為8.0 mm,對(duì)紅提果粒進(jìn)行橫向壓縮,壓縮部位為紅提的中部位置。在進(jìn)行壓縮時(shí),隨著位移的增大,果粒受到的壓力顯著增大,當(dāng)壓縮到一定的位置時(shí),果實(shí)在較大壓力下會(huì)出現(xiàn)脆斷,壓力迅速減小,實(shí)驗(yàn)選取在整個(gè)壓縮過程中果粒所能承受的最大壓力作為評(píng)判果實(shí)硬度的指標(biāo)。
1.4.1 紅提單個(gè)果粒光譜數(shù)據(jù)提取
高光譜的數(shù)據(jù)采集在自制的帶孔載物平板上進(jìn)行,因自制的載物平板上可以同時(shí)放置15 粒紅提果粒,需要分別對(duì)單粒圖像作為ROI進(jìn)行分割,然后提取單粒紅提的光譜信息進(jìn)行研究。在Matlab 2017a軟件上對(duì)高光譜圖像進(jìn)行處理,選擇圖像中整粒紅提的圖像作為ROI,每粒紅提分3 種不同的放置模式(果柄側(cè)朝上、果柄側(cè)朝下,橫放)分別采集單粒紅提的3 次高光譜信息[12],平均光譜為上述3 種放置模式獲得的數(shù)據(jù)進(jìn)行平均,因之前研究已經(jīng)表明平均光譜的效果明顯好于其他的放置模式,本研究直接提取感興趣區(qū)域的平均光譜作為原始光譜進(jìn)行分析研究。分析時(shí)剔除因噪聲、外界光照等因素的影響,本實(shí)驗(yàn)選取450~1000 nm(含有439 個(gè)波長(zhǎng)點(diǎn))的波長(zhǎng)點(diǎn)進(jìn)行建模。在進(jìn)行感興趣區(qū)域提取時(shí),由前期的研究結(jié)果可知[12],背景與紅提果粒區(qū)域的反射率在726.6 nm處差值較大,因此選取726.6 nm處的灰度圖像進(jìn)行果粒區(qū)域的提取,首先采用Otsu閾值分割方法獲得二值圖像,然后利用中值濾波和腐蝕運(yùn)算,得到二值圖像并將該二值圖像作為掩膜模板對(duì)灰度圖像進(jìn)行掩膜操作,最后依次將每個(gè)果粒分割出來,依次提取高光譜圖像中單個(gè)紅提果粒的平均光譜信息。
1.4.2 光譜數(shù)據(jù)預(yù)處理
因外界環(huán)境、儀器噪聲的影響,使采集的原始光譜包含較多的無用信息和噪聲,影響后期模型的建立和穩(wěn)定性。選擇合理的光譜預(yù)處理方法可有效消除冗余信息,提高模型的穩(wěn)定性和精度,因此,在進(jìn)行建模前進(jìn)行光譜預(yù)處理。本研究建模前先進(jìn)行光譜預(yù)處理,能有效消除由于儀器噪音、暗電流等因素的影響,通常為了保證模型的準(zhǔn)確性,本研究采用光譜預(yù)處理方法包括:標(biāo)準(zhǔn)正態(tài)變量變換(standard normal variable transformation,SNV)、卷積平滑處理法(savitzkygolay,SG)等,并針對(duì)不同的研究指標(biāo)確定一種適合的光譜預(yù)處理方法。
1.4.3 特征波長(zhǎng)提取
SPA[28]可以挑選出最少冗余信息的變量組,有效解決信息重疊和不共線的問題。
CARS[29]是一種基于蒙特卡羅采樣法對(duì)模型進(jìn)行變量選擇的方法,利用PLS建模并去掉權(quán)重較小的變量,將交互驗(yàn)證均方根誤差(root mean square error of cross validation,RMSECV)最小的變量集作為最終選定的最優(yōu)變量子集。
無信息變量消除法(uniformative variable elimination,UVE)[30]的原理為在光譜中加入一個(gè)隨機(jī)矩陣,建立PLSR交互驗(yàn)證模型,將回歸系數(shù)均值與標(biāo)準(zhǔn)差的商作為衡量指標(biāo),挑選出需要的光譜變量。
1.4.4 樣本集的劃分
KS(Kennard-Stone)算法,原理為把所有的樣本都看作訓(xùn)練集候選樣本,依次從中挑選樣本進(jìn)訓(xùn)練集。首先選擇歐氏距離最遠(yuǎn)的2 個(gè)樣本進(jìn)入訓(xùn)練集,其后通過計(jì)算剩下的每一個(gè)樣品到訓(xùn)練集內(nèi)每一個(gè)已知樣品的歐式距離,找到擁有最大最小距離的待選樣本放入訓(xùn)練集,以此類推,直到達(dá)到所要求的樣本數(shù)目。該方法的優(yōu)點(diǎn)是能保證訓(xùn)練集中的樣本按照空間距離分布均勻。本實(shí)驗(yàn)對(duì)樣本的總酸和硬度按照3∶1比例利用KS算法劃分為270 個(gè)校正集樣本,90 個(gè)預(yù)測(cè)集樣本。計(jì)算分析校正集和預(yù)測(cè)集樣本的最小值、最大值、平均值、標(biāo)準(zhǔn)差。
1.4.5 模型的建立與評(píng)價(jià)
高光譜圖像數(shù)據(jù)上每一個(gè)像素點(diǎn)都包含一條全波長(zhǎng)的光譜反射率曲線,將每個(gè)像素點(diǎn)上的光譜數(shù)據(jù)代入到上述建立的PLSR模型中計(jì)算出相應(yīng)像素點(diǎn)的總酸和硬度,并得到紅提果粒的灰度圖像;再利用Matlab 2017a軟件中偽彩色圖像處理的方法將不同總酸和硬度用不同的顏色表示,繪制紅提果粒的總酸和硬度的可視化分布,具體步驟如下:
1)采集紅提果粒的高光譜圖像信息,然后依次分割出單粒紅提果粒高光譜圖像信息并進(jìn)行平均,獲得單粒果粒的光譜數(shù)據(jù);2)利用光譜預(yù)處理、特征波長(zhǎng)提取等方法分別建立紅提果粒的PLSR預(yù)測(cè)模型;3)提取相應(yīng)特征波長(zhǎng)圖像中每個(gè)像素的光譜反射率值;4)將高光譜圖像數(shù)據(jù)上每一個(gè)像素點(diǎn)所包含一條全波長(zhǎng)的光譜反射率數(shù)據(jù)代入建立的PLSR模型,計(jì)算紅提果粒每個(gè)像素點(diǎn)的總酸和硬度值,得到紅提果粒的灰度圖像;5)對(duì)灰度圖像進(jìn)行偽彩色處理,得到紅提果??偹岷陀捕瓤梢暬噬植?。
進(jìn)行12 次實(shí)驗(yàn),記錄每次實(shí)驗(yàn)測(cè)定的硬度、總酸數(shù)據(jù),取平均值作為最終實(shí)驗(yàn)數(shù)據(jù),分別繪制樣本的內(nèi)部品質(zhì)參數(shù)隨時(shí)間的變化圖,如圖2所示。在紅提的整個(gè)生長(zhǎng)期,總酸指標(biāo)隨著紅提成熟而減小??偹嶙兓譃? 個(gè)階段,第1個(gè)階段持續(xù)25 d(從第61天至第81天),總酸極劇下降,第2階段總酸基本固定,從91 d一直持續(xù)到實(shí)驗(yàn)結(jié)束變化較小。硬度的變化與總酸類似,第1階段下降明顯,第2階段基本保持在一個(gè)固定值。
圖2 不同生長(zhǎng)期紅提總酸(a)和硬度(b)的變化Fig.2 Changes in total acidity (a) and firmness (b) of red globe grapes at different growth stages
從圖3可以看出,所有紅提樣品的光譜都呈現(xiàn)出相同的變化趨勢(shì),在450~550 nm區(qū)間內(nèi)曲線平滑,吸光度變化較小,550 nm之后反射強(qiáng)度快速升高,725~820 nm波長(zhǎng)光強(qiáng)度較高但變化較小。
圖3 原始光譜Fig.3 Original spectra of red globe grapes
由表1可知,對(duì)于總酸指標(biāo),原始光譜經(jīng)過多元散射校正(multivariate scatter correction,MSC)預(yù)處理后所建PLSR模型的校正集相關(guān)系數(shù)(Rc)和預(yù)測(cè)集相關(guān)系數(shù)(Rp)分別為0.9817、0.9804,都高于其他預(yù)處理方法后所建模型,RMSEC和RMSEP較小,表明其他的預(yù)處理方法與原始光譜經(jīng)過MSC預(yù)處理后所建模型相比并未提高模型預(yù)測(cè)精度,且原始光譜與其他預(yù)處理方法所建模型的預(yù)測(cè)集相關(guān)系數(shù)明顯低于經(jīng)過MSC預(yù)處理所建模型。因此,對(duì)于總酸,選取經(jīng)過MSC預(yù)處理后的光譜進(jìn)行特征波長(zhǎng)提取和建模分析。
表1 采用不同預(yù)處理方法的全波長(zhǎng)PLSR預(yù)測(cè)模型Table 1 Performance of full-wavelength PLSR prediction models using different preprocessing methods
對(duì)于硬度指標(biāo),原始光譜進(jìn)行SG預(yù)處理后所建PLSR模型建立模型的Rc和Rp分別為0.9287、0.9188,都高于其他預(yù)處理方法后所建模型,RMSEC和RMSEP較小,分別為8.2339和7.4521。表明原始光譜進(jìn)行SG預(yù)處理后的光譜數(shù)據(jù)建立的PLSR模型取得了最佳效果。對(duì)于硬度,選取經(jīng)過SG預(yù)處理后的光譜進(jìn)行特征波長(zhǎng)提取和建模分析。
實(shí)驗(yàn)中總酸和硬度各采集了360 個(gè)樣本,按照3∶1比例利用KS算法劃分為270 個(gè)校正集樣品,90 個(gè)預(yù)測(cè)集樣品。由表2可以看出,總酸含量分布范圍為2.254~37.663 g/kg,校正集和預(yù)測(cè)集的平均值分別為11.283、6.575 g/kg;硬度分布范圍為9.414~121.305 N,校正集和預(yù)測(cè)集的平均值分別為34.061、30.651 N。通過KS法所劃分指標(biāo)的校正集的分布范圍比預(yù)測(cè)集的分布范圍更廣,證明所挑選出來的校正集樣品具有代表性。
表2 生長(zhǎng)期紅提樣品利用KS算法劃分樣品集的數(shù)據(jù)統(tǒng)計(jì)Table 2 Statistics of total acidity and firmness of sample sets divided by KS algorithm
2.3.1 GA提取特征波長(zhǎng)
KS劃分后的經(jīng)過預(yù)處理的原始光譜通過GA優(yōu)選出波長(zhǎng)序列分別建立紅提總酸和硬度的PLSR模型。以利用GA提取特征波長(zhǎng)建立紅提總酸PLSR模型為例,在GA運(yùn)算過程中,設(shè)定初始群體為30,交叉率為50%,變異率為1%,迭代次數(shù)為100,以最小的RMSECV為標(biāo)準(zhǔn),篩選出波長(zhǎng)點(diǎn)在迭代過程中出現(xiàn)頻次較多的波長(zhǎng)點(diǎn)為最優(yōu)波長(zhǎng)點(diǎn);經(jīng)過20 次隨機(jī)搜索后,最終選定特征波長(zhǎng)點(diǎn)為48 個(gè),如圖4所示。
圖4 基于GA算法的紅提總酸特征波長(zhǎng)選取圖Fig.4 Characteristic wavelength selection for total acidity of red globe grapes based on GA algorithm
2.3.2 SPA提取特征波長(zhǎng)
KS劃分后的經(jīng)過預(yù)處理的原始光譜通過SPA優(yōu)選出波長(zhǎng)序列分別建立紅提總酸和硬度的PLSR模型。以利用SPA提取特征波長(zhǎng)建立紅提硬度PLSR模型為例,根據(jù)SPA的原理,利用均方根誤差(root mean square error,RMSE)決定所建模型的優(yōu)劣,RMSE越小模型的穩(wěn)定性越好、精度越高。RMSE值隨著波長(zhǎng)個(gè)數(shù)的變化,會(huì)不斷的波動(dòng),如圖5a所示,當(dāng)變量個(gè)數(shù)為8時(shí),RMSE最小為7.99;在原始光譜中所選特征波長(zhǎng)位置如圖5b所示。
圖5 基于SPA算法的紅提硬度特征波長(zhǎng)選取圖Fig.5 Characteristic wavelength selection for firmness of red globe grapes based on SPA algorithm
2.3.3 CARS提取特征波長(zhǎng)
KS劃分后的經(jīng)過預(yù)處理的原始光譜通過CARS優(yōu)選出波長(zhǎng)序列分別建立紅提總酸和硬度的PLSR模型。以利用CARS提取特征波長(zhǎng)建立紅提總酸PLSR模型為例,本研究設(shè)定蒙特卡羅采樣為50 次,采用5 折交叉驗(yàn)證法。由圖6可知,取采樣50 次所建立的PLSR模型中所對(duì)應(yīng)的最小MSECV作為最優(yōu)結(jié)果,由圖6b可知,當(dāng)RMSECV達(dá)到最小值時(shí),各變量的回歸系數(shù)位于圖6c中豎直線位置,采樣運(yùn)行28 次。
圖6 基于CARS算法的紅提總酸特征波長(zhǎng)選取圖Fig.6 Characteristic wavelength selection for total acidity of red globe grapes based on CARS algorithm
2.3.4 UVE提取特征波長(zhǎng)
KS劃分后的經(jīng)過預(yù)處理的原始光譜通過UVE優(yōu)選出波長(zhǎng)序列分別建立紅提總酸和硬度的PLSR模型。以利用UVE提取特征波長(zhǎng)建立紅提硬度PLSR模型為例,應(yīng)用UVE對(duì)光譜數(shù)據(jù)進(jìn)行有效信息提取,設(shè)定噪聲矩陣處最大穩(wěn)定性絕對(duì)值的99%作為剔除閾值,圖像黃色曲線代表光譜變量的穩(wěn)定性值,紅色曲線代表噪聲變量的穩(wěn)定性值,兩水平虛線為變量的選擇閾值(±46.41),虛線內(nèi)部的為無用信息被消除,外部的為有用信息,選取結(jié)果如圖7所示,所對(duì)應(yīng)的波長(zhǎng)為選擇的特征波長(zhǎng)。通過UVE共選擇177 個(gè)特征波長(zhǎng)。
圖7 基于UVE算法的紅提硬度特征波長(zhǎng)選取圖Fig.7 Characteristic wavelength selection for firmness of red globe grapes based on UVE algorithm
由表3可知,原始光譜經(jīng)過MSC預(yù)處理建立的總酸PLSR模型的校正集相關(guān)系數(shù)與預(yù)測(cè)集相關(guān)系數(shù)相差不大,但建模所用的特征波長(zhǎng)數(shù)量較多,需要進(jìn)行特征波長(zhǎng)的提取進(jìn)一步提高模型的穩(wěn)定性和預(yù)測(cè)性能。采用不同的特征提取方法,根據(jù)最優(yōu)的波段組合分別建立PLSR模型,UVE算法提取的波段與經(jīng)過CARS、GA和SPA算法提取的特征波長(zhǎng)相比,所提取的波長(zhǎng)個(gè)數(shù)較多,UVE提取特征波長(zhǎng)的數(shù)量為298,占原始光譜數(shù)量的67.882%,預(yù)測(cè)集的相關(guān)系數(shù)為0.9794。通過CARS和SPA一次波段提取算法,所建模型的校正集和預(yù)測(cè)集的相關(guān)系數(shù)都小于原始光譜所建模型的相關(guān)系數(shù),模型雖然大大簡(jiǎn)化,但模型的預(yù)測(cè)性能有所降低。經(jīng)過UVE-SPA二次波段提取后,模型的波段數(shù)量進(jìn)一步減小,模型進(jìn)一步簡(jiǎn)化,但模型的穩(wěn)定性和預(yù)測(cè)效果有所減小,不適合總酸模型的建立。經(jīng)過CARS-SPA二次特征波段提取后,模型的校正集相關(guān)系數(shù)和RMSEC分別為0.9871、1.6623,預(yù)測(cè)集的相關(guān)系數(shù)和RMSEP為0.9851、1.3482,殘差預(yù)測(cè)偏差(residual predictive deviation,RPD)為5.6643,模型的預(yù)測(cè)性能顯著提高,提取的特征波長(zhǎng)數(shù)量為10,占原始光譜數(shù)量的2.278%,與通過其他算法處理相比,得到的特征波段最少,大大簡(jiǎn)化了模型。
表3 基于不同特征波長(zhǎng)提取方法建立的PLSR模型效果Table 3 erformance of PLSR models based on different feature wavelength extraction methods
原始光譜經(jīng)過SG預(yù)處理建立的硬度指標(biāo)的PLSR模型的校正集相關(guān)系數(shù)與預(yù)測(cè)集相關(guān)系數(shù)較小,需要進(jìn)行特征波長(zhǎng)的提取進(jìn)一步提高模型的穩(wěn)定性和預(yù)測(cè)性能。采用不同的特征提取方法,根據(jù)最優(yōu)的波段組合分別建立PLSR模型,UVE算法提取的波段與經(jīng)過CARS、GA和SPA算法提取的特征波長(zhǎng)相比,所提取的波長(zhǎng)個(gè)數(shù)較多,UVE提取特征波長(zhǎng)的數(shù)量為177,占原始光譜數(shù)量的40.319%,預(yù)測(cè)集的相關(guān)系數(shù)為0.9059,低于通過CARS算法提取特征后所建立的模型。通過SPA、GA和UVE一次波段提取算法,所建模型的校正集和預(yù)測(cè)集的相關(guān)系數(shù)都小于原始光譜經(jīng)過SG預(yù)處理所建模型的相關(guān)系數(shù),模型雖然大大簡(jiǎn)化,但模型的預(yù)測(cè)性能有所降低。經(jīng)過CARS-SPA二次波段提取后,模型的波段數(shù)量進(jìn)一步減小,模型進(jìn)一步簡(jiǎn)化,但模型的穩(wěn)定性和預(yù)測(cè)效果沒有明顯改善,不適合硬度指標(biāo)模型的建立。經(jīng)過CARS特征波段提取后,模型的校正集相關(guān)系數(shù)和RMSEC分別為0.9314、8.8040,預(yù)測(cè)集相關(guān)系數(shù)和RMSEP為0.9291、7.9354,RPD為2.5108,模型的預(yù)測(cè)性能顯著提高,提取的特征波長(zhǎng)數(shù)量為35,占原始光譜數(shù)量的7.973%,大大簡(jiǎn)化了模型。
分別利用最優(yōu)特征波長(zhǎng)組合建立紅提總酸和硬度的最佳PLSR模型,訓(xùn)練集和預(yù)測(cè)集樣本的預(yù)測(cè)值和理化測(cè)量值之間的散點(diǎn)圖如圖8所示。
圖8 基于最優(yōu)特征波長(zhǎng)組合建立的紅提總酸和硬度的PLSR模型Fig.8 PLSR models for total acidity and firmness based on optimal combination of characteristic wavelengths of red globe grape
由圖8可知,所建立的紅提總酸和硬度的最優(yōu)PLSR模型的校正集相關(guān)系數(shù)Rc分別為0.9871、0.9314,RMSEC為1.6623、8.8040;預(yù)測(cè)集相關(guān)系數(shù)Rp分別為0.9851、0.9291,RMSEP為1.3482、7.9354,模型的RPD分別為5.6643、2.5108,均大于2.5,表明預(yù)測(cè)效果較好,兩者的預(yù)測(cè)性能都滿足精度的要求。
進(jìn)行特征波長(zhǎng)提取后,所建紅提果??偹岷陀捕戎笜?biāo)的最優(yōu)模型最優(yōu)特征波長(zhǎng)如表4所示。
表4 紅提總酸和硬度的PLSR預(yù)測(cè)模型的最優(yōu)特征波點(diǎn)列表Table 4 List of optimal characteristic wavelengths for the establishment of PLSR prediction models for total acidity and hardness of red globe grapes
基于光譜信息建立的紅提總酸和硬度的PLSR預(yù)測(cè)模型的最優(yōu)特征波點(diǎn)所建方程:
式中:Y總酸為總酸的預(yù)測(cè)值;Y硬度為硬度的預(yù)測(cè)值;λi為特征波長(zhǎng)處的反射率(下標(biāo)i表示波長(zhǎng)/nm)。
利用高光譜圖像采集系統(tǒng),分別采集生長(zhǎng)期紅提果粒的高光譜圖像信息,采集的高光譜原始圖像如圖9a所示,該圖像中包含15 粒紅提果粒。選取其中的一次高光譜采集圖像,首先分割出每粒紅提的圖像,利用Matlab 2017a編程提取高光譜圖像中每一個(gè)像素點(diǎn)的光譜信息,根據(jù)MSC-CARS-SPA-PLSR模型計(jì)算出各個(gè)像素點(diǎn)的紅提果??偹岱植紙D,如圖9b所示。圖中藍(lán)色代表總酸的最低值0 g/kg,紅色代表總酸的最高值3 g/kg,從藍(lán)色到紅色代表總酸逐漸上升。通過可視化可以清晰的明確紅提總酸的分布規(guī)律,由圖9b可知,1、2、10、11、12、13號(hào)紅提果粒為深紅色,果實(shí)相對(duì)成熟,通過總酸的偽彩色圖像可視化分布可知紅色像素點(diǎn)相對(duì)較少,表明總酸的含量較低,3、4、5、6號(hào)紅提果粒顏色較綠,果實(shí)相對(duì)不成熟,通過總酸的偽彩色圖像可視化分布可知紅色像素點(diǎn)相對(duì)較多,表明總酸的含量較高,總酸含量較高,表明隨著果粒的逐漸成熟,總酸的含量降低,與實(shí)際的化學(xué)實(shí)驗(yàn)結(jié)果相一致[10],從而證明了紅提果粒總酸可視化的正確性。對(duì)單個(gè)的果粒進(jìn)行分析,紅提中間位置的總酸含量相對(duì)較高,可能與內(nèi)部的紅提果核有關(guān),表皮附近的總酸含量相對(duì)較少。
利用高光譜圖像采集系統(tǒng),分別采集生長(zhǎng)期紅提果粒的高光譜圖像信息,選取其中的一次高光譜采集圖像,首先分割出每粒紅提的圖像,利用Matlab 2017a編程提取高光譜圖像中每一個(gè)像素點(diǎn)的光譜信息,根據(jù)SG-CARS-PLSR模型計(jì)算出各個(gè)像素點(diǎn)的紅提果粒硬度分布圖,如圖9c所示。圖中藍(lán)色代表硬度的最低值5 N,紅色代表硬度的最高值為30 N,從藍(lán)色到紅色代表硬度逐漸上升。通過可視化可以清晰的明確紅提硬度的分布規(guī)律,由圖9c可知,1、2、11、12號(hào)紅提果粒為深紅色,果實(shí)相對(duì)成熟,通過硬度的偽彩色圖像可視化分布可知紅色像素點(diǎn)相對(duì)較少,表明硬度的含量較低,3、4、5、9、15號(hào)紅提果粒顏色較綠,果實(shí)相對(duì)不成熟,通過硬度的偽彩色圖像可視化分布可知紅色像素點(diǎn)相對(duì)較多,表明硬度的含量較高,硬度較高,6號(hào)紅提果粒雖然顏色較輕,但果實(shí)較軟,因此硬度值較低;表明隨著果粒的逐漸成熟,硬度降低,與實(shí)際實(shí)驗(yàn)結(jié)果一致[10],從而證明了紅提果粒硬度可視化的正確性。對(duì)每個(gè)紅提果粒進(jìn)行分析可知,在6、7、11、12號(hào)紅提果粒中紅提果柄側(cè)及中間位置的紅色區(qū)域面積相對(duì)果柄另外一側(cè)較多,表明果柄側(cè)及中間位置硬度含量相對(duì)較高,也與實(shí)際情況中果柄側(cè)顏色相對(duì)較青一致。
圖9 紅提果??偹岷陀捕鹊姆植伎梢暬瘓DFig.9 Visualization of distribution of total acidity and firmness of red globe grapes
本研究為盡量消除中心反光的問題,采用了2 種方法:第1種方法:選用4 個(gè)環(huán)繞鹵素?zé)艄庠催M(jìn)行照射,并不斷優(yōu)化4 個(gè)鹵素?zé)舻奈恢煤驼丈浣嵌?,使盡量避免中心反光的問題;第2種方法:在進(jìn)行建模時(shí),選擇應(yīng)用SG等光譜預(yù)處理在一定程度上可消除中間位置反光等干擾信息的影響。紅提果粒成球形,每個(gè)果粒都會(huì)在果粒中心位置因球形的果粒外形產(chǎn)生反光區(qū)域,中間反光的影響依然存在,但中心反光區(qū)域的面積較小,整體對(duì)果粒的影響有限,光譜曲線雖然會(huì)應(yīng)反光使中心位置的光譜強(qiáng)度增強(qiáng),但是光譜曲線吸收等位置的特性與其中內(nèi)部氫鍵有關(guān),在該反光區(qū)域?qū)崿F(xiàn)了反射率的擴(kuò)大使中間反射光的部位的確有更高的反射率,導(dǎo)致中間位置在高光譜可視化時(shí)候造成一定的影響。使在可視化時(shí)中間反光區(qū)域位置的總酸和硬度預(yù)測(cè)值較高,后期將不斷對(duì)所采集原始光譜的光照反射率進(jìn)行調(diào)整和優(yōu)化,后期在本研究基礎(chǔ)上將根據(jù)反射光強(qiáng)度變化程度,對(duì)采集的反射光譜數(shù)據(jù)進(jìn)行相應(yīng)的縮減,以進(jìn)一步減小反光的影響。
以可高光譜成像技術(shù)為主要技術(shù)手段,以生長(zhǎng)期的紅提果粒為研究對(duì)象,采集紅提果粒高光譜信息構(gòu)建了紅提果??偹岷陀捕葯z測(cè)模型,通過比較分析,得到紅提果??偹岷陀捕鹊淖顑?yōu)預(yù)測(cè)模型,并通過偽彩色圖像實(shí)現(xiàn)紅提果??偹岷陀捕鹊目梢暬植?。主要結(jié)論如下:
紅提果??偹岬淖罴涯P蜑橥ㄟ^二次波段提取的方法,紅提果粒硬度的最佳模型為通過一次波段提取的方法。對(duì)生長(zhǎng)期內(nèi)的紅提果粒進(jìn)行建模分析,深入分析不同檢測(cè)方法對(duì)各指標(biāo)的預(yù)測(cè)優(yōu)劣,得到最佳預(yù)測(cè)模型:總酸的最優(yōu)檢測(cè)模型為MSC-CARS-SPA-PLSR,其預(yù)測(cè)集相關(guān)系數(shù)Rp和RMSEP分別為0.9851、1.3482,RPD為5.6643;硬度的最優(yōu)檢測(cè)模型為SG-CARS-PLSR模型,其預(yù)測(cè)集相關(guān)系數(shù)Rp和RMSEP分別為0.9291、7.9354,RPD為2.5108。分別利用MSC-CARS-SPA-PLSR、SGCARS-PLSR預(yù)測(cè)模型計(jì)算出高光譜圖像中每個(gè)像素點(diǎn)的紅提果粒的總酸和硬度值,結(jié)合偽彩色圖像處理技術(shù)得到可視化分布圖,結(jié)果表明采用高光譜成像技術(shù)可以實(shí)現(xiàn)紅提果粒總酸和硬度的分布可視化,為直觀監(jiān)測(cè)紅提果粒生長(zhǎng)狀態(tài)及成熟度判別提供可靠的理論依據(jù)。