趙 娟 沈懋生 浦育歌 陳 昂 李 豪
(1.西北農(nóng)林科技大學(xué)機(jī)械與電子工程學(xué)院,陜西楊凌 712100;2.農(nóng)業(yè)農(nóng)村部農(nóng)業(yè)物聯(lián)網(wǎng)重點(diǎn)實(shí)驗(yàn)室,陜西楊凌 712100)
我國(guó)是蘋果種植面積最大、產(chǎn)量最高的國(guó)家。為延長(zhǎng)果實(shí)保質(zhì)期,采后蘋果大部分需要進(jìn)行貯藏[1]。蘋果的可溶性固形物(Soluble solids contents,SSC)含量和硬度是決定消費(fèi)者喜好的最重要屬性[2],然而在長(zhǎng)期貯藏期間,蘋果的SSC含量和硬度的變化(硬度下降,SSC含量先增加后減少)會(huì)影響其食用價(jià)值,過度貯藏會(huì)造成出庫(kù)品質(zhì)不佳,影響其經(jīng)濟(jì)價(jià)值[3]。為使后熟果實(shí)以較好品質(zhì)銷售,保證經(jīng)濟(jì)效益,有必要對(duì)貯藏期果實(shí)品質(zhì)進(jìn)行實(shí)時(shí)監(jiān)測(cè),基于品質(zhì)對(duì)果實(shí)出庫(kù)進(jìn)行評(píng)價(jià)預(yù)測(cè),對(duì)保障果實(shí)品質(zhì)和提高貯藏管理水平具有重要意義。
近紅外光譜技術(shù)通過透射或者反射光譜特性反映內(nèi)部組織的物理或化學(xué)信息[4-5],具有快速、易于操作和無損特點(diǎn),廣泛地應(yīng)用于水果品質(zhì)無損檢測(cè)領(lǐng)域[6-7]。許多學(xué)者使用近紅外光譜技術(shù)對(duì)貯藏期蘋果品質(zhì)進(jìn)行了深入研究,BEGHI等[8]評(píng)估可見-近紅外光譜對(duì)監(jiān)測(cè)長(zhǎng)期儲(chǔ)藏期蘋果的適用性,采集波長(zhǎng)600~1 200 nm范圍光譜并依據(jù)SSC含量對(duì)金冠和紅冠兩種蘋果進(jìn)行分類,研究表明近紅外光譜技術(shù)能夠預(yù)測(cè)貯藏期蘋果內(nèi)部化學(xué)組分。NYASORDZI等[9]利用IAD指數(shù)(波長(zhǎng)670 nm和720 nm的吸收差異指數(shù))測(cè)量3個(gè)蘋果品種的品質(zhì)屬性,發(fā)現(xiàn)在收獲時(shí)和貯藏時(shí)測(cè)量的IAD指數(shù)與蘋果的SSC含量、TA含量、硬度有關(guān),并用于對(duì)收獲時(shí)或貯藏時(shí)果實(shí)分類,但是IAD指數(shù)與硬度的決定系數(shù)較小(R2=0.51),均方根誤差較大。GIOVANELLI等[10]使用FT-NIR系統(tǒng)采集波長(zhǎng)800~2 700 nm范圍內(nèi)的漫反射光譜,建立PLS模型對(duì)貯藏期的Golden Delicious蘋果的干物質(zhì)含量、SSC含量、顏色值和硬度進(jìn)行預(yù)測(cè),SSC含量預(yù)測(cè)模型的均方根誤差為0.40°Brix。GUO等[11]采用便攜式近紅外透射光譜結(jié)合溫度補(bǔ)償法對(duì)蘋果的貯藏品質(zhì)進(jìn)行預(yù)測(cè),但是貯藏時(shí)間較短,約為53 d??锪W(xué)等[12]應(yīng)用近紅外透射光譜建立PLS模型對(duì)貯藏期寒富蘋果的SSC含量進(jìn)行預(yù)測(cè),但是僅選取了貯藏期4個(gè)時(shí)間節(jié)點(diǎn),貯藏間隔較長(zhǎng)。李光輝等[13]采集了 5個(gè)不同貯藏時(shí)間2個(gè)品種蘋果的波長(zhǎng)范圍為840~2 500 nm的光譜,用偏最小二乘法建立2個(gè)品種蘋果的TA含量、pH值和SSC含量預(yù)測(cè)模型,但是貯藏時(shí)間為120 d,與實(shí)際更長(zhǎng)的貯藏時(shí)間不符。由研究現(xiàn)狀可以看出,現(xiàn)有研究大多使用冷藏環(huán)境并且貯藏時(shí)間較短,不符合當(dāng)前蘋果長(zhǎng)達(dá)半年甚至更久的貯藏時(shí)間,研究使用的模型大多為PLS等線性模型,關(guān)于貯藏期非線性模型的研究報(bào)道較少。
針對(duì)上述問題,本文以富士蘋果為研究對(duì)象,采集果實(shí)7個(gè)月氣調(diào)貯藏期間,波長(zhǎng)1 000~2 400 nm范圍內(nèi)的光譜數(shù)據(jù)與品質(zhì)指標(biāo)(SSC含量、硬度和果實(shí)失重率),分析貯藏期間果實(shí)光譜特性和品質(zhì)的變化,基于全貯藏期的光譜,建立線性PLS模型和非線性NARX模型對(duì)蘋果氣調(diào)貯藏期品質(zhì)進(jìn)行無損預(yù)測(cè),最后根據(jù)行業(yè)標(biāo)準(zhǔn)確定蘋果出庫(kù)判斷依據(jù),并建立出庫(kù)品質(zhì)評(píng)價(jià)與預(yù)測(cè)模型,以期為提高蘋果產(chǎn)業(yè)管理水平與合理規(guī)劃庫(kù)存提供理論依據(jù)與方法。
于2020年10月在陜西省扶風(fēng)縣西權(quán)村某果園共采摘350個(gè)富士蘋果,分為50個(gè)0時(shí)刻樣本與300個(gè)貯藏期樣本,挑選大小一致、無磕碰傷害和病蟲害的樣本并于當(dāng)天放入氣調(diào)保鮮箱(GQ-300型,廣州標(biāo)際有限公司)進(jìn)行貯藏,氣調(diào)箱環(huán)境參數(shù)設(shè)置為:97%N2、2%O2、1%CO2,箱內(nèi)溫度1℃,相對(duì)濕度85%[14],0時(shí)刻樣本于當(dāng)天采摘后進(jìn)行實(shí)驗(yàn)數(shù)據(jù)采集,貯藏期實(shí)驗(yàn)從10月15日開始共持續(xù)7個(gè)月,每隔7 d取出10個(gè)樣本進(jìn)行一次實(shí)驗(yàn),待樣本恢復(fù)到室溫后進(jìn)行實(shí)驗(yàn)數(shù)據(jù)采集,共進(jìn)行30次實(shí)驗(yàn)。
1.2.1光譜數(shù)據(jù)獲取
使用NIR Quest光譜儀(Ocean Optics,美國(guó))采集光譜數(shù)據(jù),波長(zhǎng)范圍為900~2 500 nm,共512個(gè)波長(zhǎng)點(diǎn),積分時(shí)間為65 ms,平滑次數(shù)為5,平均次數(shù)為10,實(shí)驗(yàn)在室溫下進(jìn)行,測(cè)量前將光譜儀預(yù)熱30 min,光譜數(shù)據(jù)由軟件OceanView(Ocean Optics,美國(guó))獲得,測(cè)量時(shí)沿樣本赤道以120°間隔測(cè)量3次取平均值作為最終光譜數(shù)據(jù)值。使用Matlab 2019a(MathWorks,美國(guó))處理光譜數(shù)據(jù)并進(jìn)行后續(xù)建模分析。
1.2.2理化指標(biāo)測(cè)量
對(duì)樣本標(biāo)號(hào)并使用電子天平(T500Y型,常熟雙杰測(cè)試儀器廠)稱量后進(jìn)行貯藏,每次實(shí)驗(yàn)測(cè)量光譜數(shù)據(jù)前,再次測(cè)量實(shí)驗(yàn)樣本的質(zhì)量,由此得到果實(shí)的失重率,隨后使用質(zhì)地分析儀(TA.XT Express型,Stable Micro Systems,英國(guó))測(cè)量果肉硬度,測(cè)量探頭直徑為2 mm(P/2),穿刺深度為10 mm,穿刺速度為1 mm/s,測(cè)量前對(duì)質(zhì)構(gòu)儀進(jìn)行力量和高度校準(zhǔn)。
根據(jù)GB/T 12295—1990測(cè)量蘋果的SSC含量,測(cè)量時(shí)要求沿著半個(gè)蘋果的赤道部分獲取3個(gè)1.0 cm×1.0 cm×1.0 cm尺寸的蘋果切塊,擠壓榨汁后滴入便攜式數(shù)字折光儀(PAL-BX/ACID5型,ATAGO,日本),得到SSC含量的參考值。同時(shí),使用色差儀(NH310型,深圳三恩時(shí)科技公司)測(cè)量果皮顏色指標(biāo),包括L*、a*、b*、c*和h*,使用酸度計(jì)(GMK-835F型(apple),G-WON,韓國(guó))測(cè)量可滴定酸(Titratable acid,TA)含量,每個(gè)樣本測(cè)量3次,將測(cè)量結(jié)果取平均值作為最終品質(zhì)指標(biāo)的參考值。
1.3.1樣本劃分方法
SPXY算法(Sample set portion based on joint x-y distance)[15]是基于K-S算法同時(shí)考慮光譜特征與理化指標(biāo)的樣本選擇方法,有效提升了模型預(yù)測(cè)能力,使用該方法時(shí)需要準(zhǔn)確的光譜與理化測(cè)量值。
1.3.2光譜預(yù)處理方法
為了消除光譜儀產(chǎn)生的噪聲、補(bǔ)償顆粒分布不均勻及顆粒尺寸不同產(chǎn)生的散射影響,盡可能突出光譜有效信息,提高信噪比,使用S-G(Savitzky-Golay)[16]平滑和多元散射校正(Multiplicative scatter correction,MSC)[17]對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理。
1.3.3光譜特征波長(zhǎng)提取方法
對(duì)特征波長(zhǎng)進(jìn)行提取可以減少建模變量個(gè)數(shù),提高模型運(yùn)行速度。本研究使用競(jìng)爭(zhēng)自適應(yīng)重加權(quán)采樣(Competitive adaptive reweighted sampling,CARS)[18]法和連續(xù)投影算法(Successive projections algorithm,SPA)[19]進(jìn)行特征波長(zhǎng)提取。CARS法通過多次采樣運(yùn)行選擇一些變量子集,然后選擇交叉驗(yàn)證均方根誤差最低的子集作為最佳波長(zhǎng)組合。SPA是一種多變量校準(zhǔn)的前向選擇方法,用于獲得所選波長(zhǎng)中擁有最小共線性的波長(zhǎng),其原理為新選擇的變量是所有剩余變量中在前一個(gè)選定變量的正交子空間上擁有最大投影值的變量。
1.3.4建模方法
偏最小二乘法(Partial least square,PLS)[20]是一種基于因子分析的多元校準(zhǔn)方法,可以同時(shí)考慮理化值和光譜之間的基本關(guān)系。原始光譜數(shù)據(jù)經(jīng)歷線性變換后的新變量稱為隱形變量,隱形變量對(duì)模型結(jié)果有重要影響,普遍采用交互驗(yàn)證法來獲取。
非線性自回歸模型(Nonlinear autoregressive with external input,NARX)[21]是具有外部輸入和記憶功能的動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)。該網(wǎng)絡(luò)的輸出與過去的輸入以及過去的輸出有關(guān),NARX不僅模擬了時(shí)間序列,還描述了非線性關(guān)系,NARX對(duì)非平穩(wěn)或非線性時(shí)間序列有很好的預(yù)測(cè)能力。
1.3.5模型評(píng)價(jià)參數(shù)
使用校正集均方根誤差(Root mean square error of calibration set, RMSEC)、預(yù)測(cè)集均方根誤差(Root mean square error of prediction set, RMSEP)、校正集相關(guān)系數(shù)(Correlation coefficient of calibration set,Rc)和預(yù)測(cè)集相關(guān)系數(shù)(Correlation coefficient of prediction set,Rp)來評(píng)估校準(zhǔn)模型。模型的Rc和Rp越高并且RMSEC、RMSEP越低時(shí),說明模型的性能越好[22]。
1.3.6綜合評(píng)價(jià)方法
基于熵權(quán)的TOPSIS(Technique for order preference by similarity to an ideal solution)法[23]在工程、經(jīng)濟(jì)及農(nóng)業(yè)領(lǐng)域應(yīng)用廣泛[24],是一種常用的綜合評(píng)價(jià)方法,簡(jiǎn)稱為優(yōu)劣解距離法,能充分利用原始數(shù)據(jù)的信息,其結(jié)果能精確地反映各評(píng)價(jià)方案之間的差距,是一種高效率的多目標(biāo)決策方法,本研究采用基于熵權(quán)的TOPSIS法對(duì)蘋果出庫(kù)品質(zhì)進(jìn)行評(píng)價(jià)。
采集波長(zhǎng)1 000~2 400 nm范圍內(nèi)不同貯藏時(shí)間蘋果的平均漫反射光譜曲線如圖1所示。在波長(zhǎng)1 100~1 800 nm范圍處反射率下降,在波長(zhǎng)1 180、1 450、1 940 nm處存在明顯的吸收峰,其中在波長(zhǎng)1 180 nm處吸收峰是含有C—H鍵的官能團(tuán)吸收形成;波長(zhǎng)1 450 nm和1 940 nm處吸收峰是O—H鍵伸縮、彎曲振動(dòng)形成[25]。由圖1可知,不同貯藏時(shí)間的蘋果光譜總體趨勢(shì)一致,但反射率存在明顯差異。在波長(zhǎng)1 100~1 300 nm、1 550~1 800 nm和2 200~2 250 nm處,貯藏初期果實(shí)光譜反射率基本一致,在貯藏中后期果實(shí)光譜反射率明顯低于貯藏初期,隨著貯藏時(shí)間延長(zhǎng),光譜反射率明顯下降,這說明貯藏期間樣本內(nèi)部化學(xué)物質(zhì)基本相同,但是含量存在差異,光譜反射率的差異為回歸預(yù)測(cè)模型的建立提供了前提[25]。
圖1 不同貯藏時(shí)間蘋果漫反射光譜曲線
測(cè)量不同貯藏時(shí)間蘋果的平均品質(zhì)指標(biāo)結(jié)果如表1所示(表中數(shù)據(jù)形式為平均值±標(biāo)準(zhǔn)差)。隨著貯藏時(shí)間的延長(zhǎng),果實(shí)的SSC含量呈現(xiàn)先上升后下降的趨勢(shì),硬度呈現(xiàn)逐漸下降的趨勢(shì),失重率逐漸上升。蘋果在貯藏前期,內(nèi)部淀粉等糖類物質(zhì)分解,轉(zhuǎn)化為可溶性碳水化合物[26],在貯藏后期糖被呼吸作用消耗,使SSC含量呈現(xiàn)逐漸上升到峰值后緩慢下降的趨勢(shì)。蘋果發(fā)育階段的硬度較大,當(dāng)貯藏時(shí)間變長(zhǎng),可溶性果膠會(huì)增加,果實(shí)硬度開始下降,淀粉水解會(huì)導(dǎo)致細(xì)胞內(nèi)膨壓下降,果實(shí)成熟軟化,硬度下降[27]。果實(shí)采摘后水分含量高,細(xì)胞汁液飽滿,隨著脫離母體的時(shí)間變長(zhǎng),失去母體和土壤的養(yǎng)分和水分供給,持續(xù)的蒸騰作用使細(xì)胞膨壓降低,組織水分丟失得不到補(bǔ)充,果實(shí)出現(xiàn)皺縮萎蔫,呼吸作用使細(xì)胞內(nèi)貯藏物質(zhì)不斷消耗,果實(shí)失重的主要原因?yàn)檎趄v作用失水[28],失重率是評(píng)定果實(shí)鮮度基礎(chǔ)的指標(biāo),能夠直接影響果實(shí)出庫(kù)后的貨架期,氣調(diào)貯藏目的是盡
表1 不同貯藏時(shí)間蘋果品質(zhì)指標(biāo)平均測(cè)量結(jié)果
可能延長(zhǎng)果實(shí)貯藏時(shí)間,并且保證果實(shí)新鮮程度,從而延長(zhǎng)果實(shí)的貨架期。因此,研究果實(shí)的失重率能間接反映水分的丟失程度。
采集不同貯藏時(shí)間果實(shí)的表型如圖2所示。隨著貯藏時(shí)間的增加,果皮的色澤由貯藏前期著色較少較淺、大面積著色,到貯藏中后期的鮮紅色、紫紅色等不一樣的色澤。果實(shí)的生理活動(dòng)導(dǎo)致內(nèi)部多種酶含量的變化,引起色素含量的變化,果皮中花青苷、類胡蘿卜素和葉綠素決定了最終的果皮色澤變化[28],果實(shí)從初期的條紅逐漸變?yōu)轷r紅色,并且在貯藏后期會(huì)出現(xiàn)果皮褶皺失水現(xiàn)象,與失重率上升相對(duì)應(yīng)。
圖2 不同貯藏時(shí)間蘋果表型變化
對(duì)貯藏期重要品質(zhì)指標(biāo)進(jìn)行可視化相關(guān)分析,得到相關(guān)系數(shù)矩陣如圖3所示,SSC含量與其他指標(biāo)無明顯相關(guān)性,相關(guān)系數(shù)絕對(duì)值均小于0.2,TA含量與b*、失重率loss呈負(fù)相關(guān),硬度F與SSC含量、h*、失重率loss呈負(fù)相關(guān),與TA含量呈正相關(guān),L*與a*、c*明顯負(fù)相關(guān),與b*、h*明顯正相關(guān)。蘋果貯藏期生理變化復(fù)雜且指標(biāo)種類多,沒有必要將所有指標(biāo)建立預(yù)測(cè)模型,經(jīng)過可視化分析并考慮實(shí)際生產(chǎn)情況,顏色指標(biāo)一般作為參考,且在貯藏期變化不明顯,TA含量在整個(gè)貯藏期均小于0.2%,且變化幅度小,因此后續(xù)建模過程中不使用顏色指標(biāo)和TA含量建模,經(jīng)過上述分析,擬選取SSC含量、硬度和失重率建立品質(zhì)預(yù)測(cè)模型。
圖3 相關(guān)系數(shù)矩陣
2.4.1樣本劃分與光譜數(shù)據(jù)預(yù)處理
為實(shí)現(xiàn)對(duì)貯藏期果實(shí)品質(zhì)進(jìn)行實(shí)時(shí)監(jiān)測(cè),使用300個(gè)全貯藏期樣本建立品質(zhì)預(yù)測(cè)模型,獲取樣本光譜與理化指標(biāo)數(shù)據(jù)后,使用SPXY算法以比例3∶1劃分為校正集和預(yù)測(cè)集,校正集個(gè)數(shù)為225,預(yù)測(cè)集個(gè)數(shù)為75,不同指標(biāo)的樣本集劃分結(jié)果如圖4所示,SSC含量、硬度和失重率的數(shù)據(jù)范圍較寬,表明數(shù)據(jù)具有一定的代表性,樣本劃分較為合理,為了消除噪聲和背景信息,使用S-G平滑和MSC對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理。
圖4 樣本集劃分結(jié)果
2.4.2特征波長(zhǎng)提取與PLS預(yù)測(cè)模型建立
為建立快速、準(zhǔn)確的預(yù)測(cè)模型,使用CARS、SPA和CARS-SPA方法對(duì)光譜數(shù)據(jù)進(jìn)行特征波長(zhǎng)提取,挑選出共線性最小、冗余信息最少且包含主要有效信息的波長(zhǎng),不同品質(zhì)指標(biāo)特征波長(zhǎng)提取結(jié)果如圖5所示,其中陰影部分為誤差帶,以樣本光譜數(shù)據(jù)作為輸入,以內(nèi)部品質(zhì)指標(biāo)(SSC含量、硬度和失重率)作為預(yù)測(cè)對(duì)象,分別建立針對(duì)SSC含量、硬度和失重率的PLS預(yù)測(cè)模型,表2為不同特征波長(zhǎng)提取方式下PLS模型預(yù)測(cè)結(jié)果。
圖5 特征波長(zhǎng)提取結(jié)果
由表2可知,在預(yù)測(cè)SSC含量時(shí),CARS-SPA提取的特征波長(zhǎng)數(shù)量最少且精度最好,特征波長(zhǎng)個(gè)數(shù)為12個(gè),僅占全波長(zhǎng)數(shù)量的2.3%,在使用CARS的基礎(chǔ)上再使用SPA對(duì)精度的提升并不明顯,這是由于CARS法的提取原理是基于模型精度最優(yōu),而SPA是基于各變量的重復(fù)性最小[29],而單獨(dú)使用SPA時(shí)會(huì)使模型精度從0.9下降至0.8;在預(yù)測(cè)硬度時(shí),發(fā)現(xiàn)使用PLS預(yù)測(cè)貯藏期果實(shí)硬度模型的精度要明顯低于SSC含量預(yù)測(cè)模型,以往研究表明在利用光譜技術(shù)預(yù)測(cè)蘋果硬度的結(jié)果存在多樣性[10-11],貯藏期間蘋果細(xì)胞結(jié)構(gòu)的逐漸變化使果肉硬度和漫反射光譜反射率降低[30];在預(yù)測(cè)失重率時(shí),發(fā)現(xiàn)模型的Rp結(jié)果較好,但是RMSEP較高,使用全波長(zhǎng)的建模效果最好,但是模型的變量數(shù)過多,使用SPA的模型精度次之,提取變量個(gè)數(shù)為22個(gè),占全波長(zhǎng)數(shù)量的4.3%,CARS和CARS-SPA的模型精度接近,提取的波長(zhǎng)數(shù)量更少。
表2 不同特征波長(zhǎng)提取方法下PLS模型預(yù)測(cè)結(jié)果
基于PLS算法建立的SSC含量和失重率模型預(yù)測(cè)精度較好,但是RMSEP較高,硬度預(yù)測(cè)模型的精度需要提高。由于在長(zhǎng)期貯藏環(huán)境下,果實(shí)的品質(zhì)指標(biāo)(如SSC含量、硬度和含水率)與光譜特性發(fā)生了非線性變化,線性模型無法消除貯藏時(shí)間對(duì)模型的影響,PLS模型沒有將過去的時(shí)間信息重新輸入到當(dāng)前時(shí)間進(jìn)行反饋校正,而時(shí)序模型將貯藏期視為連續(xù)時(shí)間序列,將過去的時(shí)間信息進(jìn)行反饋修正,能更好地削弱時(shí)間對(duì)模型的影響,降低預(yù)測(cè)誤差。
2.4.3時(shí)間序列分析與光譜信息擴(kuò)充
與傳統(tǒng)時(shí)間序列相比,蘋果貯藏過程也是一種時(shí)間序列。貯藏期間果實(shí)的光譜和品質(zhì)會(huì)發(fā)生變化,蘋果當(dāng)前時(shí)間節(jié)點(diǎn)的光譜和品質(zhì)由上一時(shí)間節(jié)點(diǎn)的光譜和品質(zhì)決定;貯藏期蘋果受多種因素的影響,如溫度、相對(duì)濕度、空氣成分、樣本自身變化等,貯藏過程具有隨機(jī)性,因此,果實(shí)貯藏具有時(shí)間序列變化的延續(xù)性與隨機(jī)性特點(diǎn)。為了建立完整的時(shí)序模型,樣本的初始狀態(tài)至關(guān)重要,使用0時(shí)刻50個(gè)樣本與貯藏期300個(gè)樣本建立時(shí)序模型,將0時(shí)刻樣本漫反射光譜數(shù)據(jù)和品質(zhì)指標(biāo)進(jìn)行平均作為初始狀態(tài)(T0時(shí)刻),將貯藏期30次實(shí)驗(yàn)樣本漫反射光譜數(shù)據(jù)和品質(zhì)指標(biāo)每次進(jìn)行平均作為貯藏期狀態(tài)(T1~T30時(shí)刻),共計(jì)31個(gè)貯藏時(shí)間節(jié)點(diǎn)。
考慮到蘋果貯藏期是一個(gè)長(zhǎng)期保鮮和“休眠”過程,貯藏期間蘋果本身品質(zhì)變化不明顯,高頻率的測(cè)量可能會(huì)由于樣本的問題產(chǎn)生誤差,因此,本研究中每隔7 d的時(shí)間間隔合理,為了增強(qiáng)模型的適用性,對(duì)31個(gè)時(shí)間節(jié)點(diǎn)的光譜進(jìn)行二維插值,插值前、后光譜曲線如圖6所示,插值間隔為4 d,即用31個(gè)時(shí)間節(jié)點(diǎn)的光譜插值生成每2個(gè)相鄰節(jié)點(diǎn)間的光譜以擴(kuò)增更多貯藏期的信息,共生成30個(gè)時(shí)間節(jié)點(diǎn),插值結(jié)果的光譜數(shù)據(jù)均在兩相鄰節(jié)點(diǎn)間,能夠有效表示未測(cè)量時(shí)間的樣本貯藏狀態(tài)。
圖6 插值前、后光譜曲線
2.4.4非線性自回歸預(yù)測(cè)模型建立
由于全光譜數(shù)據(jù)作為輸入的預(yù)測(cè)模型運(yùn)行速度極慢,無法快速預(yù)測(cè)果實(shí)品質(zhì),因此在保證模型精度前提下對(duì)光譜數(shù)據(jù)進(jìn)行特征波長(zhǎng)提取,在預(yù)測(cè)SSC含量、硬度和失重率時(shí)分別使用經(jīng)CARS-SPA、CARS和SPA提取特征波長(zhǎng)后的光譜數(shù)據(jù)作為輸入,以品質(zhì)指標(biāo)作為輸出,考慮到蘋果貯藏期品質(zhì)變化緩慢,故確定延遲階數(shù)d=3,隱層神經(jīng)元個(gè)數(shù)設(shè)置為10,網(wǎng)絡(luò)訓(xùn)練函數(shù)設(shè)置為“Levenberg-Marquardt”,樣本劃分函數(shù)設(shè)置為“divideint”,校正集、預(yù)測(cè)集和驗(yàn)證集的劃分比例分別為0.7、0.15和0.15,誤差函數(shù)設(shè)置為“mse”,設(shè)置完成后建立非線性自回歸模型,由于相同的網(wǎng)絡(luò)結(jié)構(gòu)計(jì)算誤差有一定的差異,為了降低誤差對(duì)網(wǎng)絡(luò)測(cè)試50次,50次NARX網(wǎng)絡(luò)建模結(jié)果和平均值如圖7和表3所示。由圖7可知,SSC含量與硬度預(yù)測(cè)模型的Rp和RMESP較為穩(wěn)定,失重率預(yù)測(cè)模型的RMSEP變化范圍較大,但基本都低于1%。
圖7 模型運(yùn)行50次結(jié)果
由表3可知,NARX在預(yù)測(cè)SSC含量時(shí)精度比PLS模型降低0.088°Brix,但是模型RMSEP降低0.220°Brix,下降43.0%,明顯低于PLS模型,在預(yù)測(cè)硬度和失重率時(shí)模型的精度與PLS模型相比均有所提升,Rp分別增加0.163和0.046,RMSEP分別減少0.338 kg/cm2和0.286個(gè)百分點(diǎn),分別下降41.5%和29.5%。
表3 NARX模型預(yù)測(cè)結(jié)果
2.5.1蘋果出庫(kù)品質(zhì)評(píng)價(jià)
蘋果在采摘時(shí)往往沒有達(dá)到最好的品質(zhì),在貯藏期后熟過程期間,果實(shí)發(fā)生生理特性變化達(dá)到最佳食用品質(zhì)后會(huì)進(jìn)行衰老過程,為使貯藏期果實(shí)做到優(yōu)質(zhì)優(yōu)價(jià)銷售,需要在氣調(diào)貯藏期定期抽檢監(jiān)測(cè)果實(shí)的品質(zhì),根據(jù)品質(zhì)指標(biāo)對(duì)后熟果實(shí)進(jìn)行出庫(kù)判斷。
根據(jù)紅富士蘋果中關(guān)于富士蘋果理化要求(NY/T 1075—2006)[31],特級(jí)、一級(jí)和二級(jí)蘋果的果實(shí)硬度都在6.5 kg/cm2以上,SSC含量要求為12.5°Brix以上,此時(shí)蘋果硬度和SSC含量為最低標(biāo)準(zhǔn),且根據(jù)該行業(yè)標(biāo)準(zhǔn)所述,理化檢驗(yàn)結(jié)果可以在感官評(píng)價(jià)無法判斷內(nèi)部品質(zhì)時(shí)作為品質(zhì)判斷依據(jù)。根據(jù)富士系蘋果貯藏保鮮技術(shù)規(guī)程(DB65/T 3457—2012)[32]中的貯藏期間的管理規(guī)程,富士系蘋果出庫(kù)時(shí)硬度不得低于6.5 kg/cm2,富士系蘋果的氣調(diào)庫(kù)貯藏壽命一般在240 d左右,貯藏期不能影響蘋果的銷售品質(zhì),必須定期抽檢。失重率是評(píng)定果實(shí)鮮度基礎(chǔ)的指標(biāo),能夠直接影響果實(shí)出庫(kù)后的貨架期,氣調(diào)貯藏目的是盡可能延長(zhǎng)果實(shí)貯藏時(shí)間,并且保證果實(shí)新鮮程度,從而延長(zhǎng)果實(shí)的貨架期。因此,本研究定義的出庫(kù)品質(zhì)標(biāo)準(zhǔn)為硬度不低于6.5 kg/cm2,失重率不超過5%作為最低參考值,選取蘋果在貯藏期間SSC含量不低于12.5°Brix的區(qū)間作為最佳出庫(kù)品質(zhì)區(qū)間。研究步驟如圖8所示。
圖8 研究步驟圖
2.5.2蘋果品質(zhì)指標(biāo)權(quán)重確定
僅憑一種品質(zhì)指標(biāo)無法準(zhǔn)確評(píng)價(jià)果實(shí)的品質(zhì),果實(shí)的出庫(kù)品質(zhì)由多個(gè)指標(biāo)共同決定,但是各品質(zhì)指標(biāo)的重要程度不同,因此出庫(kù)品質(zhì)評(píng)價(jià)的關(guān)鍵在于確定各單一指標(biāo)的權(quán)重,本研究采用客觀賦權(quán)法對(duì)出庫(kù)重要品質(zhì)進(jìn)行賦權(quán),對(duì)選取的蘋果品質(zhì)指標(biāo)真實(shí)數(shù)據(jù)進(jìn)行向量歸一化以消除量綱影響(均視為正向指標(biāo)),建立指標(biāo)水平矩陣并采用熵權(quán)法計(jì)算各指標(biāo)的客觀權(quán)重,得到均衡的指標(biāo)權(quán)重,結(jié)果表明熵權(quán)法確定的權(quán)重由大到小依次為SSC含量、失重率和硬度,分別為0.382 0、0.321 4和0.296 6。
2.5.3基于TOPSIS法的蘋果出庫(kù)預(yù)測(cè)模型
根據(jù)歸一化矩陣使用TOPSIS法求得正理想解和負(fù)理想解,結(jié)合熵權(quán)法計(jì)算的權(quán)重,最終計(jì)算出樣本指標(biāo)值與正負(fù)理想解的相對(duì)接近程度Ci并對(duì)品質(zhì)得分進(jìn)行排序[23],其中0 圖9 樣本品質(zhì)得分頻數(shù)直方圖 通過建立PLS模型實(shí)現(xiàn)了對(duì)貯藏期單一品質(zhì)指標(biāo)的預(yù)測(cè),基于熵權(quán)法確定權(quán)重的TOPSIS法對(duì)出庫(kù)品質(zhì)進(jìn)行了綜合評(píng)價(jià),為實(shí)現(xiàn)對(duì)出庫(kù)綜合品質(zhì)進(jìn)行無損預(yù)測(cè),因此以光譜為輸入,品質(zhì)得分為輸出,剔除極低的異常值,使用S-G平滑和MSC對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理,使用CARS-SPA對(duì)特征波長(zhǎng)進(jìn)行提取,建立PLS預(yù)測(cè)模型。模型預(yù)測(cè)結(jié)果如圖10所示,品質(zhì)得分考慮了3個(gè)出庫(kù)重要品質(zhì)指標(biāo)表示出庫(kù)綜合品質(zhì)狀態(tài),模型能夠?qū)崿F(xiàn)對(duì)出庫(kù)品質(zhì)得分的預(yù)測(cè)。 圖10 模型預(yù)測(cè)結(jié)果 2.5.4基于NARX的多品質(zhì)預(yù)測(cè)模型建立 以往的預(yù)測(cè)模型大多為單輸出,即每次只能預(yù)測(cè)一個(gè)指標(biāo),為實(shí)現(xiàn)對(duì)貯藏期果實(shí)出庫(kù)的精準(zhǔn)快速預(yù)測(cè),使用自回歸神經(jīng)網(wǎng)絡(luò)建立出庫(kù)品質(zhì)多輸出預(yù)測(cè)模型,使用S-G平滑和MSC對(duì)光譜進(jìn)行預(yù)處理,提取3個(gè)指標(biāo)特征波長(zhǎng)共66個(gè),以光譜數(shù)據(jù)為輸入,3個(gè)品質(zhì)指標(biāo)同時(shí)作為輸出,通過模型預(yù)測(cè)樣本貯藏期的多項(xiàng)指標(biāo),與2.5.1節(jié)出庫(kù)判斷依據(jù)進(jìn)行對(duì)比來確定果實(shí)是否應(yīng)該出庫(kù)。表4為NARX多輸出模型預(yù)測(cè)結(jié)果,可以看出多輸出模型會(huì)出現(xiàn)精度低于單輸出模型的情況,這是由于部分指標(biāo)隨貯藏時(shí)間不是單調(diào)變化的趨勢(shì),誤差屬于能接受的范圍內(nèi),通過直接預(yù)測(cè)品質(zhì)指標(biāo)與判斷依據(jù)進(jìn)行對(duì)比,為蘋果精準(zhǔn)出庫(kù)提供方法。 表4 NARX多輸出模型預(yù)測(cè)結(jié)果 為了檢驗(yàn)?zāi)P托阅?,?021年10月在陜西省扶風(fēng)縣相同的果園采摘了100個(gè)樣本放入氣調(diào)貯藏箱中進(jìn)行貯藏,貯藏環(huán)境與2020年實(shí)驗(yàn)環(huán)境相同,樣本光譜和理化指標(biāo)獲取方法與1.2節(jié)相同,對(duì)貯藏期PLS品質(zhì)預(yù)測(cè)模型、貯藏期NARX預(yù)測(cè)模型、基于TOPSIS法的蘋果出庫(kù)品質(zhì)預(yù)測(cè)模型和NARX多輸出品質(zhì)預(yù)測(cè)模型進(jìn)行驗(yàn)證,其中NARX模型運(yùn)行50次取平均值,模型驗(yàn)證結(jié)果如表5所示,與2020年預(yù)測(cè)集數(shù)據(jù)進(jìn)行驗(yàn)證的結(jié)果對(duì)比,模型對(duì)驗(yàn)證集的預(yù)測(cè)性能低于2020年的模型,主要原因是受季節(jié)因素和樣本生物變異性的影響[30],結(jié)果可以滿足實(shí)際生產(chǎn)需求,后續(xù)的研究應(yīng)考慮模型遷移和繼續(xù)增加樣本數(shù)以增強(qiáng)模型預(yù)測(cè)能力和穩(wěn)定性。 表5 模型驗(yàn)證結(jié)果 對(duì)PLS和NARX模型進(jìn)行比較,由表2可知,除預(yù)測(cè)失重率外,使用特征波長(zhǎng)提取可以有效降低維度的同時(shí)提升模型的精度,NARX模型考慮了貯藏時(shí)間對(duì)模型的影響,在預(yù)測(cè)SSC含量時(shí)的精度低于PLS模型,其余指標(biāo)預(yù)測(cè)精度高于PLS模型,但是PLS模型的RMSEP均高于NARX模型。NARX模型對(duì)于隨貯藏時(shí)間單調(diào)變化的指標(biāo)(如硬度和失重率)與PLS模型相比具有更好的預(yù)測(cè)優(yōu)勢(shì),說明NARX模型將過去時(shí)間的光譜與品質(zhì)指標(biāo)作為反饋重新進(jìn)行輸入,與當(dāng)前時(shí)間的輸入光譜共同預(yù)測(cè)當(dāng)前時(shí)間的品質(zhì)指標(biāo),有效降低了RMSEP。由表4可知,TOPSIS評(píng)價(jià)模型的驗(yàn)證集精度降低,這是由于評(píng)價(jià)時(shí)選取的是同一批樣本理化實(shí)測(cè)值,為提高模型的適用性,后續(xù)應(yīng)該增加大量樣本保證評(píng)價(jià)合理性。NARX多輸出模型的驗(yàn)證結(jié)果與2020年模型精度接近,通過直接預(yù)測(cè)品質(zhì)指標(biāo)能夠有效減少二次預(yù)測(cè)的誤差,為蘋果精準(zhǔn)出庫(kù)提供方法。 (1)富士蘋果的光譜特性與品質(zhì)指標(biāo)在氣調(diào)貯藏期會(huì)發(fā)生明顯變化。光譜反射率隨著貯藏時(shí)間的延長(zhǎng)逐漸降低,貯藏期間果實(shí)的SSC含量呈現(xiàn)先上升后下降趨勢(shì),果肉硬度隨時(shí)間逐漸下降,失重率逐漸上升。 (2)應(yīng)用化學(xué)計(jì)量法和非線性自回歸網(wǎng)絡(luò)能夠?qū)崿F(xiàn)對(duì)貯藏期果實(shí)SSC含量、硬度和失重率進(jìn)行預(yù)測(cè)。PLS模型在預(yù)測(cè)SSC含量、硬度和失重率時(shí),CARS-SPA、CARS和SPA模型分別取得了最好的效果,Rp分別為0.914、0.648和0.872,RMSEP分別為0.511°Brix、0.831 kg/cm2和0.968%。NARX模型的Rp分別為0.826、0.796和0.918,RMSEP分別為0.291°Brix、0.475 kg/cm2和0.682%,能夠有效降低模型RMSEP,提升隨時(shí)間單調(diào)變化指標(biāo)的預(yù)測(cè)精度。 (3)根據(jù)行業(yè)標(biāo)準(zhǔn)確定蘋果出庫(kù)品質(zhì)判斷依據(jù),采用基于熵權(quán)的TOPSIS法對(duì)蘋果出庫(kù)綜合品質(zhì)進(jìn)行評(píng)價(jià),采用PLS對(duì)出庫(kù)品質(zhì)得分進(jìn)行預(yù)測(cè),Rp與RMSEP分別為0.896 2和0.043 4,并采用NARX模型對(duì)多品質(zhì)指標(biāo)同時(shí)輸出,模型精度低于單輸出模型。 (4)對(duì)模型性能進(jìn)行驗(yàn)證。NARX模型能有效減弱時(shí)間對(duì)模型影響,對(duì)隨時(shí)間單調(diào)變化的指標(biāo)有較好的預(yù)測(cè)性能,TOPSIS綜合評(píng)價(jià)需要更多的樣本數(shù)據(jù)進(jìn)行支撐。本研究為貯藏期蘋果品質(zhì)無損檢測(cè)和出庫(kù)品質(zhì)評(píng)價(jià)提供理論依據(jù)與方法。2.6 模型驗(yàn)證與結(jié)果比較
3 結(jié)論