黃積微,李洋,袁迪,張欣碩,李國(guó)慶
(東北林業(yè)大學(xué) 工程技術(shù)學(xué)院,黑龍江 哈爾濱,150040)
藍(lán)莓因其富含維生素,礦物質(zhì)和植物活性物質(zhì)如多酚、類黃酮、花青素等,被世界糧農(nóng)組織列為五大人類健康食品之一,被譽(yù)為“漿果之王”[1]。但由于其一般采收期在高溫多雨的7、8月夏季,采后果實(shí)代謝活動(dòng)旺盛,且富含水分,貯藏環(huán)境稍有不當(dāng),就會(huì)在短時(shí)間內(nèi)迅速變質(zhì),喪失商品價(jià)值[2]。因此,將藍(lán)莓果實(shí)加工為果干制品,通過(guò)去除細(xì)菌、酵母和霉菌等微生物所必須水分,抑制果實(shí)內(nèi)酶的活性,使得果實(shí)中各類營(yíng)養(yǎng)成分能夠長(zhǎng)期得到較好保存,且在眾多干燥方式中成本最低,應(yīng)用最廣泛的干燥方式仍是熱風(fēng)干燥,準(zhǔn)確監(jiān)測(cè)藍(lán)莓在干燥過(guò)程中含水量對(duì)于確保干燥過(guò)程中的食品安全十分重要。
相較于具有破壞性、需要較大樣本量、耗時(shí)間的傳統(tǒng)研究方法,非破壞性、快速、成本較低的光譜技術(shù)近年來(lái)備受關(guān)注[3]。其中,近紅外光譜因?yàn)榫哂袑?shí)時(shí)、高精度、非破壞性和設(shè)備小型化等優(yōu)勢(shì),在食品工業(yè)領(lǐng)域有豐富應(yīng)用場(chǎng)景[4]。國(guó)內(nèi)外研究人員已經(jīng)將近紅外光譜技術(shù)應(yīng)用于監(jiān)測(cè)評(píng)估多種食品的理化指標(biāo)[5],劉小路等[6-7]先后基于近紅外光譜技術(shù)方法建立藍(lán)莓可溶性固形物、總酸、總黃酮及花青素的近紅外檢測(cè)模型,曾明飛等[8]和朱金艷等[9]先后建立藍(lán)莓近紅外光譜新鮮度模型和近紅外結(jié)合極限學(xué)習(xí)的藍(lán)莓貯藏品質(zhì)模型。近紅外光譜技術(shù)能夠?qū)崿F(xiàn)準(zhǔn)確檢測(cè)藍(lán)莓各項(xiàng)理化指標(biāo),但以往模型多是通過(guò)光譜預(yù)處理來(lái)提高模型精度,沒有對(duì)特征波段進(jìn)行系統(tǒng)分析,且參與建模變量過(guò)多難以達(dá)到快速檢測(cè)目的。對(duì)于干燥過(guò)程,MALVANDI等[10]通過(guò)便攜式近紅外光譜儀結(jié)合機(jī)器學(xué)習(xí)對(duì)蘋果干燥過(guò)程硬度實(shí)現(xiàn)實(shí)時(shí)監(jiān)測(cè),KAPOOR等[11]同樣通過(guò)便攜式近紅外光譜儀實(shí)現(xiàn)了涂膜蘋果片水分含量的實(shí)時(shí)監(jiān)測(cè)。但是將近紅外光譜技術(shù)應(yīng)用于藍(lán)莓干燥過(guò)程監(jiān)測(cè)的研究還較少。近年來(lái),便攜式或微型近紅外光譜儀因其相當(dāng)?shù)土膬r(jià)格,被普遍應(yīng)用于檢測(cè)食品特性[12-13],雖然由于這些微型儀器存在性能差異,但這些微型近紅外光譜儀仍能夠?qū)κ称犯鞣N性質(zhì)進(jìn)行準(zhǔn)確預(yù)測(cè)[14]。所以,便攜式微型近紅外光譜儀是果蔬品質(zhì)實(shí)時(shí)監(jiān)測(cè)分析的一種快速經(jīng)濟(jì)的解決方案。
綜上,本文以藍(lán)莓為研究對(duì)象,以便攜式近紅外光譜儀作為工具監(jiān)測(cè)藍(lán)莓熱風(fēng)干燥過(guò)程,并評(píng)估近紅外光譜預(yù)處理及特征變量?jī)?yōu)選方法,將篩選出的特征變量作為模型輸入變量,在保證預(yù)測(cè)精度及穩(wěn)定性的基礎(chǔ)上減少變量數(shù)目,開發(fā)一個(gè)藍(lán)莓干燥過(guò)程含水率多變量快速檢測(cè)模型。為在實(shí)際生產(chǎn)及日后研究中,精準(zhǔn)監(jiān)測(cè)預(yù)測(cè)藍(lán)莓多品質(zhì)指標(biāo)提供理論參考和依據(jù)。
“藍(lán)豐”藍(lán)莓于2021年11月購(gòu)于哈爾濱市紅旗鄉(xiāng)藍(lán)莓小鎮(zhèn)。八成熟果實(shí)。大小均勻一致、表面蠟質(zhì)完整、無(wú)病蟲害、無(wú)機(jī)械損傷,聚乙烯小盒單獨(dú)包裝,當(dāng)日運(yùn)回放置在4 ℃冷藏庫(kù)中預(yù)冷待處理。在試驗(yàn)前多次精確稱取適量藍(lán)莓果實(shí),110 ℃烘至恒重后計(jì)算果實(shí)含水率,藍(lán)莓初始含水率平均為(85.05±1.4)%。
LabSpec Pro FR/A114260便攜式物質(zhì)成分分析光譜儀及配套軟件(350~2 500 nm),美國(guó)ASD公司;FA2004B電子分析天平,上海舜宇恒平科學(xué)儀器有限公司;101-3A鼓風(fēng)干燥箱,上海昕怡儀器儀表有限公司。
在試驗(yàn)前準(zhǔn)確稱取適量藍(lán)莓果實(shí)均勻平鋪于物料盤,放入設(shè)定溫度為65 ℃,風(fēng)速2 m/s的鼓風(fēng)干燥箱中,烘干至恒重,過(guò)程共用時(shí)17 h。干燥過(guò)程中每1 h稱量藍(lán)莓整體質(zhì)量計(jì)算其含水率,并每1 h隨機(jī)取樣5顆藍(lán)莓果實(shí)樣品,分別使用光譜儀鏡頭在距離果實(shí)果蒂部、尾部和果腹部2 mm處,對(duì)準(zhǔn)中心位置,設(shè)定掃描次數(shù)為32次,分辨率1 nm,取平均值,截取900~1 700 nm光譜數(shù)據(jù)作為樣品光譜數(shù)值,光譜文件由ViewSpec Pro軟件進(jìn)行預(yù)處理并輸出數(shù)據(jù)。
參照GB 5009.3—2016《食品安全國(guó)家標(biāo)準(zhǔn) 食品中水分含量的測(cè)定》方法對(duì)藍(lán)莓果實(shí)干燥過(guò)程含水率及干燥速率進(jìn)行測(cè)定。
干基含水率的測(cè)定如公式(1)所示:
(1)
式中:M,t時(shí)刻物料的干基含水率,%;mt,t時(shí)刻藍(lán)莓果實(shí)質(zhì)量,g;me,干燥至恒重的藍(lán)莓果實(shí)質(zhì)量,g。
干燥速率的計(jì)算如公式(2)所示:
(2)
式中:DR,干燥速率,g/(g·h);M1,t1時(shí)刻藍(lán)莓果實(shí)干基含水率,%;M2,t2時(shí)刻藍(lán)莓果實(shí)干基含水率,%;t1、t2,藍(lán)莓果實(shí)干燥時(shí)間,h。
1.5.1 異常樣本檢測(cè)剔除
為保證模型預(yù)測(cè)精確度,在建模前應(yīng)當(dāng)剔除光譜數(shù)據(jù)中的異常樣本,常用的異常樣本檢測(cè)方法有:濃度殘差剔除法、馬氏距離法、蒙特卡洛隨機(jī)抽樣算法、杠桿值法等。本文選取蒙特卡洛方法(Monte-Carlo sampling,MCS)進(jìn)行255個(gè)光譜數(shù)據(jù)異常值的檢測(cè)剔除。
1.5.2 光譜預(yù)處理方法
根據(jù)900~1 700 nm全光譜數(shù)據(jù)構(gòu)建原始藍(lán)莓干燥過(guò)程水分含量偏最小二乘(partial least squares,PLS)模型,由于在光譜獲取過(guò)程中,為消除樣本背景高頻噪聲、基線偏移、光散射等對(duì)光譜穩(wěn)定性有影響的不利因素,本文對(duì)光譜數(shù)據(jù)進(jìn)行一階微分(first-order difference,FD)、二階微分(second-order difference,SD)、多元散射校正(multiplicative scatter correction,MSC)和標(biāo)準(zhǔn)正則變換(standard normal variate transform,SNV)等光譜預(yù)處理方法對(duì)采集的光譜數(shù)據(jù)進(jìn)行處理。
1.5.3 干燥模式研究
主成分分析法(principal component analysis,PCA)可以通過(guò)正交變換降低光譜數(shù)據(jù)高維度特性[15],將復(fù)雜的原始變量歸納為數(shù)個(gè)成分(PCs)[16],可以定性地監(jiān)測(cè)其干燥過(guò)程,監(jiān)測(cè)藍(lán)莓干燥過(guò)程中水分損失模式。在剔除異常樣本后,將均值中心化的光譜數(shù)據(jù)應(yīng)用PCA模型中,獲得藍(lán)莓干燥過(guò)程中含水率與干燥時(shí)間的大致關(guān)系。以累積貢獻(xiàn)率選取最佳主成分?jǐn)?shù)(PCs),以選取主成分模型方差與總樣本方差比率評(píng)價(jià)模型質(zhì)量。
1.5.4 特征波長(zhǎng)選取
近紅外光譜能夠反映所測(cè)物質(zhì)成分及含量,光譜數(shù)據(jù)從900~1 700 nm共包含801個(gè)數(shù)據(jù)點(diǎn),不可避免存在不同物質(zhì)間存在共線性問(wèn)題以及樣本背景噪聲,這些都會(huì)影響模型擬合精度,減低預(yù)測(cè)成分貢獻(xiàn)度,造成模型欠擬合或過(guò)擬合,從而影響模型可信度。所以,有必要對(duì)光譜數(shù)據(jù)進(jìn)行特征波長(zhǎng)選擇,精簡(jiǎn)優(yōu)選參與建模的光譜數(shù)據(jù),提升建模效率,提高模型精度。常見的特征波長(zhǎng)篩選方法有:PCA、無(wú)信息變量消除法(uninformative variables elimination,UVE)、移動(dòng)窗口偏最小二乘法(moving-window partial least square,MWPLS)、競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)采樣算法(competitive adaptive reweighted sampling,CARS)等。
其中MWPLS的基本原理為創(chuàng)設(shè)一個(gè)沿光譜軸線連續(xù)移動(dòng)的窗口,對(duì)逐個(gè)光譜波長(zhǎng)點(diǎn)移動(dòng)的窗口內(nèi)數(shù)據(jù)建立模型,進(jìn)行交叉驗(yàn)證從而確定模型主因子數(shù),并建立最優(yōu)PLS模型。通過(guò)改變移動(dòng)窗口寬度和主因子數(shù),根據(jù)均方根誤差選擇與待測(cè)組分高相關(guān)性的光譜區(qū)間[17]。
CARS是通過(guò)自適應(yīng)重加權(quán)采樣(adaptive reweight sampling,ARS)技術(shù)篩選出建立的PLS模型中具有較大回歸系數(shù)的光譜波長(zhǎng)點(diǎn)。最后取較大回歸系數(shù)光譜波長(zhǎng)與具有最低交叉驗(yàn)證標(biāo)準(zhǔn)偏差(root mean square error of cross,RMSEC)的波長(zhǎng)子集,從而最終確定與待測(cè)組分強(qiáng)相關(guān)性的數(shù)據(jù)組合[18]。
蒙特卡洛無(wú)信息變量消除法(Monte Carlo uninformative variable elimination,MCUVE)是通過(guò)蒙特卡洛方法對(duì)光譜矩陣進(jìn)行隨機(jī)采樣,并建立PLS模型,計(jì)算每個(gè)模型回歸系數(shù),并利用無(wú)信息變量方法定義計(jì)算每個(gè)變量的重要性指標(biāo)Ci,然后從大到小排列每個(gè)變量重要性指標(biāo)Ci的絕對(duì)值,依次求以其變量建立的PLS模型預(yù)測(cè)集的預(yù)測(cè)結(jié)果,并選取預(yù)測(cè)均方根誤差(root mean square error of prediction,RMSEP)最小時(shí)所對(duì)應(yīng)的模型,將該模型最后加入的Ci作為閾值N,將大于閾值N的|Ci|所對(duì)應(yīng)波長(zhǎng)作為特征波長(zhǎng)選取,將小于閾值N的|Ci|所對(duì)應(yīng)波長(zhǎng)作為無(wú)信息變量刪除[19-20],計(jì)算如公式(3)所示:
(3)
式中:|Ci|,模型第i個(gè)波長(zhǎng)變量重要性指標(biāo)的絕對(duì)值;mean(bi),采樣各波長(zhǎng)集合均值;std(bi),采樣各波長(zhǎng)集合標(biāo)準(zhǔn)差。
最后對(duì)上述3種方法中所篩選特征波長(zhǎng)數(shù)目及其建立的PLS模型性能進(jìn)行比較,選取性能最好的特征波長(zhǎng)選取方法,將其選取變量作為模型輸入變量,降低矩陣維度,提升計(jì)算速率。
1.5.5 模型評(píng)價(jià)及模型評(píng)價(jià)
在常用近紅外光譜分析建模中,針對(duì)小樣本量、多變量和變量間相關(guān)性強(qiáng)的光譜數(shù)據(jù),逐步增加信息、可以一定程度消除光譜噪聲的偏最小二乘回歸PLS法具有獨(dú)特優(yōu)勢(shì)。偏最小二乘回歸是多元線性回歸和主成分回歸法的結(jié)合體,故本文選取PLS法進(jìn)行建模分析,并采用蒙特卡洛交叉驗(yàn)證方法(Monte-Carlo cross-validation,MCCV)進(jìn)行原始樣本主成分選取。
將近紅外光譜數(shù)據(jù)導(dǎo)入化學(xué)計(jì)量學(xué)軟件UnscramblerX中進(jìn)行預(yù)處理,然后在軟件Matlab R2021a中應(yīng)用MWPLS、CARS和UVE 3種方法對(duì)近紅外光譜建立的PLS模型進(jìn)行特征變量?jī)?yōu)選,比較模型選取波長(zhǎng)數(shù)目及模型性能,選擇最優(yōu)特征變量選擇方法建立藍(lán)莓干燥過(guò)程含水率近紅外偏最小二乘回歸模型。
(4)
(5)
光譜數(shù)據(jù)導(dǎo)出及預(yù)處理在化學(xué)計(jì)量學(xué)軟件Unscrambler X中進(jìn)行,數(shù)據(jù)存儲(chǔ)、計(jì)算、繪圖及建模在軟件Matlab R 2021a及Origin 2019b中進(jìn)行。
如圖1所示為65 ℃熱風(fēng)下藍(lán)莓果實(shí)干燥過(guò)程干基含水率和干燥速率變化曲線。如圖1-a所示,隨著干燥過(guò)程的進(jìn)行,藍(lán)莓果實(shí)從最初5.22的干基含水率下降至恒重。如圖1-b所示,藍(lán)莓干燥速率在干燥過(guò)程中大致可分為3個(gè)階段,1~4 h為升速階段,5~8 h為恒速階段,9~17 h為降速階段。藍(lán)莓干燥是從外至內(nèi)的水分散失過(guò)程,干燥初期果實(shí)與熱風(fēng)對(duì)流較充分,干燥速率較快,且隨著果實(shí)溫度上升,干燥速率進(jìn)一步上升。干燥中期,果實(shí)內(nèi)部與外部形成水分差,果實(shí)內(nèi)部水分向外擴(kuò)散并被蒸發(fā),干燥速率趨于平穩(wěn),干燥后期,隨著干燥過(guò)程的深入,果實(shí)內(nèi)部水分階梯趨于平穩(wěn),水分?jǐn)U散速度放緩,干燥速率逐步下降。此結(jié)果與李星琪等[21]結(jié)果類似。
a-干燥曲線圖;b-干燥速率圖
如圖2所示為藍(lán)莓干燥過(guò)程近紅外光譜反射率光譜(原始共255個(gè)樣本光譜,將每1 h光譜數(shù)據(jù)求均值展示)。所有時(shí)間段的近紅外光譜圖像均顯示出類似的光譜趨勢(shì),O—H拉伸振動(dòng)的一級(jí)倍頻在1 450 nm 處產(chǎn)生,而二級(jí)倍頻在960 nm產(chǎn)生峰值變化。1 200 nm反射波谷的出現(xiàn)主要是由于果實(shí)中糖類C—H鍵一級(jí)諧振。水分最后一個(gè)反射波谷是由于水中O—H鍵及碳水化合物O—H鍵重疊在1 450 nm左右。特別是,隨著干燥的進(jìn)行,藍(lán)莓果實(shí)整體反射率向較高反射方向移動(dòng),其中1 450 nm處的反射波谷逐漸加深,主要可能是由于干燥過(guò)程中果實(shí)水分減少,而糖類和其他可溶性物質(zhì)濃度升高,導(dǎo)致果實(shí)中整體氫鍵的減少。
圖2 藍(lán)莓干燥過(guò)程樣本近紅外光譜圖
MCS因具有可有效檢測(cè)多個(gè)異常值,且可同時(shí)檢測(cè)光譜異常值和理化參照值異常值等優(yōu)勢(shì),在檢測(cè)回歸分析異常樣本中的應(yīng)用越來(lái)越多[22]。試驗(yàn)參數(shù)設(shè)置為:對(duì)藍(lán)莓干燥過(guò)程原始近紅外光譜PLS模型進(jìn)行MCCV驗(yàn)證得到最佳潛在主成分?jǐn)?shù):11,并對(duì)模型進(jìn)行均值中心化預(yù)處理;抽樣次數(shù)設(shè)置為2 500次,蒙特卡洛抽樣所得校正集與測(cè)試集比例為4∶1,并將預(yù)測(cè)誤差均值與標(biāo)準(zhǔn)差的2.5倍作為均值與標(biāo)準(zhǔn)差閾值,將閾值外的樣本視為離群樣本進(jìn)行剔除[23]。如圖3所示為試驗(yàn)所得藍(lán)莓干燥紅外光譜蒙特卡洛異常樣本檢測(cè)結(jié)果。
圖3 基于蒙特卡洛方法的藍(lán)莓干燥過(guò)程近紅外光譜異常樣本檢測(cè)結(jié)果
圖3中水平與垂直虛線為預(yù)測(cè)誤差均值與標(biāo)準(zhǔn)差閾值線。其中離群點(diǎn)為178、213、216、219、227、229、232、241、250、251、254號(hào),共11個(gè)離群點(diǎn)。將剔除離群點(diǎn)后的光譜數(shù)據(jù)作為之后研究原始光譜數(shù)據(jù),建立含水率PLSR模型,由MCCV計(jì)算原始光譜決定系數(shù)R2為0.859 0,RMSECV為0.079 2。說(shuō)明原始數(shù)據(jù)預(yù)測(cè)模型效果較好,可信度較高,達(dá)到模型交叉驗(yàn)證檢驗(yàn)要求,可用于之后數(shù)據(jù)處理。
將PCA應(yīng)用至光譜數(shù)據(jù)中,獲得藍(lán)莓果實(shí)干燥過(guò)程中每隔1 h的水分損失模式,定性地監(jiān)測(cè)其干燥過(guò)程。如圖4所示,顯示了2個(gè)主成分?jǐn)?shù)下的PCA分?jǐn)?shù)分布圖,即只需要2個(gè)主成分就可以充分描述藍(lán)莓干燥過(guò)程的光譜變化。其中,PC1(97%)已經(jīng)覆蓋絕大部分光譜數(shù)據(jù),且隨著干燥過(guò)程發(fā)展,近紅外光譜在得分集從高含水率到低含水率(從左到右)展現(xiàn)出明顯分離。
圖4 不同時(shí)間間隔藍(lán)莓近紅外光譜得分圖
如表1所示,對(duì)于藍(lán)莓干燥近紅外光譜進(jìn)行預(yù)處理后,其中SNV預(yù)處理略微提升了原始PLS模型的性能,但FD、SD和MSC等預(yù)處理方法反而增大了模型均方根誤差,降低模型相關(guān)性。這說(shuō)明光譜預(yù)處理方法并不一定會(huì)提升原始模型的性能,這是因?yàn)槌S玫墓庾V預(yù)處理方法一般應(yīng)用于消除特定的光譜影響,不同的預(yù)處理方法是基于光譜數(shù)據(jù)影響因素的不同假設(shè)從而對(duì)光譜進(jìn)行處理。對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理,會(huì)在一定程度上改變數(shù)據(jù)結(jié)構(gòu),從而影響模型預(yù)測(cè)結(jié)果。與第五鵬瑤等[24]關(guān)于預(yù)處理方法不僅和光譜數(shù)據(jù)有關(guān)還和待測(cè)組分有關(guān),不存在普適性光譜預(yù)處理方法,選擇預(yù)處理方法也大多基于實(shí)驗(yàn)者經(jīng)驗(yàn)和建模效果嘗試的結(jié)論類似。由于在本研究中原始光譜PLS模型比預(yù)處理后模型表現(xiàn)出更好性能,又由2.2節(jié)中模型所示,原始光譜數(shù)據(jù)剔除異常值后特征明顯,故在本文以下章節(jié)中,將基于原始光譜數(shù)據(jù)模型進(jìn)行優(yōu)化。
表1 不同光譜預(yù)處理后藍(lán)莓干燥過(guò)程含水量PLS模型結(jié)果
2.5.1 MWPLS
移動(dòng)窗口偏最小二乘法通過(guò)提取相鄰波長(zhǎng)點(diǎn)克服無(wú)關(guān)信息對(duì)模型預(yù)測(cè)干擾,使之能更有效地提取實(shí)際測(cè)量值中的樣本相關(guān)屬性。如圖5所示,光譜窗口寬度為40時(shí),從所測(cè)光譜起點(diǎn)900 nm依次向右移動(dòng)一個(gè)波長(zhǎng)點(diǎn)至1 661 nm,對(duì)每個(gè)窗口建立PLS模型,對(duì)比每個(gè)窗格所建立模型RMSEP,最優(yōu)窗格為926~965 nm,RMSEP最小值為0.058 4。
圖5 基于MWPLS的藍(lán)莓干燥近紅外光譜特征窗口篩選結(jié)果
2.5.2 CARS
通過(guò)CARS方法對(duì)藍(lán)莓干燥過(guò)程光譜進(jìn)行特征變量篩選,結(jié)果如圖6所示。圖6-a~圖6-c分別表示在模型運(yùn)行次數(shù)在50次下,CARS算法中樣本變量數(shù)目、RMSECV數(shù)值和變量回歸系數(shù)隨著運(yùn)行次數(shù)的變化趨勢(shì)。
a-變量數(shù)目變化趨勢(shì);b-RMSECV變化趨勢(shì);c-變量回歸系數(shù)變化趨勢(shì)
圖6-a顯示模型采樣運(yùn)行到50次過(guò)程中,藍(lán)莓干燥近紅外光譜參與模型的樣品變量數(shù)目呈由快至慢的遞減趨勢(shì),這主要是由于CARS算法中指數(shù)衰減函數(shù)的存在。表明在采樣次數(shù)較少時(shí),算法快速剔除無(wú)關(guān)信息變量,隨著采樣次數(shù)增加,算法剔除速率降低,進(jìn)一步精簡(jiǎn)樣本變量數(shù)目。
圖6-b表示模型采樣運(yùn)行到50次過(guò)程中,模型RMSECV的變化趨勢(shì)。如圖6所示,采樣次數(shù)在36次,光譜數(shù)據(jù)中大部分包含無(wú)關(guān)信息的波長(zhǎng)變量被去除,但在36次后,RMSECV數(shù)值一直處于上下波動(dòng)狀態(tài),這主要是由于采樣次數(shù)達(dá)到36次后一些關(guān)鍵信息也被剔除,導(dǎo)致模型性能變差;采樣次數(shù)達(dá)到39次后大量無(wú)關(guān)信息與部分關(guān)鍵信息被剔除,使模型趨于穩(wěn)定;46次采樣后,最后關(guān)鍵信息也被去除,導(dǎo)致模型性能急劇下降。
圖6-c表示藍(lán)莓干燥近紅外光譜數(shù)據(jù)在算法采樣過(guò)程中回歸系數(shù)變化路徑,其中“*”號(hào)組成豎線表示在算法運(yùn)行中所對(duì)應(yīng)殘差值最小的采樣次數(shù):36,即當(dāng)采樣次數(shù)為36時(shí),所獲得的特征變量集合建立的偏最小二乘回歸模型的RMSECV最小,由此篩選出11個(gè)關(guān)鍵特征變量。
如圖7所示,CARS法篩選出的特征變量為1 146、1 150、1 163、1 175、1 198、1 227、1 322、1 326、1 395、1 659、1 667 nm。
圖7 基于CARS的藍(lán)莓干燥近紅外光譜變量選取結(jié)果
2.5.3 MCUVE
MCUVE方法是在UVE的基礎(chǔ)上增加了蒙特卡洛隨機(jī)采樣原理,通過(guò)輸入變量對(duì)模型重要性指標(biāo)決定變量是否選取。
如圖8所示,僅使用虛線以上的變量建立PLS模型。其中最優(yōu)保留數(shù)目為33,絕大多數(shù)選取變量位于900~1 000 nm。選取波長(zhǎng)如表2所示。
表2 基于MCUVE的藍(lán)莓干燥近紅外光譜變量選取結(jié)果
圖8 基于MCUVE的藍(lán)莓干燥近紅外光譜變量貢獻(xiàn)度結(jié)果
2.5.4 藍(lán)莓熱風(fēng)干燥監(jiān)測(cè)模型
表3給出MWPLS、CARS和MCUVE 3種特征波長(zhǎng)選取方法對(duì)藍(lán)莓干燥過(guò)程含水率的波長(zhǎng)選取結(jié)果及其建立的PLS模型性能。
表3 基于不同方法的藍(lán)莓干燥近紅外光譜變量選取數(shù)量及性能
如表3所示,其中3種特征波長(zhǎng)選取方法均能提升PLS模型性能,減少變量數(shù)量,提升預(yù)測(cè)速度,其中CARS方法較之其他2種方法,特征波長(zhǎng)數(shù)量最少,且能夠大幅提升原始PLS模型性能,使之達(dá)到定量研究目的。R2僅比MCUVE方法低0.008 1。MWPLS與MCUVE方法選取波長(zhǎng)集中于光譜前段,并未完全覆蓋水分特征波段,只是達(dá)到局部最優(yōu),難以從存在信息重疊的光譜數(shù)據(jù)中有效消除無(wú)關(guān)組分影響。因此。CARS方法最適用于優(yōu)選藍(lán)莓干燥近紅外光譜波長(zhǎng)。
本文以藍(lán)莓研究對(duì)象,建立了一種基于便攜式近紅外光譜的藍(lán)莓干燥過(guò)程含水量無(wú)損快檢模型。在主成分定性分析和蒙特卡洛離群點(diǎn)檢測(cè)法的基礎(chǔ)上,分別探討了導(dǎo)數(shù)法、多元散射校正、正交信號(hào)校正法和Savitzky-Golay卷積平滑法等光譜預(yù)處理方法對(duì)藍(lán)莓干燥光譜PLS模型的影響,比較了MWPLS、CARS和MCUVE 3種特征變量選取方法對(duì)PLS模型影響,最終確定基于CARS建立的藍(lán)莓干燥過(guò)程PLS模型選取具有相對(duì)最優(yōu)性能,其特征波長(zhǎng)個(gè)數(shù)最少為11,預(yù)測(cè)R2為0.946 5,預(yù)測(cè)誤差RMSEP為0.047 3。能夠滿足藍(lán)莓干燥過(guò)程含水率定量研究目標(biāo)。為近紅外光譜快速監(jiān)測(cè)藍(lán)莓品質(zhì)指標(biāo)提供了理論及應(yīng)用指導(dǎo)。