姜小剛,朱明旺,姚金良,李 斌,廖 軍,劉燕德*,張劍一,景寒松
1.華東交通大學(xué)智能機(jī)電裝備創(chuàng)新研究院,江西 南昌 330013 2.浙江德菲洛智能機(jī)械制造有限公司,浙江 金華 321000
蘋果內(nèi)部富含多種維生素和酸類物質(zhì),多吃蘋果可以緩解疲勞,提高大腦活力。近紅外動(dòng)態(tài)在線裝置作為一種快速、無損的綠色檢測(cè)裝備,已應(yīng)用在檢測(cè)蘋果、草莓、柑橘、梨、西瓜[1-4]等品質(zhì)。近紅外光譜采集裝置的參數(shù)如:運(yùn)動(dòng)速度、積分時(shí)間和光照強(qiáng)度等會(huì)影響所建立的糖度模型的性能,運(yùn)動(dòng)速度過快、積分時(shí)間越長和光照強(qiáng)度越大在獲得充足的光線的同時(shí)也將帶入許多雜散光,導(dǎo)致其糖度預(yù)測(cè)模型性能不佳,因此,對(duì)近紅外光譜采集裝置進(jìn)行參數(shù)優(yōu)化是非常重要的。
國內(nèi)外學(xué)者應(yīng)用近紅外光譜檢測(cè)水果內(nèi)部品質(zhì)做了很多研究:郭志明等[5]利用近紅外透射法建立了蘋果腐心病的在線檢測(cè)系統(tǒng),建立的預(yù)測(cè)模型的相關(guān)系數(shù)為0.92。Liu等[6]建立了臍橙SSC含量的近紅外漫反射檢測(cè)模型,預(yù)測(cè)相關(guān)系數(shù)為0.90。李龍等[7]利用近紅外光譜建立了蘋果在線無損檢測(cè)裝備,并對(duì)蘋果SSC含量建立了預(yù)測(cè)模型,其相關(guān)系數(shù)達(dá)到0.949,預(yù)測(cè)集均方根誤差為0.449。韓東海等[8-9]使用可見/近紅外透射光譜結(jié)合波段篩選方法對(duì)蘋果的兩種病害進(jìn)行判別,其判別模型準(zhǔn)確率達(dá)到95.7%。郭成等[10]采用無信息變量消除(UVE)方法挑選出與SSC相關(guān)的特征波長,并應(yīng)用PLS方法建立SSC的在線預(yù)測(cè)模型,其預(yù)測(cè)相關(guān)系數(shù)0.89,RMSEP為0.63°Brix。Xu等[11]比較了單點(diǎn)和雙點(diǎn)檢測(cè)對(duì)蘋果SSC檢測(cè)精度的影響,使用雙分支光纖的系統(tǒng)證明了較優(yōu)的魯棒性,而使用單分支光纖的系統(tǒng)證明了卓越的準(zhǔn)確性。其預(yù)測(cè)集決定系數(shù)為0.63。以上研究都未考慮所使用裝置的參數(shù)優(yōu)化,建立的模型性能較低。崔豐娟等[12]研究了近紅外光譜在線采集裝置的移動(dòng)速度對(duì)所建立的模型性能的影響,基于兩種運(yùn)動(dòng)速度,建立了混合運(yùn)動(dòng)速度模型,其預(yù)測(cè)集相關(guān)系數(shù)為0.94,均方根誤差為0.289。McGlone等[13]采用了兩種漫透射近紅外光譜系統(tǒng),建立了蘋果內(nèi)部組織褐變百分比預(yù)測(cè)模型,其決定系數(shù)達(dá)到0.9,預(yù)測(cè)集均方根誤差為0.041。Sun等[14]利用近紅外動(dòng)態(tài)在線檢測(cè)裝備,研究了裝置不同運(yùn)動(dòng)速度對(duì)建立的翠冠梨糖度模型的影響,結(jié)果發(fā)現(xiàn),當(dāng)運(yùn)動(dòng)速度為0.3 m·s-1時(shí),所建立的糖度模型的性能較好。上述學(xué)者的研究只考慮了單一裝置參數(shù)對(duì)模型性能的影響,忽略了多參數(shù)的影響。本工作應(yīng)用了近紅外動(dòng)態(tài)在線光譜采集系統(tǒng),采集不同參數(shù)條件下的蘋果光譜,分別建立不同參數(shù)條件下的蘋果糖度預(yù)測(cè)模型,對(duì)設(shè)備的多個(gè)參數(shù)進(jìn)行了優(yōu)化,同時(shí)采用不同預(yù)處理方法和波段篩選方法建立了蘋果可溶性的預(yù)測(cè)模型,選出了最佳預(yù)測(cè)模型,有助于對(duì)蘋果品質(zhì)在線分選提供技術(shù)支持。
蘋果樣品品種為紅富士,共計(jì)210個(gè),分為兩批,第一批90個(gè)用于不同運(yùn)動(dòng)速度和積分時(shí)間的對(duì)蘋果SSC預(yù)測(cè)模型的研究,第二批120個(gè)用于不同光照強(qiáng)度對(duì)預(yù)測(cè)模型的研究。第一批蘋果樣品共90個(gè),經(jīng)K-S算法分類后,其中建模集67個(gè),用于建立SSC模型,預(yù)測(cè)集23個(gè),用于對(duì)建立的模型性能進(jìn)行評(píng)判。第二批蘋果樣品共120個(gè),經(jīng)K-S算法分類后,其中建模集90個(gè),預(yù)測(cè)集30個(gè)。
近紅外光譜采集裝置是本課題組自主研發(fā)的動(dòng)態(tài)在線漫透射檢測(cè)裝置,如圖1所示,圖1中的光源為兩排鹵素?zé)?,一?個(gè),共計(jì)10個(gè),鹵素?zé)舻膮?shù)為12 V,100 W,為漫透射方式采集光譜信息提供光源。蘋果經(jīng)鏈條傳輸至暗箱中,被鹵素?zé)粽丈?,透過蘋果內(nèi)部的光被光纖接收并通過光譜儀傳輸至電腦。光譜儀的波長范圍為350~1 150 nm。光譜采集前裝置預(yù)熱30 min,鹵素?zé)艄庹諒?qiáng)度由另一電流電壓可調(diào)節(jié)的直流供電箱控制。第一批實(shí)驗(yàn)分為五組,五組實(shí)驗(yàn)數(shù)據(jù)均在鹵素?zé)艄ぷ髟?.5 A的電流下測(cè)得,實(shí)驗(yàn)裝置的運(yùn)動(dòng)速度和積分時(shí)間為:第一組0.3 m·s-1、100 ms,第二組0.5 m·s-1、100 ms,第三組0.5 m·s-1、70 ms、第四組0.5 m·s-1、120 ms,第五組0.5 m·s-1、150 ms。第二批實(shí)驗(yàn)分為四組,四組的實(shí)驗(yàn)數(shù)據(jù)在0.5 m·s-1的運(yùn)動(dòng)速度和120 ms的積分時(shí)間下測(cè)得,四組的鹵素?zé)舻墓庹諒?qiáng)度分別為:4.5,5.5,6.5和7.5 A。
圖1 近紅外漫透射在線檢測(cè)裝置
蘋果樣品的SSC含量采用折射式數(shù)字糖度儀(PR-101a,日本)測(cè)量,測(cè)量過程為:用水果刀切下四個(gè)面中光譜采集部位的部分果肉,將果肉擠出果汁,滴在糖度儀的測(cè)量位置,測(cè)量蘋果四個(gè)面的糖度值。取四個(gè)面的平均糖度值作為該蘋果樣品的糖度值。
首先應(yīng)用K-S算法將采集到的蘋果樣本進(jìn)行分類,使用Unscrambler軟件導(dǎo)入采集到的光譜數(shù)據(jù),建立蘋果的SSC模型,采用相關(guān)系數(shù)R和均方根誤差值(RMSEC)對(duì)模型的性能進(jìn)行評(píng)判。
第一批90個(gè)蘋果和第二批120個(gè)蘋果分別使用K-S算法進(jìn)行建模集與預(yù)測(cè)集的分類結(jié)果各為67∶23和90∶30。蘋果的SSC測(cè)量值如表1所示。建模集的SSC含量范圍較廣,大于預(yù)測(cè)集的SSC含量范圍,可以對(duì)蘋果樣本取得較好的預(yù)測(cè)效果。
表1 蘋果SSC統(tǒng)計(jì)結(jié)果
2.2.1 不同運(yùn)動(dòng)速度的光譜對(duì)比
取第一批實(shí)驗(yàn)組中同一實(shí)驗(yàn)樣品,比較兩種不同運(yùn)動(dòng)速度的光譜,如圖2所示,兩種不同運(yùn)動(dòng)速度所采集到光譜波形基本相同,波峰位于640, 710和800 nm處,波谷位于675和755 nm。但0.3 m·s-1的運(yùn)行速度下采集的光譜能量高于0.5 m·s-1,造成此現(xiàn)象的原因是0.3 m·s-1的運(yùn)動(dòng)速度,樣品的曝光時(shí)間長,透過樣品的光能量較多,探測(cè)器接受的光譜能量值較高。
圖2 不同運(yùn)動(dòng)速度下的蘋果近紅外光譜
2.2.2 不同積分時(shí)間光譜對(duì)比
取第一批實(shí)驗(yàn)組的同一實(shí)驗(yàn)樣品,比較兩種不同積分時(shí)間的光譜,如圖3所示,整體光譜能量強(qiáng)弱關(guān)系是:150 ms>120 ms>100 ms>70 ms,四種積分時(shí)間所采集到光譜波形基本相同,在640, 710和800 nm附近存在波峰,波谷位于675和755 nm附近,積分時(shí)間越長,光譜的能量值越高。
2.2.3 不同光照強(qiáng)度光譜對(duì)比
取第二批實(shí)驗(yàn)組同一實(shí)驗(yàn)樣品,比較四種不同光照強(qiáng)度下獲得的光譜,光照強(qiáng)度可由一電流電壓可調(diào)節(jié)的直流供電箱進(jìn)行控制,設(shè)置供電箱的電流分別為4.5,5.5,6.5和7.5 A。四組不同電流測(cè)得的光譜如圖4所示,由圖4可知,整體光譜能量強(qiáng)弱關(guān)系是:7.5 A>6.5 A>5.5 A>4.5 A,產(chǎn)生此現(xiàn)象的原因是隨著電流的增大,鹵素?zé)舻墓庹諒?qiáng)度變強(qiáng),透過實(shí)驗(yàn)樣品的光能量變多,接收器接收到的光信號(hào)增多,光譜能量值也變大。但4.5 A的光照強(qiáng)度采集的光譜在640和800 nm處的波峰基本消失,在675和755 nm處的波谷也不明顯,光譜的能量值處于400以下,光譜能量值較低。
圖4 不同光照強(qiáng)度下的蘋果近紅外光譜
2.3.1 預(yù)處理
使用PLS建立蘋果糖度預(yù)測(cè)模型,為防止模型過擬合或欠擬合,LVs的數(shù)量設(shè)定為1~20。根據(jù)劃分好的建模集和預(yù)測(cè)集建立蘋果的PLS模型,并使用多種預(yù)處理方法對(duì)光譜進(jìn)行處理,第一組實(shí)驗(yàn)樣本處理結(jié)果見表2。
表2 第一批蘋果光譜不同預(yù)處理方法下糖度模型對(duì)比
在全光譜范圍內(nèi)建立蘋果的糖度檢測(cè)模型,采用不同的預(yù)處理方法對(duì)比模型效果,在不同運(yùn)動(dòng)速度的實(shí)驗(yàn)中,當(dāng)實(shí)驗(yàn)裝置的運(yùn)動(dòng)速度為0.5 m·s-1時(shí),經(jīng)MSC預(yù)處理后所建立的模型性能較優(yōu)。其RP為0.966,RMSEP為0.295。在不同積分時(shí)間的實(shí)驗(yàn)中,120 ms的積分時(shí)間所建立的模型普遍優(yōu)于其他積分時(shí)間建立的模型,其RP達(dá)到0.959,RMSEP為0.323。
由表2知,在實(shí)驗(yàn)裝置的運(yùn)動(dòng)速度為0.5 m·s-1,積分時(shí)間為120 ms時(shí),蘋果糖度預(yù)測(cè)模型性能較其他運(yùn)動(dòng)速度和積分時(shí)間組相比較優(yōu),再使用PLS對(duì)第二批樣本進(jìn)行建模,并對(duì)模型使用多種預(yù)處理方法,結(jié)果見表3。
表3 第二批蘋果光譜不同預(yù)處理方法下糖度模型對(duì)比
從表3可以看出,鹵素?zé)舻碾娏鳛?.5 A時(shí)所產(chǎn)生的光照強(qiáng)度對(duì)應(yīng)的糖度預(yù)測(cè)模型相比于其他光照強(qiáng)度組較優(yōu),經(jīng)過SNV預(yù)處理后的模型最優(yōu),其預(yù)測(cè)集相關(guān)性系數(shù)達(dá)到0.968,預(yù)測(cè)集均方根誤差值為0.289。5.5 A光照強(qiáng)度組的模型性能優(yōu)于4.5 A組,但是7.5 A的光照強(qiáng)度組卻不如6.5 A的光照強(qiáng)度組。分析原因是因?yàn)楫?dāng)光照強(qiáng)度較低時(shí),隨著光強(qiáng)的增加,光譜儀探測(cè)器接受到的蘋果內(nèi)部信息變多,所建立的蘋果SSC預(yù)測(cè)模型性能變好。但是當(dāng)光照強(qiáng)度超過一定值時(shí),隨著鹵素?zé)舻墓庹諒?qiáng)度增加,會(huì)導(dǎo)致更多的雜散光被帶入光譜儀探測(cè)器,所建立的蘋果SSC預(yù)測(cè)模型性能也隨之變差。
2.3.2 特征波長選擇
為了消除無用變量,進(jìn)一步優(yōu)化預(yù)測(cè)模型的性能,提高模型的檢測(cè)速度。由表2和表3知,運(yùn)動(dòng)速度為0.5 m·s-1,積分時(shí)間為120 ms時(shí),鹵素?zé)舻墓庹諒?qiáng)度為6.5 A時(shí),蘋果糖度預(yù)測(cè)模型性能較其他運(yùn)動(dòng)速度、積分時(shí)間和光照強(qiáng)度組相比較優(yōu),所以特征波長的選擇在運(yùn)動(dòng)速度為0.5 m·s-1,積分時(shí)間120 ms,光照強(qiáng)度為6.5 A的實(shí)驗(yàn)組進(jìn)行,采用SPA和CARS兩種波長選擇算法對(duì)光譜變量進(jìn)行篩選,選取有效變量建立PLS模型。
SPA在挑選變量時(shí),分別設(shè)置最小、最大變量數(shù)為10和40,通過計(jì)算模型的最小的均方根誤差值來確定所選變量的數(shù)量。SPA挑選的波長如圖5所示,挑選的波長涵蓋了模型大部分的有效信息,可以簡化模型,波長選擇后,將挑選的波長用于建立PLS模型,模型效果見表4。
圖5 SPA挑選的波長分布
表4 兩種波長選擇算法的PLS模型
表4為用特征波長建立的PLS模型結(jié)果,可以看到,使用SPA篩選出的波段建立的糖度模型性能較差,產(chǎn)生此現(xiàn)象的原因是:糖度在光譜上有多重表征,進(jìn)行波長選擇后,去掉了很多的有用信息,從而導(dǎo)致模型的效果變差。其中,SPA-PLS的RP為0.941,RMSEP為0.406。
圖6為使用CARS算法提取出的特征波長圖。采用PLS對(duì)CARS選中的波長變量進(jìn)行建模,結(jié)果如表4所示,與SNV預(yù)處理的模型相比,其建模集相關(guān)系數(shù)RC由0.984提高至0.997,建模集均方根誤差值RMSEC由0.221下降至0.102,預(yù)測(cè)集相關(guān)系數(shù)RP由0.968提高至0.991,預(yù)測(cè)集均方根誤差由0.331下降至0.149。此外,模型所用波長變量數(shù)由1 044個(gè)下降至83個(gè),有效地簡化模型,提高模型的穩(wěn)定性。
圖6 CARS挑選的波長分布
通過以上對(duì)比分析,裝置的運(yùn)動(dòng)速度為0.5 m·s-1,積分時(shí)間為120 ms,光照強(qiáng)度為6.5 A的實(shí)驗(yàn)參數(shù)組預(yù)測(cè)效果最佳。采用CARS進(jìn)行波段篩選后,建立了蘋果SSC的偏最小二乘回歸模型,采用預(yù)測(cè)集對(duì)蘋果SSC的預(yù)測(cè)模型進(jìn)行檢驗(yàn)。SSC的預(yù)測(cè)值與真實(shí)值散點(diǎn)圖如圖7所示,圖中建模集擬合曲線與預(yù)測(cè)集擬合曲線的斜率接近于1,預(yù)測(cè)效果較好。
圖7 CARS-PLS模型建模散點(diǎn)圖
采用動(dòng)態(tài)在線檢測(cè)裝備,采集三種實(shí)驗(yàn)參數(shù)下的九組光譜,對(duì)比了在不同的運(yùn)動(dòng)速度、積分時(shí)間和光照強(qiáng)度所建立的蘋果SSC預(yù)測(cè)模型性能的優(yōu)劣,優(yōu)化實(shí)驗(yàn)裝置的參數(shù)。結(jié)果表明:在兩種不同的移動(dòng)速度下,移動(dòng)速度為0.5 m·s-1建立的SSC預(yù)測(cè)模型優(yōu)于0.3 m·s-1。在四種不同的積分時(shí)間下,積分時(shí)間為120 ms建立的SSC預(yù)測(cè)模型優(yōu)于其他積分時(shí)間組。最后,在運(yùn)動(dòng)速度為0.5 m·s-1,積分時(shí)間為120 ms的實(shí)驗(yàn)參數(shù)下,探究四種不同光照強(qiáng)度所建立的蘋果SSC預(yù)測(cè)模型性能的優(yōu)劣,采用了多種預(yù)處理和波段篩選方法進(jìn)行對(duì)比,結(jié)果發(fā)現(xiàn):光照強(qiáng)度為6.5 A時(shí)所建立的蘋果糖度預(yù)測(cè)模型的性能普遍優(yōu)于其他光照強(qiáng)度組,這是因?yàn)楫?dāng)光照強(qiáng)度較低時(shí),隨著光強(qiáng)的增加,光譜儀探測(cè)器接受到的蘋果內(nèi)部信息變多,所建立的蘋果SSC預(yù)測(cè)模型性能變好,但是當(dāng)光照強(qiáng)度超過一定值時(shí),會(huì)導(dǎo)致更多的雜散光被帶入光譜儀探測(cè)器,所建立的蘋果SSC預(yù)測(cè)模型性能也隨之變差。采用CARS波段篩選方法對(duì)光照強(qiáng)度6.5 A的實(shí)驗(yàn)組進(jìn)行波段選擇,從1 044個(gè)光譜中篩選出83個(gè)變量所建立的CARS-PLS模型最優(yōu),其RP和RMSEP分別為0.991和0.149。
研究了動(dòng)態(tài)在線裝置不同參數(shù)條件下對(duì)蘋果SSC預(yù)測(cè)模型的影響,為優(yōu)化裝置參數(shù),提高模型性能提供了技術(shù)支持。未來的研究將采用多品種果種,研究多種參數(shù)對(duì)建立的蘋果品質(zhì)預(yù)測(cè)模型的影響,深化分析,以獲得更準(zhǔn)確的和穩(wěn)健的模型。