劉燕德, 廖 軍, 李 斌, 姜小剛, 朱明旺, 姚金良, 王 秋
華東交通大學(xué)機(jī)電與車輛工程學(xué)院, 智能機(jī)電裝備創(chuàng)新研究院, 江西 南昌 330013
貢梨是一種受人喜愛的水果, 以皮薄多汁、 味濃甘甜而聞名。 貢梨中的可溶性固形物含量是影響貢梨品質(zhì)的重要內(nèi)部屬性之一, 也是決定水果成熟度和收獲時(shí)間的關(guān)鍵參數(shù)之一。 因此, 開發(fā)無損、 快速的貢梨可溶性固形物含量的檢測方法來滿足消費(fèi)者對穩(wěn)定、 優(yōu)質(zhì)水果日益增長的需求具有重要的價(jià)值。 近紅外光譜技術(shù)能夠?qū)崿F(xiàn)食品的無損檢測分析, 而且?guī)缀醪恍枰獙悠愤M(jìn)行處理即可進(jìn)行檢測, 不會產(chǎn)生廢物, 并允許同時(shí)評估幾種成分[1]。 近紅外在線檢測已被應(yīng)用于測定梨[2]、 橙子[3]、 橄欖[4]、 蘋果[5]等水果的SSC。
水果的物理性質(zhì)如顏色[6]、 溫度[7]、 靜止位置[8]、 移動速度[9]等在檢測過程中可能會對光譜信息采集有很大影響, 除這些物理性質(zhì)以外, 測量方向也是影響光譜信息采集的重要因素之一。 Yu等[10]研究了基于近紅外光譜的紅富士蘋果果實(shí)方位變化對可溶性固形物在線預(yù)測的影響; 韓東海等[11]比較了3種果實(shí)方向即莖-花萼軸水平、 莖-花萼軸垂直、 莖向上和莖向下在線檢測蘋果中的SSC, 基于莖-花萼軸垂直、 莖向上的方向得到了較好的結(jié)果; 在透射模式下, 基于莖萼軸水平方向檢測梨褐心得到了較好的結(jié)果[12], 莖萼軸垂直取向也獲得了測量蘋果的SSC和硬度的良好結(jié)果。 如今近紅外在線檢測水果內(nèi)部品質(zhì)的設(shè)備多采用局部模型對水果進(jìn)行預(yù)測, 由于局部模型是利用單個(gè)局部方向獲得的光譜數(shù)據(jù)單獨(dú)開發(fā)的, 在預(yù)測其他水果方向上的SSC時(shí), 其精度會大打折扣。 目前解決該問題主要依靠人工擺正果位或增加擺正機(jī)構(gòu), 費(fèi)錢費(fèi)力。 建立一個(gè)基于全方向的全局模型也許能夠解決上面的問題, 也還沒有人將全局模型應(yīng)用于近紅外在線漫透射檢測裝備來預(yù)測不同方向運(yùn)送下的貢梨SSC。
本研究利用課題組自主研發(fā)的在線漫透射檢測裝備采集六個(gè)不同檢測方向下的貢梨光譜, 使用Savitzky-Golay卷積平滑、 多元散射校正MSC、 高斯濾波平滑GFS對平均后的150貢梨光譜進(jìn)行預(yù)處理, 對光譜進(jìn)行修正和優(yōu)化, 最后通過偏最小二乘回歸PLSR建立了六個(gè)局部模型和一個(gè)全局模型。 六個(gè)方向的預(yù)測集分別對七個(gè)模型進(jìn)行預(yù)測, 對預(yù)測結(jié)果進(jìn)行比較并評判各局部模型與全局模型的魯棒性。 為全局模型是否能夠應(yīng)用于近紅外在線漫透射檢測裝備提供參考。
于2021年四月下旬在中國南昌某水果超市購買150個(gè)貢梨, 150個(gè)貢梨均沒有表面缺陷或污染物。 貢梨的赤道直徑范圍為85~95 mm, 所有樣品都單獨(dú)清洗并編號; 實(shí)驗(yàn)前把樣品放在實(shí)驗(yàn)室儲存24 h, 使貢梨溫度與實(shí)驗(yàn)室溫度一致, 以減少溫度對預(yù)測精度的影響。
將150個(gè)樣本隨機(jī)分配到校準(zhǔn)集和預(yù)測集。 選擇115個(gè)樣本作為用于開發(fā)校準(zhǔn)模型的校準(zhǔn)集, 其余35個(gè)樣本用作預(yù)測集來驗(yàn)證校準(zhǔn)模型的預(yù)測性能。
樣品的漫透射光譜由本課題組自主研發(fā)的水果內(nèi)部品質(zhì)近紅外漫透射光譜在線檢測裝備(圖1)測得[13]。
使用反射率超過95%的聚四氟乙烯制成的直徑φ=90 mm的白色球體測量參考光譜。 參考測量三次, 計(jì)算平均光譜作為最終的Rwhite。 當(dāng)所有的燈都關(guān)了, 燈的入口打開時(shí), 收集暗光譜Rdark。
圖1 水果內(nèi)部品質(zhì)近紅外漫透射光譜在線檢測裝備示意圖
如圖2所示[14], 莖-花萼軸垂直, 莖向上(A1)和莖向下(A5), 莖-花萼軸和水平之間45°, 莖向上傾斜(A2)和莖向下傾斜(A4), 莖-花萼軸水平, 莖朝向右側(cè)光(A3), 莖花萼軸水平, 莖朝向帶移動方向(A6)。 實(shí)驗(yàn)前隨機(jī)選取了60個(gè)貢梨, 讓它們從上一傳送通道上隨機(jī)傳過來, 貢梨在果杯上的位置都在這六個(gè)方向附近, 這可能是因?yàn)樨暲姹旧淼慕Y(jié)構(gòu)造成的。 且兩排光源以果杯為基準(zhǔn)為對稱光源, 這六個(gè)方向相當(dāng)于一個(gè)大區(qū)間, 從上一傳送通道上傳過來的貢梨在果杯上的位置都在這一區(qū)間內(nèi)。
圖2 漫透射檢測機(jī)構(gòu)(a)及貢梨擺放位置(b)
分別在六個(gè)方向測量光譜數(shù)據(jù), 光譜數(shù)據(jù)按A1, A2, A3, A4, A5和A6的順序采集。 用手將每個(gè)樣品穩(wěn)定地放在水果盤上。 本課題組自主研發(fā)的水果內(nèi)部品質(zhì)近紅外漫透射光譜在線檢測裝備(圖1)能夠保證運(yùn)行平穩(wěn), 果杯上的貢梨震感極弱, 在傳送貢梨的過程中可以保證貢梨的平穩(wěn)傳送。 僅保留346~1 125 nm的光譜數(shù)據(jù), 由1 044個(gè)數(shù)據(jù)點(diǎn)即光譜變量組成, 用于進(jìn)一步分析。 然后, 原始光譜Rraw根據(jù)式(1)轉(zhuǎn)換為校準(zhǔn)光譜R:
(1)
考慮到貢梨形狀的不規(guī)則性, 為了減少操作人員和儀器引入的誤差, 提高信噪比, 在每個(gè)水果方位采集三個(gè)光譜, 樣品繞莖萼軸旋轉(zhuǎn)0°, 120°和240°, 對三個(gè)光譜進(jìn)行平均得到平均光譜。 樣品以30 cm·s-1的速度由傳送帶傳送, 同時(shí)所有光譜數(shù)據(jù)存儲在工業(yè)計(jì)算機(jī)中。
在光譜采集之后, 立即通過傳統(tǒng)的破壞性試驗(yàn)確定SSC值。 手動擠壓每個(gè)完整樣品的汁液, 并將其滴到日本東京ATAGO有限公司生產(chǎn)的數(shù)字折光儀PAL-1上(測量精度為Brix±0.2%, 且具有溫度補(bǔ)償功能, 適用溫度范圍10~40 ℃), 以測量SSC值, 繞莖萼軸旋轉(zhuǎn)0°, 120°和240°, 為每個(gè)樣品收集三個(gè)SSC值, 并根據(jù)這三個(gè)值來獲取平均值。
由于采集的光譜可能包含無用的背景信息或噪聲, 而光譜預(yù)處理往往可以提高模型的性能。 采用不同的預(yù)處理方法對原始光譜數(shù)據(jù)進(jìn)行預(yù)處理, 包括Savitzky-Golay卷積平滑SGS、 多元散射校正MSC和高斯濾波平滑GFS等來優(yōu)化原始光譜數(shù)據(jù)。 SGS可以有效減少光譜的噪聲并提高信噪比, 多元散射校正MSC可以消除水果內(nèi)部不均導(dǎo)致的散射效應(yīng); 高斯濾波GFS可以消除光譜中的隨機(jī)噪聲。
偏最小二乘回歸PLSR是一種無監(jiān)督的多變量統(tǒng)計(jì)分析方法[15], 被廣泛應(yīng)用于NIRS分析研究, 具有較強(qiáng)的抗干擾性。 PLSR的目的是通過將光譜矩陣與濃度向量投影到新的潛在空間, 使其中的潛在變量之間的協(xié)方差最大化, 并最終執(zhí)行潛變量線性回歸模型。
為了全面檢驗(yàn)測量方向?qū)ω暲鍿SC光譜分析的影響, 使用PLSR分別為每個(gè)方向和所有方向數(shù)據(jù)集建立SSC模型, 即局部模型與全局模型。 每個(gè)局部模型都是由該方向上的115個(gè)校正集光譜數(shù)據(jù)建立的。 因此, 分別建立了六個(gè)局部模型, 如圖3, 校正集用長方形表示, 預(yù)測集用圓形表示; 在局部模型中, 實(shí)線所指為本方向的預(yù)測集對該模型進(jìn)行驗(yàn)證; 虛線為其他方向的預(yù)測集對該模型進(jìn)行驗(yàn)證, 這是為了評估局部模型的魯棒性。 一些物理性質(zhì)的全局模型已經(jīng)成功地用于減少色差[8]、 溫度波動[9]和生物可變性對近紅外模型性能的影響。 在本研究中, 全局模型中的校正集由六個(gè)方向的校正集數(shù)據(jù)組成, 總共包括690個(gè)光譜。 為了驗(yàn)證全局模型的預(yù)測能力, 分別用六個(gè)預(yù)測集對全局模型進(jìn)行驗(yàn)證。 比較七個(gè)模型的性能, 選擇出魯棒性最好的模型。
圖3 局部模型、 全局模型的建立以及實(shí)驗(yàn)驗(yàn)證方案
根據(jù)校準(zhǔn)和預(yù)測的相關(guān)系數(shù)、 校準(zhǔn)的均方根誤差RMSEC、 預(yù)測的均方根誤差RMSEP來評估校準(zhǔn)模型的性能。Rc,Rp, RMSEC和RMSEP的計(jì)算定義如式(2)—式(5)
(2)
(3)
(4)
(5)
其中,ypi為第i個(gè)水果的SSC的預(yù)測值,ymi為第i個(gè)貢梨SSC的實(shí)測值,ymeanc和ymeanp分別為校準(zhǔn)集和預(yù)測集中SSC的平均值,nc和np分別為校準(zhǔn)集和預(yù)測集中水果個(gè)數(shù)。 一般來說, 選擇一個(gè)好的模型, 不僅要根據(jù)較高的Rc和Rp, 較低的RMSEC和RMSEP, 還要根據(jù)RMSEC和RMSEP之間的微小差異來選擇。
在150個(gè)貢梨中隨機(jī)選取第11號果, 如圖4所示為11號果在A1—A6六個(gè)方向上獲得的346~1 125 nm的漫透射平均原始光譜。 由圖4可知, A1方向的漫透射光譜的能量明顯強(qiáng)于其他方向, 處于其他方向的漫透射光譜上方; 其他方向的漫透射光譜的能量由強(qiáng)到弱依次是A5, A6, A2, A3和A4, 其中A6, A2, A3和A4的漫透射光譜的能量相差不大; 各方向的漫透射光譜的能量不同可能與貢梨所受的有效光源照射面積有關(guān), 其中A1與A5所受的有效光源照射面積最大。 從六個(gè)方向所采集的光譜的吸收峰和波谷所處的波段大致相同, 只是光強(qiáng)大小不同。 其中波谷在750 nm附近, 在710與800 nm附近各有一個(gè)波峰。 750 nm附近的波谷可能由O—H三倍頻伸縮振動導(dǎo)致。
圖4 11號果六個(gè)方向的平均光譜圖
表1為六個(gè)方向的校正集和預(yù)測集可溶性固形物的范圍, 標(biāo)準(zhǔn)偏差和平均值。 從表1可看出含115個(gè)樣本的校正集的可溶性固形物含量的范圍大于含35個(gè)樣本的預(yù)測集的可溶性固形物含量的范圍。
表1 校正集和預(yù)測集中可溶性固形物SSC含量的范圍、 標(biāo)準(zhǔn)偏差和平均值
以A1方向?yàn)槔?用在A1方向采集的115個(gè)校正集光譜數(shù)據(jù)建立模型, 再用另外35個(gè)預(yù)測集數(shù)據(jù)對其進(jìn)行局部驗(yàn)證。 其他五個(gè)方向同理建立模型并進(jìn)行驗(yàn)證。 每種預(yù)處理方法側(cè)重的方面都有所不同, 因此對原始光譜用不同的預(yù)處理方法會有不同的效果, 為了有效減少光譜的噪聲并提高信噪比, 使用SGS對六個(gè)局部模型進(jìn)行預(yù)處理; 考慮到水果內(nèi)部不均易導(dǎo)致散射效應(yīng), 采用MSC對六個(gè)局部模型進(jìn)行預(yù)處理; 由于光譜中的隨機(jī)噪聲, 選用GFS對六個(gè)局部模型進(jìn)行預(yù)處理。 表2記錄了使用SGS, MSC和GFS預(yù)處理后結(jié)合PLSR建立的模型以及預(yù)測結(jié)果。 可以發(fā)現(xiàn), 六個(gè)方向的原始數(shù)據(jù)使用SGS和MSC預(yù)處理后建立的PLSR模型, 它們的Rc和Rp都會有所減小, 校正集和預(yù)測集的RMSE大多都會變大; 當(dāng)使用GFS分別對六個(gè)方向原始數(shù)據(jù)預(yù)處理后, A1, A2, A4, A5和A6的Rc會變小,Rp會變大, 這就使得校正集和預(yù)測集的相關(guān)系數(shù)更接近, 擬合性更好。 因此, 結(jié)果表明通過GFS預(yù)處理后建立的六個(gè)局部模型比用其他兩種預(yù)處理后建立的結(jié)果更好。
表2 六個(gè)方向的局部模型與局部預(yù)測效果
將經(jīng)過GFS預(yù)處理后的光譜建立的六個(gè)局部模型及驗(yàn)證結(jié)果進(jìn)行比較, 可以發(fā)現(xiàn)在A3方向的預(yù)測效果最好, 它的Rc和Rp分別是0.913和0.872, RMSEC和RMSEP分別為0.397和0.342。 A6方向的局部模型的局部預(yù)測效果最差, 它的Rc和Rp分別是0.831和0.794, RMSEC和RMSEP分別為0.534和0.508。 結(jié)果表明, 貢梨SSC局部模型在相同方向上的預(yù)測效果非常好。 但是在線檢測時(shí), 如果沒有機(jī)構(gòu)或人工擺正水果的位置, 水果在經(jīng)過檢測裝置時(shí)不可能只是單一方向的。 因此, 要想證明局部模型該情況下的效果, 還需要看其他五個(gè)方向的預(yù)測集對其進(jìn)行驗(yàn)證的效果。
使用A1—A6六個(gè)方向上的690個(gè)校正集數(shù)據(jù)建立全局模型, 各方向的預(yù)測集分別對全局模型進(jìn)行驗(yàn)證。 然而從表3和表4中可以看到, 經(jīng)過GFS預(yù)處理后建立的PLSR模型, 校正集與各個(gè)方向的預(yù)測集的擬合性變好; 校正集的Rc為0.828, A1, A2, A3, A4, A5和A6的Rp分別為0.818, 0.765, 0.799, 0.821, 0.794和0.824, 校正集的RMSEC為0.424, RMSEP分別為0.446, 0.525, 0.478, 0.538, 0.486和0.619, 可以看出全局模型對各個(gè)方向都有較好的預(yù)測效果。
表3 全局模型以及A1, A2和A3方向預(yù)測效果
為了進(jìn)一步評估全局模型對全方向模型的預(yù)測效果, 把六個(gè)方向的預(yù)測集合成一個(gè)預(yù)測集, 再對全集模型進(jìn)行驗(yàn)證, 該預(yù)測集的Rp和RMSEP分別為0.748和0.548, 結(jié)果表明依舊有較好的預(yù)測效果。 圖3為貢梨SSC測量真值與預(yù)測值的散點(diǎn)圖。
表4 全局模型以及A4, A5和A6方向預(yù)測效果
圖5 全方向驗(yàn)證散點(diǎn)圖
用六個(gè)方向的預(yù)測集數(shù)據(jù)分別對A1, A2, A3, A4, A5和A6的局部模型和全局模型進(jìn)行驗(yàn)證。 如表5和表6, 局部模型雖然對本方向的預(yù)測效果很好, 但是對于其他方向的預(yù)測效果卻很差, 例如局部模型A1預(yù)測A2, A3, A4和A5的RMSEP分別為1.431, 0.816, 0.767和1.015; 局部模型A2預(yù)測A1, A4, A5和A6的Rp均在0.1以下, 不可信賴; 其他局部模型均有類似情況。 在線檢測時(shí)如果沒有人工對水果進(jìn)行方向調(diào)整或者沒有設(shè)計(jì)制造調(diào)整方向的擺正機(jī)構(gòu), 那么局部模型是不具備在線檢測能力的, 局部模型在驗(yàn)證其他方向時(shí)所表現(xiàn)出來的魯棒性太差。 六個(gè)方向的預(yù)測集對全局模型進(jìn)行驗(yàn)證的效果雖不如局部模型預(yù)測本方向時(shí)的驗(yàn)證效果, 但是效果都還不錯(cuò), 全局模型的校正集Rc為0.828, RMSEC為0.424; A1, A2, A3, A4, A5和A6方向的預(yù)測集分別為0.818, 0.765, 0.799, 0.821, 0.794和0.824, RMSEP分別為0.446, 0.525, 0.478, 0.538, 0.486和0.619; 結(jié)果表明六個(gè)方向的Rp與Rc均比較接近且均在0.800左右, RMSEC與RMSEP均在0.500左右, 因此全局模型在驗(yàn)證六個(gè)方向時(shí)是魯棒的。 但是總體來看R都只有0.8左右, 這可能是因?yàn)樨暲媪鶄€(gè)方向上的SSC含量分布不均勻, 而本實(shí)驗(yàn)所測得的SSC含量真值為貢梨整果的平均SSC含量真值。
表5 局部模型和全局模型對A1, A2, A3方向預(yù)測集的預(yù)測效果
表6 局部模型和全局模型對A4, A5和A6預(yù)測集的預(yù)測效果
采用本課題組自主研發(fā)的水果內(nèi)部品質(zhì)近紅外漫透射光譜在線檢測裝備采集150個(gè)貢梨六個(gè)方向的光譜, 研究了光譜測量方向的變化對貢梨SSC在線測定的影響。 使用GFS預(yù)處理后通過PLSR建立的模型效果都比較好, 局部模型能夠很好的預(yù)測本方向的貢梨SSC, 全局模型可以較好的預(yù)測全方向的貢梨SSC。 通過建立局部模型和全局模型并分別用六個(gè)方向的預(yù)測集對它們進(jìn)行驗(yàn)證, 結(jié)果表明樣品的檢測方向極大地影響了貢梨SSC的預(yù)測精度, 局部模型的魯棒性差; 全局模型與局部模型相比, 基于所有方向的全局模型獲得了更準(zhǔn)確的預(yù)測結(jié)果, 六個(gè)方向的Rp與Rc均比較接近且均在0.800左右, RMSEC與RMSEP均在0.500左右, 魯棒性更好。 因此, 全局模型將有助于消除光譜測量中測量方向的影響, 實(shí)現(xiàn)貢梨SSC的整體方向在線檢測, 這對近紅外在線檢測工業(yè)化有實(shí)際意義。