劉燕德,崔惠楨,李 斌,王觀田,徐 振,李茂鵬
華東交通大學機電與車輛工程學院,江西 南昌 330013
隨著社會的發(fā)展和進步,人們對食品的要求也在不斷地提高,蘋果作為一種富含維生素和礦物質(zhì)的優(yōu)質(zhì)水果,在廣大消費者中很受歡迎,蘋果的內(nèi)外部品質(zhì)也一直是人們在購買時所關注的重點。可見-近紅外無損檢測技術(shù)作為一種高效率、 低成本且對檢測對象不會造成破壞的檢測手段,在蘋果、 西瓜、 臍橙、 柑橘、 柚子、 草莓、 哈密瓜等水果的內(nèi)外品質(zhì)檢測方面被廣泛使用[1]。
在對水果進行糖度檢測時,漫反射、 漫透射等檢測方式建立的模型會有不同的預測結(jié)果,采用同一個檢測方式的同時,檢測位置的不同也會導致建立模型的預測能力不同。劉旭文等在建立梨的可溶性固形物的近紅外光譜檢測模型穩(wěn)定性及優(yōu)化研究中,通過對翠冠梨徑向三個不同檢測位置(果梗、 赤道、 花萼)采集光譜和測量糖度建立不同位置的可溶性固形物評價模型,用CARS篩選變量,篩選出36個特征變量后用偏最小二乘回歸(partial least square, PLS)建立模型,得到用赤道區(qū)附近光譜及糖度建立的模型預測結(jié)果更準。李雄[2]等通過研究西瓜光投射規(guī)律與品質(zhì)屬性的內(nèi)在聯(lián)系時提出,不同的積分時間和電流強度會導出不同的建模結(jié)果;在其他條件相同情況下,根據(jù)西瓜瓜皮到果心的距離將西瓜分為心糖、 中糖、 外糖、 底邊糖和混合糖,通過卷積平滑降解光譜噪聲并用偏最小二乘建立可溶性固形物的糖度模型后,得到的結(jié)果表明用底邊糖區(qū)域的光譜信息建模效果最佳。目前還沒有見到針對蘋果漫透射采集光譜的不同光照位置對建立模型影響的研究報道。
將果莖為70 mm蘋果果實放置在近紅外靜態(tài)光譜采集裝置上;該近紅外靜態(tài)光譜采集裝置的鹵素燈可以調(diào)整其照射位置及角度,通過調(diào)整鹵素燈光對蘋果不同部位的照射區(qū)域,把照射位置分為上部(與水平方向夾角為80°)和斜上部(與水平位置夾角為50°),探究蘋果果實不同的光照位置對建立基于可見-近紅外的蘋果可溶性固形物的預測模型的影響,找到在檢測蘋果可溶性固形物時,照射在蘋果果實上的最佳光照位置。
實驗所需的蘋果樣品購買于江西省南昌市某水果市場,按照相同尺寸購買蘋果樣品,蘋果尺寸為(73±2) mm。買來的蘋果用純凈水和消毒紙巾將表面清洗擦拭干凈后,放在室溫20 ℃環(huán)境下靜置24 h,因為購置的蘋果的溫度不一樣,靜置24 h目的是為了消除在建立可溶性固形物模型時溫度造成的影響。靜置24 h的蘋果剔除在裂果,碰傷果和品質(zhì)相差較大的果實后隨機分成兩組,一組照射果實的上部,另一組照射果實的斜上部;照射蘋果上部的果實根據(jù)K-S算法分成訓練集188個,預測集62個。所有果實的果莖范圍為(73±2) mm,用來建模的蘋果的可溶性固形物的糖度區(qū)間為8.2~16.8°Brix,用來預測的模型性能的蘋果可溶性糖度區(qū)間為8.8~16.2°Brix。照射蘋果斜上部的果實訓練集為188個,預測集為62個,所有果實的果莖范圍為70~75 mm,訓練集糖度范圍為9.1~16.6°Brix,預測集糖度范圍為10.5~16.6°Brix。
表1 蘋果的理化指標范圍統(tǒng)計結(jié)果Table 1 Statistical results of physical andchemical indices of apple
可見近紅外漫透射光譜采集裝置如圖1所示,該裝置是由可調(diào)燈架、 支架、 鹵素燈、 光纖固定支架、 光纖、 光譜儀、 計算機以及果杯組成。可調(diào)燈架用于調(diào)整鹵素燈照射角度以及鹵素燈與樣品的距離;可調(diào)燈架與支架用螺絲螺母固定,兩個可調(diào)燈架分別安裝兩盞12 V,100 W的鹵素燈,采用穩(wěn)壓電源供電。光纖通過光纖固定裝置固定在支架上;果杯安裝在光纖固定裝置上部;光纖另一端與光譜儀連接,光譜儀另一端與計算機連接。采集光譜時,將鹵素燈調(diào)整至與水平夾角45°處,此時采集的位置為蘋果的斜上部,采集完斜上部的樣品后,將鹵素燈調(diào)整至與水平夾角75°處,此時的采集位置為上部,具體如圖1所示。整個裝置放在一個暗箱中,光譜采集的全過程在暗箱中進行。光源按照漫透射的方式照射到蘋果,透射光譜被傳送到光譜儀,然后再傳輸至計算機。
光譜采集時,要提前打開電源使鹵素燈和光譜采集裝置預熱20 min,預熱后首先對聚四氟乙烯球進行光譜采集,之后分別對照射位置為上部的蘋果和照射位置為斜上部的蘋果采集光譜后取平均光譜,將平均光譜作為蘋果樣品的漫透射光譜。實驗參數(shù)為:積分時間100 ms,光強100 W,鹵素燈6盞。
圖1 光譜檢測系統(tǒng)示意圖Fig.1 Schematic diagram of the spectrum detection system
對采集光譜后的蘋果,用刀沿著光譜采集位置切下4 mm果肉薄片榨取相應的蘋果汁,用濾網(wǎng)過濾掉榨汁殘留的果肉后用一次性吸管吸取榨取的果汁,滴到ATAGO PAL-1便攜式數(shù)顯折射計鏡面上。在吸取果汁測定之前,首先用蒸餾水清洗測定儀器的測定部分,完成儀器測量之前的調(diào)零,一個檢測面的糖度測定三次,取平均值為其真實糖度。在這個過程中,需要注意的是,榨取完第一個位置的蘋果片、 測完相應糖度后,在進行下一個位置的蘋果片榨取測定時,要將水果刀及榨汁的設備用蒸餾水洗刷干凈,更換一次性吸管,并且對ATAGO PAL-1設備用清水重新調(diào)零,避免因果汁殘留導致糖度測量出現(xiàn)偏差進而導致實驗數(shù)據(jù)有誤。
用MATLAB2016A提取光譜及波段數(shù)據(jù),并將數(shù)據(jù)導出到EXCEL表格后在相同的EXCEL中輸入測得的真實糖度值,將真實糖度和對應的光譜一起輸入到The Unscrambler,首先剔除蘋果光譜和糖度數(shù)據(jù)中的異常樣本,對照射位置分別為上部和斜上部的蘋果光譜和可溶性固形物數(shù)據(jù)分別采用相同的回歸方法進行分析,選擇訓練集、 檢驗集和外部測試集后再選擇合適的線性或者非線性方法進行建模。
在統(tǒng)計學中,回歸分析指的是兩種或兩種以上變量之間的相關性關系的定量分析。按照一個變量涉及的另幾個變量的數(shù)目,可以分為一元線性回歸和多元線性回歸[3],一元線性回歸是一個變量涉及另外一個變量,探究兩個變量之間的相關線性關系;多元線性回歸則是一個變量涉及兩個或兩個以上變量,探究至少三個變量之間的相關線性關系;按照自變量和因變量之間的關系,又可以把回歸分為線性回歸和非線性回歸[4-7]。
建立的定量模型需要有性能評價標準,會用到一些統(tǒng)計參數(shù),例如校正標準偏差RMSEC,預測標準偏差RMSEP和決定系數(shù)R2,通過比較這三個指標,選取最優(yōu)的建模參數(shù)和模型[8]。一般來說,校正標準偏差RMSEC的數(shù)值越低,表明所建立預測模型的相關性越好,預測標準偏差RMSEP的數(shù)值越低,則說明所建立模型的預測準確性更準確[9-10]。
三個評價指標的計算公式如下。
①訓練集的均方根誤差
(1)
式(1),y是樣品指標的真實值;yc是模型根據(jù)建模數(shù)據(jù)得出的預測值;nc是校正集建模所需的樣品數(shù)量。
② 預測集的均方根誤差
(2)
式(2),y是樣品指標的真實值;yp是模型根據(jù)建模數(shù)據(jù)得出的預測值;np是預測集建立所需的樣品數(shù)量。
通常情況下,RMSEC和RMSEP兩者的值越小并且兩者間的差值越接近零時,可以做出判斷,建立的模型效果最好,否則模型效果不佳。
③ 決定系數(shù)
(3)
2.1.1 不同光照位置的差異影響分析
圖2是近紅外漫透射蘋果不同光照位置光路示意圖。采用漫透射的方式研究蘋果不同光照位置對蘋果可溶性固形物檢測模型的影響時,如圖2燈B所示,燈B的光路示意線是照射位置為蘋果斜上部位置,光源光路主要攜帶信息為淺層的果肉信息,光穿過果核的部分少,不會采集到果核的信息,避免了果核信息對整個可溶性固形物模型建立帶來的干擾;如圖2燈A所示,其光路示意線是照射蘋果上部位置的光線示意圖,在此位置,光線可以穿過蘋果的大部分區(qū)域,也包含果核的大部分信息,所包含的蘋果的信息內(nèi)容更多更豐富。
2.1.2 不同光照位置的光譜對比分析
如圖3所示,為基于近紅外漫透射的蘋果不同照射位置的光譜光強示意圖,圖示為平均原始光譜。由圖可得,照射位置為上部的光譜漫透射能量比照射位置為斜上部的蘋果漫透射能量強;兩個不同照射位置的近紅外漫透射光譜的吸收峰和波谷所在的波段位置基本相同,在645,710和820 nm波段處出現(xiàn)了光譜波峰,且710 nm處和820 nm處的能量峰值相差較大,在645 nm處的能量相差較?。辉?75和740 nm處存在波谷,740 nm處的波谷差值比675 nm處的波谷差值大。由于采集到的光譜在500 nm之前和1 100 nm之后含有的有效信息較少,且含有大量的噪聲信息和無關信息,所以在建立可溶性固形物模型時,選取500~1 100 nm的光譜建模。在波段為675 nm附近處,可能是由于樣品中葉綠素含量吸收變化的強度不同導致了光譜吸收峰的出現(xiàn)[12]。在740 nm處的光譜吸收峰與羥基的第三倍頻和C—H鍵的第四倍頻相關。上述的光譜波段所攜帶的信息都與蘋果中可溶性固形物(soluble solids content, SSC)的含量有一定的聯(lián)系。
圖2 近紅外漫透射蘋果不同光照位置光路示意圖
圖3 基于近紅外漫透射的蘋果不同光照位置的 光譜光強示意圖
2.1.3 可溶性固形物統(tǒng)計
表2為基于近紅外光譜不同光照位置對蘋果可溶性固形物建模影響的樣品數(shù)據(jù)統(tǒng)計,其中照射位置為上部的樣品訓練集有188個蘋果樣品,蘋果的平均糖度值為12.969 4°Brix,糖度范圍為8.2~16.8°Brix,照射位置為上部的樣品預測集有62個蘋果樣品,蘋果的平均糖度值為13.180 7°Brix,糖度范圍為8.8~16.2°Brix;照射位置為斜上部的的訓練集有188個蘋果樣品,蘋果的墻均糖度值為13.259 7°Brix,糖度范圍為9.1~16.6°Brix;照射位置為斜上部的預測集有62個蘋果樣品,蘋果的平均糖度值為13.373 9°Brix,糖度范圍為10.5~16.6°Brix,預測集的糖度范圍被包含在訓練集的糖度范圍內(nèi),數(shù)據(jù)選擇合理。
表2 矯正集和預測集中可溶性固形物 SSC含量的范圍和平均值
2.2.1 不同預處理方法的PLS模型
表3所示為基于近紅外光譜不同光照位置對蘋果可溶性固形物建模影響的不同預處理方法的PLS模型,從表3中可以得出,當光源照射位置為蘋果上部時,沒有對光譜進行預處理的原始光譜RMSEC為0.288 2,Rc為0.960 6, RMSEP為0.343 6,Rp為0.934 9,而照射位置為斜上部的RMSEC為0.340 7,Rc為0.931 1,RMSEP為0.513 3,Rp為0.863 6, 從照射位置為上部原始光譜的數(shù)據(jù)來看,RMSEC和RMSEP的差值為0.055 4,而照射位置為斜上部的原始光譜的RMSEC和RMSEP的差值為0.172 6,照射位置為上部原始光譜的Rp為0.934 9,照射位置為斜上部原始光譜的Rp為0.863 6,照射位置為上部的原始光譜的Rc為0.906 0,照射位置為斜上部的原始光譜的Rc為0.931 1,采用不同的光譜預處理方法所得的結(jié)果中,不同光譜預處理得到的所有的RMSEP,RMSEC,Rc和Rp均顯示,基于近紅外的蘋果漫透射可溶性固形物模型照射位置為上部時的模型比斜上部的模型效果、 精度更好。
2.2.2 不同預處理方法的PCR模型
表4為基于近紅外光譜不同光照位置對蘋果可溶性固形物建模影響的不同預處理方法的主成分分析回歸(principal component regression, PCR)模型,從表4中可以得出,當光源照射位置為蘋果上部時,沒有對光譜進行預處理的原始光譜RMSEC為0.576 3,Rc為0.842 4, RMSEP為0.601 4,Rp為0.800 7,而照射位置為斜上部的RMSEC為0.709 2,Rc為0.701 4,RMSEP為0.797 4,Rp為0.670 7, 從照射位置為上部原始光譜的數(shù)據(jù)來看,RMSEC和RMSEP的差值為0.025 1,而照射位置為斜上部的原始光譜的RMSEC和RMSEP的差值為0.088 2,照射位置為上部原始光譜的Rp為0.800 7,照射位置為斜上部原始光譜的Rp為0.670 7,照射位置為上部的原始光譜的Rc為0.842 4,照射位置為斜上部的原始光譜的Rc為0.701 4,采用不同的光譜預處理方法所得的結(jié)果中,不同光譜預處理得到的所有的RMSEP,RMSEC,Rc和Rp均顯示,基于近紅外的蘋果漫透射可溶性固形物模型照射位置為上部時的模型比斜上部的模型效果、 精度更好。
表3 不同預處理方法的蘋果上部、 斜上部漫透射PLS模型處理結(jié)果
表4 不同預處理方法的蘋果上部、 斜上部漫透射PCR模型處理結(jié)果
近紅外光譜的蘋果糖度光照位置優(yōu)化研究中,從兩個不同照射位置的光譜差異來看,照射位置為上部的平均光譜光強強于照射位置為斜上部的平均光譜光強,從近紅外漫反射的光路分析來看,照射位置為上部時,光譜包含了蘋果本身更多的可溶性固形物信息,雖然照射位置為蘋果斜上部時,包含的信息里大部分為蘋果外部淺層果肉和部分的中部果肉信息,很少包含了果核信息,但是無論從得到的光譜的光強角度來看,還是光路分析來看,照射位置為蘋果上部時,建立的蘋果可溶性固形物模型建模和預測的效果都明顯高于照射位置為蘋果斜上部時,所以可以得出結(jié)論,基于近紅外光譜的漫透射的蘋果可溶性固形物模型建立時最好的光照位置為蘋果的上部,此位置盡可能全面的包含了蘋果可溶性固形物建立所需要的信息。
2.3.1 預測模型建立
綜合以上結(jié)論可以得出在探究基于近紅外漫透射蘋果可溶性固形物模型建立最佳位置的實驗中,最佳的照射位置為蘋果的上部,在建立照射位置為上部的模型中,如表5所示,不論是原始光譜還是對光譜進行預處理之后,光譜的PLS模型建模效果比PCR效果好很多,在PLS模型中,SG-PLS模型的性能略低于沒有光譜預處理的光譜的模型性能,但SG一階導數(shù)-PLS,SNV-PLS和MSC-PLS的模型的性能比沒有光譜預處理的模型性能提高了很多,其中SNV-PLS和MSC-PLS的模型是所有模型性能中評價指標最好的兩個模型,SNV-PLS的RMSEC比原始未光譜預處理模型的RMSEC降低了0.023 3,RMSEP降低了0.039 9,Rc相比較未光譜預處理的Rc提高了0.006 1,Rp提高了0.014 3;而MSC-PLS的 RMSEC比原始未光譜預處理模型的RMSEC降低了0.023 8,RMSEP降低了0.042 1,Rc相比較未光譜預處理的Rc提高了0.006 3,Rp則提高了0.015,綜上所述,基于近紅外漫透射蘋果可溶性固形物模型建立的最佳照射為蘋果的上部,且照射位置為上部的最佳模型是MSC-PLS模型,最佳模型的RMSEC為0.264 4,RMSEP為0.301 5,Rc為0.966 9,Rp為0.949 9。圖4為MSC-PLS建模數(shù)據(jù)真實糖度值和預測糖度值的線性擬合示意圖,可以看到預測值較為平均且接近的擬合在擬合線附近,散點越靠近擬合線,說明模型的預測性能越好。
表5 上部照射位置不同模型評價指標Table 5 Different model evaluation indexes ofupper irradiation position
圖4 MSC-PLS的糖度真實值和預測值的線性擬合Fig.4 Linear fitting between real and predictedsugar contents of msc-pls
2.3.2 模型外部驗證
在建立了最佳光照位置為上部的MSC-PLS模型后,為了對模型進行一個穩(wěn)定性和可靠性檢驗,又從購買蘋果的水果批發(fā)市場購買了相同品種,尺寸接近的46個同批次的蘋果,在對新購買的蘋果進行同樣的樣品處理后,在同樣的環(huán)境、 溫度、 濕度下采集光照位置為上部的近紅外漫透射光譜,進行外部驗證[13]。結(jié)果如圖5所示,外部驗證的46個蘋果樣品的糖度預測和標準理化值得相關系數(shù)為0.9305 8,驗證均方根誤差為0.8435 9,所得分析數(shù)據(jù)進一步說明了照射位置為上部的基于近紅外漫透射的蘋果可溶性固形物建立的MSC-PLS模型是具有良好穩(wěn)定性,可靠性的蘋果可溶性固形物預測模型。
圖5 外部驗證糖度真值和預測值線性擬合示意圖
利用自行研發(fā)且已證實過可行性的近紅外光譜采集儀器,通過在相同的實驗環(huán)境和實驗條件的前提下,對從同一個水果批發(fā)市場采購的尺寸接近的同批次蘋果采用不同的光照位置進行近紅外漫透射光譜的采集,并對其糖度進行測量,分別對照射位置為上部和照射位置為斜上部的光譜進行建模,照射位置為上部且光譜沒有預處理時的PLS模型性能為RMSEC為0.288 2,RMSEP為0.343 6,Rc為0.960 6,Rp為0.934 9;照射位置為斜上部且光譜沒有預處理的PLS模型性能為RMSEC為0.340 7,RMSEP為0.513 3,Rc為0.931 1,Rp為0.863 6;照射位置為上部且光譜沒有預處理的主成分回歸模型性能為RMSEC為0.573 6,RMSEP為0.601 4,Rc為0.842 4,Rp為0.800 7;鹵素燈照射位置為蘋果的斜上部且光譜沒有預處理的PCR模型性能為RMSEC為0.709 2,RMSEP為0.797 4,Rc為0.701 4,Rp為0.670 7,所以無論是PLS模型還是PCR模型,都說明了建立可溶性固形物糖度模型時,最好的光照位置是上部,上部包含了更多的可溶性固形物信息,且PLS模型的模型性能好于PCR模型。進一步地,對光譜進行預處理后,得到了最優(yōu)的模型MSC-PLS模型,該模型的模型性能為RMSEC為0.226 44,RMSEP為0.301 5,Rc為0.966 9,Rp為0.949 9。進一步地,又在相同的實驗條件和實驗環(huán)境下,另采購46個蘋果進行同樣操作后進行外部驗證,得出MSC-PLS模型是穩(wěn)定可靠的。本文探究了基于近紅外漫透射的蘋果可溶性固形物模型建立的最佳光照位置為上部,且最優(yōu)的模型為MSC-PLS,為研究蘋果的可溶性固形物和蘋果的品質(zhì)檢測提供了新的技術(shù)支撐。