王俊平
徐 剛2
(1. 湖北職業(yè)技術學院,湖北 孝感 432000;2. 湖北工程學院,湖北 孝感 432000)
在采摘、儲運等物流環(huán)節(jié)中,果蔬腐損率達20%~30%,年損失可達1 000億元,主要是不同成熟度的果蔬混裝在一起造成的[1]。近年來,國內外有大量研究人員對食品檢測技術進行研究,也有一些較為突出的成果,如機器視覺、電子感官、高光光譜成像等檢測技術。張政等[2]提出了一種基于機器視覺的香蕉果肉缺陷預測方法。結果表明,與傳統(tǒng)方法相比,該方法的預測精度較高,總體精度為88.9%。周靖宇等[3]提出了一種基于近紅外技術和偏最小二乘法的無花果成熟度檢測方法。結果表明,該方法在訓練集和測試集的分類準確率分別達到99.59%和99.15%。張義志等[4]對高光譜技術在農產品成熟度檢測中的應用進行研究,指出了應用中存在的問題,并提出了改進措施。楊晨昱等[5]將近紅外光譜技術和電子鼻技術分別應用于蘋果霉心病的無損檢測。結果表明,電子鼻和近紅外光譜能較好地鑒別蘋果霉心病,準確率達到87.7%和86.2%。然而,機器視覺只提供相對單一的視覺信息,電子感官獲取信息有一定的局限性,高光譜檢測技術中的數(shù)據(jù)量巨大且難以處理。多源信息融合問題尚未形成一個具有基本理論框架的有效融合模型。
番茄屬于世界三大貿易性蔬菜之一,具有易腐性。試驗擬提出一種基于多源信息融合的番茄成熟度檢測方法。以機器視覺篩選出的6個顏色特征和電子鼻篩選出的10個氣味特征為基礎,建立番茄成熟度檢測的最小二乘支持向量機模型,以期為果蔬成熟度檢測方法的發(fā)展提供參考。
通過機器視覺實現(xiàn)對番茄成熟度的檢測。首先,樣本圖像由相機拍攝,然后發(fā)送到處理單元(如計算機)。通過數(shù)字處理,可以掌握目標區(qū)域的顏色、紋理、大小和形狀等特征。然后通過一系列判斷條件得到識別結果,實現(xiàn)機器視覺系統(tǒng)的識別功能。所使用的機器視覺硬件系統(tǒng)分為兩大部分:圖像采集系統(tǒng)和計算機[6]。圖1為機器視覺采集系統(tǒng)的結構。
1. 相機 2. 燈箱 3. 樣品臺 4. 光源 5. 樣本 6. 計算機圖1 機器視覺系統(tǒng)結構Figure 1 Mechanical vision system structure
1. 集氣室 2. 氣路管道 3. 泵 4. 氣味反應室 5. 傳感器6. 計算機 7. 氧氣罐 8. 氧氣圖2 電子鼻系統(tǒng)結構Figure 2 Electronic nose system structure
電子鼻是一種新型的智能裝置,可以模擬動物的嗅覺,識別揮發(fā)性氣味[7]。電子鼻結構如圖2所示,由4個主要部分組成:氣體采樣、傳感器陣列、信號處理、氣路清洗[8]。氣體采樣系統(tǒng)將氣味吸附到氣體傳感器上,氣體傳感器陣列吸收氣味并產生信號,這類似于人類細胞感知氣味的過程,呼氣和吸入的過程也類似。信號處理系統(tǒng)可以對獲取的氣味信息進行分析與判斷,數(shù)據(jù)處理后輸出識別結果。氣路清洗是通過氧氣對氣管和氣室進行清洗。
多源信息融合是將機器視覺和電子鼻采集信息進行融合,以機器視覺篩選出顏色特征變量和電子鼻篩選出氣味特征變量進行特征融合。通過番茄各彩色單通道圖像的灰色均值箱線圖選取的6個有效顏色特征。通過番茄中的揮發(fā)性氣體選擇了10個電子鼻傳感器。建立番茄成熟度檢測的最小二乘支持向量機模型。融合過程如圖3所示。
圖3 多源信息融合過程Figure 3 Multi source information fusion process
文中采用機器視覺常用的RGB、HSV和CIEL*a*b*模型,從這9個顏色特征中進行選擇[9]。根據(jù)SB/T 10331—2000,對成熟度判定方法進行制定,將番茄劃分為6個不同成熟度(綠熟期、轉色期、半熟期、成熟期、完熟期、腐敗期),如圖4所示。
圖4 番茄不同成熟度Figure 4 Different maturity of tomato
從6個成熟度等級的番茄各彩色單通道圖像的灰色均值箱線圖可以看出。R、V和b*均呈凸形排列,在成熟時到達凸頂,但重疊區(qū)域較多,很難區(qū)分。G、B、H和L*均呈下降排列。G可以區(qū)分一個等級:成熟期。B準確區(qū)分了半成熟期之前和成熟期之后的番茄。H可以區(qū)分4個等級:綠熟期、轉色期、半熟期與成熟期,但很難區(qū)分腐爛期和完熟期。L*可以區(qū)分一個等級:成熟期。在S和a*箱線圖中,箱子基本上呈上升趨勢。S可以區(qū)分前3個等級。a*可以區(qū)分前4個等級[10]。
綜上所述,在RGB、HSV和CIEL*a*b*3種顏色模型中共選取6種有效顏色特征(G、B、H、S、L*和a*)。
將番茄樣品放入500 mL燒杯中進行密封,控制與儲存相同的溫濕度富集其揮發(fā)性氣體20 min,通過電子鼻檢測頂空氣體[11]。共采集450 s,間隔1 s。對108個番茄樣本進行采樣。構建氣體傳感器陣列(10個氧化物半導體傳感器)提取電子鼻傳感器信息,選取441~450 s采集數(shù)據(jù)平均值作為氣味特征值,共10個。
支持向量機(Support Vector Machines,SVM)是近年發(fā)展起來的一種新的學習方法[12]。相比于神經網絡,理論上,它提供了最佳的整體效益,解決神經網絡中局部極小問題[13]。通過對支持向量機建模技術的深入研究和廣泛應用,出現(xiàn)了很多改進方法。
最小二乘支持向量機(LS-SVM)就是SVM的改進方法。提高了求解速度和收斂精度。采用LS-SVM建立番茄成熟度模型,如式(1)所示[14]。
(1)
式中:
y——輸出向量;
N——樣本個數(shù);
αk——拉格朗日因子;
b——偏置項;
K(x,xk)——徑向基核函數(shù),如式(2)所示[15]。
(2)
式中:
x——m維數(shù)輸入向量;
xk——第k個徑向基函數(shù)的中心;
σ——核參數(shù);
‖x-xk‖——向量x-xk的范數(shù)。
LS-SVM建模需要考慮的主要參數(shù)有:輸入層數(shù)、輸出層數(shù)、正則化參數(shù)、核函數(shù)等[16]。在LS-SVM的建模過程中,需要確定兩個參數(shù):懲罰參數(shù)C和核參數(shù)σ。C值越小,偏差懲罰越小,支持向量機的回歸曲線越平滑,越有可能訓練不足。C值越高,偏差懲罰越高,可能導致過度學習。如果σ較小,可能會發(fā)生局部優(yōu)化,導致LS-SVM的過度訓練。相反,如果σ較大,可能會出現(xiàn)訓練不足的情況。
在LS-SVM回歸參數(shù)優(yōu)化分析中,以C和σ組合獲得的均方誤差(MSE)最小為目標,在最優(yōu)參數(shù)下建模。通過訓練集的交叉驗證均方根誤差(RMSECV)、相關系數(shù)(Rc)和測試集的均方根誤差(RMSEP)、相關系數(shù)(Rp)對模型的性能進行全面評估。相關系數(shù)越高,模型對數(shù)據(jù)的擬合能力越強。均方誤差越小,模型越精確。
訓練集相關系數(shù)(Rc)與測試集相關系數(shù)(Rp)越接近1,模型的預測精度越高。相關系數(shù)R計算如式(3)所示[17]。
(3)
式中:
R——相關系數(shù);
訓練集均方根誤差(RMSECV)如式(4)所示[18]。
(4)
式中:
n——測試集樣本。
測試集均方根誤差(RMSEP)如式(5)所示[19]。
(5)
式中:
m——預測集樣本。
試驗設備為聯(lián)想PC,操作系統(tǒng)為windows 10 64位旗艦,Intel i5 2450m CPU、2.5 GHz頻率、8 GB內存[20]。相機采用德國Manta G-125C,鏡頭采用Computar M0814-MP2。電子鼻傳感器為TGS813、TGS816、TGS822、TGS825、TGS832、TGS880、TGS2600-B00、TGS2610-BOO、TGS2611-C00、TGS2620-A00。設置的番茄貯藏溫度為20 ℃,濕度為85%RH,電子鼻檢測與貯藏溫濕度相同。釆用英國Stable Micro Systems公司的TA.XT.Plus型質構分析儀對番茄表面硬度進行測量,采用日本島津公司的LC-20AB型高效液相色譜儀對番茄果實中的番茄紅素含量進行測量。試驗中,融合函數(shù)的主成分作為自變量,番茄成熟度、硬度和紅色素作為因變量。總共108組數(shù)據(jù),按照2∶1的比例隨機分為訓練集和測試集。建立了番茄成熟度檢測模型。主成分數(shù)為5分,懲罰參數(shù)C=64和核參數(shù)σ=0.044 2。建立番茄硬度預測模型,主成分數(shù)為7,懲罰參數(shù)C=0.707 1和核參數(shù)σ=0.176 8。建立了番茄紅素的預測模型。主成分數(shù)為7,懲罰參數(shù)C=8和核參數(shù)σ=0.062 5。在參數(shù)優(yōu)化之前,將自變量標準化為[-1,1],因變量標準化為[0,1]。
3.2.1 成熟度識別 為了驗證文中多源融合方法的優(yōu)越性,分別建立番茄成熟度模型進行對比分析(機器視覺LS-SVM模型、電子鼻LS-SVM模型、多源融合LS-SVM模型)。表1為采用不同方法建立的番茄成熟度識別模型的識別結果。
表1 不同方法番茄成熟度判別模型結果Table 1 Different methods of tomato maturity discriminant model results
由表1可知,多源信息融合的LS-SVM模型測試集識別準確率最高,為98.03%。機器視覺LS-SVM模型測試集識別準確率為88.09%,電子鼻LS-SVM模型測試集識別準確率為84.02%。這是因為不同成熟度的番茄顏色差異是肉眼可見的,機器視覺提取的顏色特征可以反映番茄存在的差異,而電子鼻檢測氣體受番茄物質含量的影響,可變因素較多。因此,相比于電子鼻LS-SVM模型,機器視覺LS-SVM模型的識別準確率更高。在融合技術中,顏色和氣味特征的融合彌補了單一技術存在的不足,識別精度高于單一技術。
3.2.2 硬度預測 表2為不同方法建立的番茄硬度預測模型的預測結果。
表2 不同方法番茄硬度預測模型結果Table 2 Results of tomato hardness prediction models by different methods
從表2可以看出,多源信息融合的LS-SVM模型在訓練集中的預測性能略低于機器視覺LS-SVM模型,但測試集的預測效果較優(yōu)。相比于電子鼻LS-SVM模型,多源信息融合的LS-SVM模型在硬度預測中有了顯著提高,其中Rp由0.783 9提高到0.914 3。這是因為通過機器視覺提取的顏色特征能夠更好地反映果實成熟期,隨著番茄越來越熟,其硬度往往會顯著降低。融合技術結合顏色和氣味特征獲取的數(shù)據(jù)信息更多,但也引入了一些冗余信息,因此在訓練集中,相比于機器視覺LS-SVM模型,多源信息融合的LS-SVM模型預測性降低,Rc由0.934 1降低到0.922 0。硬度變化是由果膠降解引起,而電子鼻缺乏這一類的檢測手段,因此性能低于機器視覺LS-SVM模型。
3.2.3 番茄紅素預測 表3為不同方法建立的番茄紅素預測模型的預測結果。
表3 不同方法番茄紅素預測模型結果Table 3 Results of different methods of lycopene prediction model
從表3可以看出,多源信息融合的LS-SVM模型對番茄紅素的預測能力優(yōu)于機器視覺LS-SVM模型和電子鼻LS-SVM模型,Rc略高,RMSECV降低明顯。Rp增加明顯,RMSEP介于兩者中間。這是因為機器視覺提取的顏色特征能夠更好地反映番茄成熟度。番茄紅素是成熟番茄的主要顏色物質,隨著番茄越來越成熟,含量不斷增加。所以機器視覺LS-SVM模型對番茄紅素的預測更加精準。然而,番茄紅素不溶于水、不易揮發(fā),而電子鼻缺乏這一類的檢測手段。相比于電子鼻LS-SVM模型,機器視覺LS-SVM模型對番茄紅素的預測效果更優(yōu)。融合技術結合顏色和氣味特征獲取的信息更加全面。因此,多源信息融合的LS-SVM模型預測能力最優(yōu),在番茄成熟度檢測中是可行和有效的。
研究提出了一種基于多源信息融合的番茄成熟度檢測方法,以機器視覺篩選出6個顏色特征和電子鼻篩選出10個氣味特征為基礎,建立了番茄成熟度檢測的最小二乘支持向量機模型。結果表明,與單一方法相比,多源融合方法在成熟度識別、番茄硬度和番茄紅素預測方面有一定的改進。成熟度識別在訓練集中達到100%,在測試集中達到98.3%。硬度預測中訓練集相關系數(shù)為0.922 0,訓練集均方根誤差為0.008 1,測試集相關系數(shù)為0.914 3,測試集均方根誤差為0.008 1。紅素預測中的訓練集相關系數(shù)為0.932 8,訓練集均方根誤差為0.005 4,測試集相關系數(shù)為0.902 0,測試集均方根誤差為0.027 2。試驗對番茄成熟度檢測方法的研究尚處于起步階段,僅對番茄成熟度進行了檢測。后續(xù)將進一步擴大檢測對象以增強其適用性。