劉燕德 朱丹寧 吳明明 孫旭東 張智誠
(1. 華東交通大學,江西 南昌 330013;2. 光機電技術及應用研究所,江西 南昌 330013)
?
玉露香梨可溶性固形物近紅外漫透射光譜在線檢測
劉燕德1,2朱丹寧1,2吳明明1,2孫旭東1,2張智誠1,2
(1. 華東交通大學,江西 南昌 330013;2. 光機電技術及應用研究所,江西 南昌 330013)
應用近紅外漫透射光譜技術探索玉露香梨可溶性固形物在線無損檢測的可行性。358個試驗樣本被分成建模集和預測集(269∶89),分別用于建立模型和驗證模型的預測能力。通過對玉露香梨樣品近紅外漫透射光譜分析發(fā)現,樣品光譜在625,725,800 nm處存在3個波峰,在673,765,825 nm處存在3個波谷。通過對比不同預處理方法,發(fā)現漫透射近紅外光譜分別經一階微分、移動窗口平滑和多元散射校正組合預處理后建立的模型效果最好。結合組合預處理方法建立了偏最小二乘和偏最小二乘支持向量機預測模型,經比較,偏最小二乘支持向量機模型預測能力更強,模型預測均方根誤差和相關系數分別為0.316%和0.949。對比發(fā)現主成分分析和徑向基函數有利于提高最小二乘支持向量機模型的預測能力。試驗結果表明采用近紅外漫透射光譜技術結合最小二乘支持向量機算法,實現了玉露香梨可溶性固形物在線無損檢測。
近紅外光譜;漫透射;玉露香梨;可溶性固形物;最小二乘支持向量機
玉露香梨是庫爾勒香梨與雪花梨雜交的新品種,克服了傳統香梨果小核大、果形差、果肉少等缺點,具有口感好、無渣等優(yōu)點,深受廣大的消費者喜愛??扇苄怨绦挝锸菃翁恰㈦p糖、多糖等可溶性糖類的總稱,是衡量玉露香梨成熟度和口感品質的主要指標之一[1]。可溶性固形物通常采用破損后榨汁測量,該方法雖然準確,但需要破損物料且耗時費力,難以滿足大宗水果采后分選的需求[2-3]。隨著玉露香梨產量的不斷增加,迫切需要研究玉露香梨可溶性固形物快速、無損檢測方法,按照可溶性固形物含量分級,實現按質論價。
近紅外光譜中包含被測對象含氫基團分子振動信息,在被測對象近紅外光譜與目標組分真實值之間進行回歸分析,建立定量分析模型,可實現未知樣品目標組分的快速無損檢測[4-5]。近紅外光譜技術已被證明是農產品內部品質檢測的有效方法之一,近紅外光譜技術應用也從靜態(tài)實驗室檢測逐步邁向在線動態(tài)檢測[6]。王偉明等[7]采用平滑去噪處理后的近紅外漫反射光譜,建立了梨的糖度含量數學模型,模型預測標準偏差為0.019%。徐惠榮等[8]建立了梨可溶性固形物的多種數學模型,結果表明多元散射校正算法結合最小二乘支持向量機模型效果最優(yōu)。許文麗等[9]采用變量優(yōu)選、快速獨立成分分析和近紅外漫透射光譜技術,檢測黃花梨可溶性固形物,模型預測相關系數和均方根誤差分別為0.918和0.518%。由于在在線檢測中,梨和果杯緊密配合困難,造成生產線零部件反射的雜散光直接進入檢測器,影響檢測精度。試驗中采用彈性遮光圈和透光孔組合結構,克服了絕大部分雜散光,提高了在線檢測精度。本研究應用近紅外漫透射光譜技術探索玉露香梨可溶性固形物在線快速無損檢測的可行性,旨在為實現玉露香梨按照可溶性固形物含量分級,按質論價提供技術支撐和參考依據。
1.1 樣品準備
玉露香梨樣品由山西某果業(yè)公司提供,橫徑范圍為73~88 mm,縱徑范圍為70~89 mm。清理掉表皮灰塵后依次編號,在果頂每間隔90°作1個標記,每個樣品共標記4個點,在約25 ℃(±1 ℃)室溫靜置12 h后,每個點均采集一條近紅外光譜。
1.2 近紅外漫透射光譜在線檢測裝置
光譜采集和分選采用自行設計的在線檢測裝置完成。在線檢測裝置光譜儀選用QE65000型光譜儀(Ocean optics lNC.,USA),波長范圍350~1 150 nm。光源為12 V、100 W的鹵鎢燈10盞,沿樣品傳送線兩側沿環(huán)形分布,每側布置5盞,由直流穩(wěn)壓電源供電,且電壓和電流可調。樣品運動時,兩側各5盞光源均勻地照射至樣品上。果杯上裝有彈性避光圈,水果置于果杯上時依靠自重,實現水果與彈性避光圈的緊密配合。果杯底部為Φ5 mm的透光孔,彈性避光圈和透光孔的組合式結構,可以有效避免雜散光進入檢測探頭。檢測探頭安裝在透光孔正下方,距離果杯底部約2 mm。光譜儀與檢測探頭間使用1 000 μm×2 m光纖連接。
1. 光源 2. 樣品 3. 果杯避光圈 4. 果杯 5. 撥桿 6. 透光空 7. 探頭 8. 彈跳爪
圖1 近紅外漫透射在線檢測裝置
Figure 1 The device of NIR diffuse transmittance detection
1. 驅動齒輪 2. 編碼盤 3. 霍爾傳感器 4. 果杯 5. 鏈條
Figure 2 Schematic diagram of spectral data acquisitionin on-line detection equipment
采用硬件觸發(fā)方式采集光譜。如圖2所示,檢測裝置驅動主軸上安裝17齒的分度盤,分度盤將驅動齒輪的68齒分成17組,每組含4齒,每4齒對應安裝1個果盤,從而實現分度盤齒和水果果盤位置一一對應。距分度盤齒頂2 mm,安裝1個霍爾傳感器,每轉一齒,觸發(fā)傳感器,使后續(xù)電路發(fā)出3.5 V信號,觸發(fā)光譜儀采集并保存一條光譜。
1.3 近紅外漫透射光譜在線采集
在線檢測裝置預熱30 min后,以PTFE球為參比,校正參比后采集光譜。積分時間設為100 ms,速度5 s-1,光譜范圍350~1 150 nm,光照強度為1 000 W。每個玉露香梨標記的4個點均采集1條光譜,共用玉露香梨90個,剔除2條異常光譜,共358條,玉露香梨每個標記點均對應測量可溶性固形物含量真實值。數據處理中每條光譜均視為1個樣品,按照3∶1隨機劃分,建模集樣品269個,預測集樣品89個。試驗中將通過手動放果的方式將樣品果柄方向與玉露香梨?zhèn)魉头较蚱叫?,并將標記點對應方向的赤道部位對準探頭。光源照射在樣品表面,透過樣品進入檢測探頭。
1.4 可溶性固形物真實值測量
玉露香梨可溶性固形物含量真實值采用PR-101α糖度計(Atago,Co.,Tokyo,Japan)測量。所有光譜采集完成后,切下標記點果肉適量擠汁于糖度計測試窗口上,重復取樣測量3次取平均值作為樣品可溶性固形物含量的真實值。
1.5 算法原理
1.5.1 偏最小二乘法 偏最小二乘法(PLS)一般用于在光譜數據(X)和化學組分(Y)間進行回歸分析,建立定量分析數學模型。PLS是一種雙線性建模方法,Y的預測通過式(1)計算[10]:
Y=βX+b,
(1)
式中:
β——向量回歸系數(p×1);
b——模型偏移量,%;
X——光強(光子數);
Y——可溶性固形物含量,%。
1.5.2 最小二乘支持向量機 最小二乘支持向量機(LS-SVM)采用不敏感損失函數取代經典的平方損失函數。調節(jié)懲罰因子和核函數,建立光譜數據(X)和化學組分(Y)間的定量分析數學模型:
(2)
式中:
K(x,xi)——核函數;
xi——輸入向量;
αi——拉格朗日算子,也叫支持向量;
b——偏差;
N——樣品數量。
線性[式(3)]和徑向基函數[式(4)]是2個典型核函數。
K(xi,xj)=xixj,
(3)
K(xi,xj)=exp(-‖xi-xj‖2/2σ2),
(4)
式中:
σ2——內核參數,表示徑向基函數的方差。
分析光譜時,徑向基核函數通常用于光譜與化學組分間的非線性關系,而線性核函數適用于線性關系[11]。
1.5.3 預處理方法 光譜中除含有樣品自身的化學信息外,還包含一些無用信息,例如噪聲信息和雜散光等。因此,在建立模型時,通過預處理方法消除微無關信息是十分重要的[12]。微分可以消除基線漂移,放大細節(jié)和高頻噪聲信息,通常微分后要進行平滑處理,以消除高頻噪聲[13-15]。多元散射校正可以消除樣品大小不均而產生的散射效應。試驗中分別采用多元散射校正(MSC)、一階微分(1D)、二階微分(2D)、平滑及其組合方法處理光譜數據。不同預處理方法的參數設置:Savitzky Golay一階微分窗口寬度5點2階多項式、Savitzky Golay二階微分7點2階多項式、移動窗口平滑窗口3點。
2.1 玉露香梨近紅外漫透射光譜響應特性
圖3為可溶性固形物含量高、中和低3個代表樣品對應的光譜,光譜中存在3個波峰和3個波谷,波峰處于625,725,800 nm處,波谷處于673,765,825 nm處。從波形看,玉露香梨近紅外漫透射光譜集中分布在500~950 nm。由于光譜兩端存在一些噪聲信號,建模選取500~950 nm波段。玉露香梨表皮呈黃綠色,含有較高的葉綠素,在680 nm附近存在明顯波谷[16]。760 nm附近的波谷可能由O—H三倍頻伸縮振動導致,825 nm可能由N—H三倍頻伸縮振動導致[17]。試驗所用樣品的建模集和預測集的可溶性固形物真實值分布統計結果見表1。
2.2 光譜預處理方法比較
由圖3可知,在500~700,700~800,800~950 nm 3個波段范圍存在明顯的基線漂移。由表2可知,一階微分、平滑和多元散射校正的組合光譜預處理方法結果最優(yōu),建模相關系數為0.942,建模均方根誤差為0.344%,模型預測相關系數為0.926,預測集均方根誤差為0.382%。圖4為可溶性固形物含量高、中和低3個代表樣品對應一階微分、平滑和多元散射校正組合處理后的光譜,結合組合預處理后的數據光譜與原光譜相比消除了基線漂移、降低了噪聲信息同時消除了樣品大小不均而產生的散射效應。主成分因子數是決定PLS模型性能的關鍵因素之一,最佳主成分因子數由留一法交互驗證決定,交互驗證均方根誤差(RMSECV)最小值對應的主成分因子數即為PLS最佳主成分因子數。圖5為光譜經不同光譜預處理后PLS建模的主成分因子數變化曲線,基于RMSECV最小值對應的PC數為最佳主成分因子數的原則,選擇PLS模型的最佳主成分因子數。若建模時選擇PC數過少,就可能因為一些有效信息被忽略導致模型精度降低,出現“欠擬合”現象;若建模時選擇PC數過多,又會因為摻雜噪聲信號等產生“過擬合”現象。
圖3 玉露香梨近紅外漫透射原始光譜
樣品集數量最大值/%最小值/%平均值/%標準差/%變異系數/%建模集2698.5013.3011.003.250.295預測集898.8013.1010.953.040.278
表2 近紅外漫透射檢測方式結合不同的預處理方法下玉露香梨SSC的PLS建模結果
Table 2 PLS modeling results of pear SSC based on NIR diffuse transmission detection methods combining with different pretreatment methods
預處理方法主成分因子數建模集rcRSMEC預測集rpRMSEP無預處理110.9290.3790.9090.420MSC90.9330.3690.9120.4141Derivative90.9400.3610.9000.4132Derivative80.9500.3190.8460.5411D+Smothing+MSC80.9420.3440.9260.3822D+Smothing+MSC60.9290.3790.8940.451
圖4 玉露香梨近紅外漫透射經一階微分、移動窗口平滑和多元散射校正組合預處理后的光譜
Figure 4 Vis-NIR transmission spectra of 'YuLuxiang' pears processed By the combination of first derivative (1D), smoothing and multiplicative scattering correction (MSC)
圖5 玉露香梨的可溶性固形物中主成分因子決定圖
2.3 可溶性固形物在線檢測數學模型
2.3.1 偏最小二乘數學模型建模集和預測集光譜經一階微分、平滑和多元散射校正組合處理后,用于后續(xù)建立可溶性固形物數學模型和模型預測。圖6為建模均方根誤差(RMSEC)和預測均方根誤差(RMSEP)隨主成分因子數的變化曲線。建模時所選主成分因子數(PC)過低,可能忽略部分有效光譜信息,導致模型精度降低,出現“欠擬合”現象,例如PC為6或7,模型預測精度尚未達到最優(yōu);而當所選PC過高時,易出現“過擬合”現象,例如建模PC為9或10,RMSEC值更低,但RMSEP值較PC為8時略高。因此,本試驗PLS模型最佳主成分因子數為8。
圖7為PLS建模和模型預測的測量值和真實值散點圖。建模相關系數rc為0.942,建模均方根誤差RMSEC為0.344%,預測相關系數rp為0.926,預測均方根誤差RMSEP為0.382%。
2.3.2 最小二乘支持向量機數學模型 輸入向量、核函數及其參數是影響最小二乘支持向量機(LS-SVM)性能的關鍵因素。輸入向量數量維數影響LS-SVM模型的計算速度和復雜程度。試驗中采用2種不同策略,將535個近紅外光譜波長變量降維后作為LS-SVM的輸入向量。
圖6 玉露香梨的可溶性固形物中主成份因子決定圖
圖7 校正集和預測集玉露香梨可溶性固形物預測值與真值的關系
Figure 7 Correlation of predicted value and actual value of yulu pear sugar-acid ration in calibration set and validation
(1) 采用主成分分析(PCA)將近紅外光譜數據壓縮成若干個主成分得分向量,考察不同主成分得分向量對LS-SVM預測結果的影響。設PCA最大主成分因子數為20,由圖8可知,隨著輸入LS-SVM主成分得分向量數量增加,預測均方根誤差先減小后增大,當主成分得分向量數量為8時,預測均方根誤差達到最小為0.316%。
(2) 采用連續(xù)投影算法(SPA),根據每個波長變量正交投影信息量的多少,從535個近紅外光譜波長變量中,選取可溶性固形物敏感波長變量作為LS-SVM輸入向量。設置SPA選取最大和最小變量數分別為30和10,選取結果見圖9。共21個變量被選為LS-SVM的輸入向量,預測均方根誤差為0.371。全譜535個波長變量作為PCA和SPA的對比組,也被用作LS-SVM的輸入向量,依據預測均方根誤差最小原則,PCA的運行結果最優(yōu),主要8個主成分得分向量累計貢獻率為99%,幾乎完全包含了全光譜信息,而SPA可能在選擇過程中損失了極少部分可溶性固形物相關的光譜信息。
圖8 玉露香梨的可溶性固形物PCA-LS-SVM建模方法中輸入變量PC決定圖
Figure 8 The determination figure of the input variable PC number in ssc of yuluxiang pear with method of PCA-LS-SVM
徑向基核函數(RBF_kernel)和線性核函數(Lin_kernel)是LS-SVM的兩種典型核函數。由表3可知,依據模型相關系數越大、預測均方根誤差越小,模型預測能力越強的原則,徑向基核函數運行結果優(yōu)于線性核函數。原因可能是徑向基核函數泛化能力強,可以逼近任意非線性函數,收斂速度快,可成功地處理可溶性固形物含量與光譜數據間的非線性關系。采用二步法優(yōu)化LS-SVM核函數參數,首先以較大步長搜索最佳核函數參數范圍,然后以較小步長在初步定位的范圍內,進一步確定最優(yōu)參數,結果見表3。
圖9 玉露香梨的可溶性固形物SPA-LS-SVM建模方法中輸入變量選擇的決定圖
Figure 9 The determination figure of the input variable in ssc of yuluxiang pear with method of SPA-LS-SVM
對比PLS和LS-SVM模型,可以發(fā)現:一階微分、移動窗口平滑和多元散射校正組合預處理后建立的PCA-LS-SVM數學模型預測結果最優(yōu),預測均方根誤差為0.316%。
表3 近紅外漫透射檢測方式結合不同核函數的玉露香梨SSC的LS-SVM建模結果
結果表明應用可見近紅外漫透射光譜技術結合主成分分析、最小二乘支持向量機,實現了玉露香梨可溶性固形物在線無損檢測。一階微分、移動窗口平滑和多元散射校正組合預處理方法有效地消除了基線漂移和光散射效應。最小二乘支持向量機數學模型預測能力優(yōu)于偏最小二乘數學模型,模型預測均方根誤差和相關系數分別為0.316%和0.949。與連續(xù)投影算法相比,主成分分析更適于選取最小二乘支持機的輸入向量。徑向基核函數比線性核函數更適用于本試驗數據。本研究可為其它農產品品質近紅外漫透射光譜在線檢測提供參考依據。
[1] WANG Ai-chen, XIE Li-juan. Technology using near infrared spectroscopic and multivariate analysis to determine the soluble solids content of citrus fruit [J]. Journal of Food Engineering, 2014, 143: 17-24.
[2] 王蒙, 馮曉元. 梨果實近紅外光譜無損檢測技術研究進展[J]. 食品質量安全檢測學報, 2014, 5(3): 681-690.
[3] LEMBE S Magwaza, UMEZURUIKE Linus Opara, HéLNE Nieuwoudt, et al. NIR spectroscopy applications for internal and external quality analysis of citrus fruit: a review[J]. Food Bioprocess Technol, 2012, 5(2): 425-444.
[4] 朱麗偉, 馬文廣, 胡晉. 近紅外光譜技術檢測種子質量的應用研究進展[J]. 光譜學光譜分析, 2015, 35(2): 346-349.
[5] 孫通, 江水泉. 基于可見近紅外光譜和變量優(yōu)選的南水梨糖度在線檢測[J]. 食品與機械, 2016, 32(3): 69-72.
[6] VIEGAS T R, MATA A L M L, DUARTEM M L, et al. Determination of quality attributes in wax jambu fruit using NIRS and PLS[J]. Food Chemistry, 2016, 190: 1-4.[7] 王偉明, 董大明, 鄭文剛, 等. 梨果糖濃度近紅外漫反射光譜檢測的預處理方法研究[J]. 光譜學光譜分析, 2013, 33(2): 359-362
[8] 徐惠榮, 陳曉偉, 應義斌. 基于多元校正法的香梨糖度可見/近紅外光譜檢測[J]. 農業(yè)機械學報, 2010, 41(12): 1 000-1 298.
[9] 許文麗, 孫通, 胡田, 等. 基于變量優(yōu)選和快速獨立成分分析的黃花梨可溶性固形物可見/近紅外光譜檢測[J]. 光譜學光譜分析, 2014, 34(12): 3 253-3 256.
[10] 許祿, 邵學廣. 化學計量學方法[M]. 2版. 北京: 科學出版社, 2004: 10-38.
[11] 劉雪梅, 章海亮. 基于DPLS 和LS-SVM 的梨品種近紅外光譜識別[J]. 農業(yè)機械學報, 2012, 43(9): 1 000-1 298.
[12] 褚小立. 化學計量學方法與分子光譜分析技術[M]. 北京: 化學工業(yè)出版社, 2011: 41-53.
[13] 尼珍, 胡昌勤, 馮芳. 近紅外光譜分析中光譜預處理方法的作用及其發(fā)展[J]. 藥物分析雜志, 2008, 28(5): 824-829
[14] 張欣, 單楊, 李水芳. 基于多元散射校正和偏最小二乘 (MSC/PLS) 的傅里葉變換近紅外光譜檢測蜂蜜中還原糖[J]. 食品與機械, 2009, 25(6): 109-112.
[15] 陸輝山, 陳鵬強, 閆宏偉, 等. 基于近紅外光譜漫透射技術的蘋果可溶性固形物含量在線檢測[J]. 食品與機械, 2015, 31(3): 40-42.
[16] 王加華, 韓東海. 便攜式近紅外水果糖度分析模型簡化研究[J]. 食品安全質量檢測技術, 2009, 1(1): 32-38.
[17] 嚴衍祿. 近紅外光譜分析基礎與應用[M]. 北京: 中國輕工業(yè)出版社, 2005: 8-39.
Online detection of soluble solids contents for “Yuluxiang” pear by visible-near infrared diffuse transmission spectroscopy
LIUYan-de1,2ZHUDan-ning1,2WUMing-ming1,2SUNXu-dong1,2ZHANGZhi-cheng1,2
(1.EastChinaJiaotongUniversity,Nanchang,Jiangxi330013,China;2.InstituteofOpticalandElectricalMachineryTechnologyandApplication,Nanchang,Jiangxi330013,China)
The feasibility was investigated for online detection of soluble solids content (SSC) of “Yuluxiang” pear by visible-near infrared (visible-NIR) diffuse transmittance spectroscopy. 358 samples were divided into the calibration and prediction sets (269∶89) for developing calibration models and assessing their performance. By analyzing, the Vis-NIR transmission spectra of 'YuLuxiang' pears have three peaks at 625 nm, 725 nm and 800 nm and three troughs at 625 nm, 725 nm and 800 nm, respectively. Different preprocessing approaches were tested, it was found that the best approaches were the combination of first derivative (1D), smoothing and multiplicative scattering correction (MSC) preprocessing methods. The partial least square (PLS) regression and least square support vector machine (LS-SVM) models were developed with the pretreatment methods by the combination of first derivative (1D), smoothing and multiplicative scattering correction (MSC). The new samples of the prediction set were applied to evaluate the performance of the models. Compared with PLS model, the performance of LS-SVM model was better with the root mean square error of prediction (RMSEP) of 0.316% and the correlation coefficient of prediction of 0.949. And the spectral dimension reduction method of principal component analysis (PCA) and the kernel function of radial basis function (RBF) were suitable to improve the predictive ability of the LS-SVM model. The results suggested that it was feasible for online detection of SSC of ‘Yuluxiang’ pear by visible-NIR diffuse transmission spectroscopy combined with LS-SVM algorithm. The online detection of soluble solids content (SSC) of “Yuluxiang” pear by visible-near infrared (visible-NIR) diffuse transmittance spectroscopy was demonstrated.
near infrared spectroscopy; diffuse transmittance; “Yuluxiang” pear; soluble solids content; least squares support vector machine
“十二五”國家863計劃課題(編號:SS2012AA101306);江西省優(yōu)勢科技創(chuàng)新團隊建設計劃項目(編號:20153BCB24002);南方山地果園智能化管理技術與裝備協同創(chuàng)新中心(編號:贛教高字[2014]60號)
劉燕德(1967—),女,華東交通大學教授,博士,博士生導師。E-mail: jxliuyd@163.com
2016—06—04
10.13652/j.issn.1003-5788.2016.10.027