何嘉琳,喬春燕,李冬冬,張海紅*,鄧 鴻,單啟梅,高 坤,馬 瑞
(寧夏大學農(nóng)學院,寧夏 銀川 750021)
靈武長棗(Zizphus jujuba Mill cv. Lingwu Changzao)為鼠李科棗屬植物,是寧夏特色優(yōu)勢果品,其果實色艷、肉質(zhì)脆實、酸甜適口,富含糖、酸、VC、粗纖維及礦物元素等多種營養(yǎng)元素,其中尤以VC含量最為豐富,素有“VC之王”的美譽[1]。因此,常將VC含量作為評價靈武長棗品質(zhì)的首選指標。
果品VC含量常用的檢測方法為2,6-二氯靛酚滴定法[2],該法雖然檢測精度高,但在樣品前處理、檢測速度、檢測成本等方面存在其固有缺陷,而檢測后的樣品因其組織遭到嚴重破壞,已無食用和銷售價值。因此,尋找一種快速、便捷、高效的VC含量檢測方法對指導長棗生產(chǎn)加工、商品化推廣具有重要意義。
高光譜無損檢測技術(shù)是近年來國內(nèi)外最新發(fā)展的一種新型的品質(zhì)檢測技術(shù),該法具有操作方便、原理簡單、適應性強和非破壞等優(yōu)點,受到國內(nèi)外學者的廣泛關(guān)注[3]。目前,在農(nóng)產(chǎn)品無損檢測研究方面,研究人員利用高光譜成像技術(shù)不僅實現(xiàn)了表面缺陷[4-8]、損傷識別[9-11]、品質(zhì)安全[12-13]等檢測,亦實現(xiàn)了糖含量、可溶性固形物、硬度、含水量[14-16]等品質(zhì)指標的檢測。近年來,眾多學者利用高光譜、近紅外技術(shù)檢測櫻桃、蜜橘、柑橘[17-19]等果品的VC含量并取得了較好的研究成果,但有關(guān)基于高光譜成像技術(shù)預測靈武長棗VC含量的研究卻鮮有報道。
本實驗擬以靈武長棗為研究對象,利用高光譜成像技術(shù)采集400~1 000 nm可見光區(qū)域長棗光譜數(shù)據(jù),通過SG平滑(Savitzky-Golay smoothing,SGS)、基線校準、標準正態(tài)變量變換(standard normal variate,SNV)、多元散射校正(multiplicative scateer correction,MSC)、面積歸一化法、最大歸一化法、單位歸一化法、距離歸一化法、平均歸一化法等方法對原始光譜進行預處理,優(yōu)選最佳光譜預處理方法。后采用遺傳算法(genetic algorithm,GA)、連續(xù)投影算法(successie projection algorithm,SPA)及競爭性正自適應加權(quán)(competitive adaptive reweighted sampling,CARS)算法對預處理光譜提取有效信息并建立長棗VC含量偏最小二乘(partial least squares,PLS)和最小二乘支持向量機(least squares support vector machine,LSSVM)預測模型,通過比較模型效果,確定基于高光譜檢測靈武長棗VC含量的最佳方法,優(yōu)選基于高光譜成像技術(shù)預測靈武長棗VC含量的預測模型。
供試靈武長棗采摘于寧夏回族自治區(qū)靈武市永寧長棗生產(chǎn)基地;挑選果形完好,平均單果質(zhì)量約(15±2)g,縱徑(4.2±0.5)cm,橫徑(2.5±0.5)cm,大小均勻、無蟲害損傷的棗果100 個,常溫(20±3)℃條件下擦凈、貯藏、備用。
抗壞血酸(分析純) 天津博迪化工股份有限公司;2,6-二氯靛酚(分析純) 生工生物工程(上海)股份有限公司;草酸(分析純) 天津市光復精細化工研究所;碘酸鉀(分析純) 江蘇強盛功能化學股份有限公司;碘化鉀(分析純) 西隴化工股份有限公司。
V10E-QE型高光譜成像光譜儀 芬蘭Spectral Imaging公司;C8484-05G型CCD相機 日本Hamamatsu公司;DCR III型光纖鹵素燈(150 W) 美國Schott公司;SC300-1A型電控位移平臺 北京Zolix公司。
1.3.1 光譜信息的采集
高光譜圖像采集系統(tǒng)條件:CCD相機曝光時間為30 ms,電控位移平臺速率為0.42 mm/s[20]。同時,為消除各波段條件下光源強度分布不均及攝像頭中暗電流對成像造成的不良影響,光譜信息采集前對其進行黑白校正[21],以消除噪聲影響。校正后的漫反射光譜圖像R按下式計算:
式中:R0為樣本原始的漫反射光譜圖像;D為暗圖像;W為白板的漫反射圖像。
樣本高光譜圖像采集后,利用ENVI 4.6軟件校正光譜并選取感興趣區(qū)域(region of interest,ROI)??紤]到長棗個體形狀差異,分別從每張棗光譜圖像中的長棗赤道部位提取(30×30)像素的ROI,計算得出每張ROI的平均反射光譜,并將其作為該長棗的最終反射光譜。
1.3.2 長棗VC含量的測定
采用2,6-二氯靛酚法[22]測定。樣本總量為100 個,測定周期為10 d,每天從總樣中隨機選取10 個樣本進行測定;為避免偶然性誤差,各樣本均測3 次取平均值作為最終測定結(jié)果。
1.3.3 光譜有效信息提取
本實驗采用GA、SPA及CARS算法對最優(yōu)預處理后的光譜提取特征波長,分析不同提取特征波長方法對長棗VC含量預測模型的影響。
GA[23]使用選擇、交叉和變異三類遺傳算子把復雜的現(xiàn)象用繁殖機制結(jié)合簡單的編碼技術(shù)來表現(xiàn),通過隨機搜索算法得出復雜問題相對較好的解;從初始群體到根據(jù)變異、選擇和交叉等算子的作用而不斷迭代來進行優(yōu)勝劣汰,通過這樣的搜索過程來不斷逼近最優(yōu)解。
SPA[24]是一種前向循環(huán)的變量選擇方法,選定一個初始頻點,然后在每一次迭代時加入新的頻點,直到達到指定的頻點數(shù),該法目的是解決信息重疊,選擇最小冗余信息量的頻點組合,解決共線性問題。
CARS算法是一種基于蒙特卡羅采樣法對模型取樣的新型變量選擇理論[25],通過指數(shù)衰減函數(shù)及自適應重加權(quán)采樣技術(shù)計算并比較每次產(chǎn)生的新變量子集的交互驗證均方根誤差(root mean square error of cross validation,RMSECV),RMSECV最小的變量子集作為最優(yōu)變量子集。
1.3.4 模型建立
PLS是一種經(jīng)典的線性擬合方法,該法可以通過最小化偏差平方和實現(xiàn)對曲線的擬合[26]。
LSSVM是由Suyken等[27]提出的用于解決模式分類和函數(shù)估計問題的支持向量機,它采用最小二乘線性系統(tǒng)作為損失函數(shù),有效地簡化了計算的復雜性,提高了運算速度。
1.3.5 模型評價
模型性能以校正相關(guān)系數(shù)(Rc)和校正均方根誤差(root mean square eroor of calibration,RMSEC)及預測相關(guān)系數(shù)(Rp)和預測均方根誤差(root mean square eroor of prediction,RMSEP)為評價指標;評價原則一般認為Rc和Rp越接近1,RMSEC、RMSEP越接近0,模型效果越好。
在光譜采集中,由于儀器噪音、暗電流等影響因素,易導致光譜曲線產(chǎn)生不重復和基線漂移等現(xiàn)象[28-29],故有必要在模型建立前對原始光譜進行預處理。本實驗分別采用SGS、基線校準、SNV、MSC、面積歸一化法、最大歸一化法、單位歸一化法、距離歸一化法、平均歸一化法等方法對原始光譜進行預處理,結(jié)果見表1。
由表1可知,比較原始光譜及預處理后所得PLS校正模型,僅SGS、基線校準、SNV、滑動平均法、去趨勢算法對光譜處理后所得模型的Rcv均大于0.8且大于原始光譜模型Rcv(0.708 2),表明經(jīng)光譜預處理后所建PLS模型效果有所提升;比較上述6 種較佳預處理方法可知,SNV法不僅Rcv最大,為0.839 5且RMSECV最小,僅為16.248 2。表明SNV法處理原始光譜后,可有效降低光譜曲線不重復和基線漂移等誤差因素的影響,顯著提升建模效果,故本實驗選定SNV法為最佳光譜預處理方法。SNV法預處理得到的優(yōu)化圖譜及原始光譜見圖1。
表1 不同預處理方法的長棗VC含量PLS校正模型Table 1 PLS calibration models for predicting VC content in jujubes with different pretreatment methods
圖1 原始反射光譜(A)和SNV處理后反射光譜(B)Fig. 1 Original reflection spectra (A) and SNV-processed spectra (B)
為了提高模型的預測精度,本實驗采用Kennard-Stone(K-S)[30]法從測試完畢的100 個棗果樣本中隨機選取20 個用于檢驗模型的適用性,以3∶1的比例對剩余80 個樣本進行樣本集和驗證集劃分,最終選擇校正集樣本60 個,驗證集樣本20 個。樣本統(tǒng)計結(jié)果見表2。
表2 校正集與預測集樣本VC的統(tǒng)計結(jié)果Table 2 Statistical results of VC contents in calibration set and predication set
由表2可見,校正集和預測集的樣本范圍分別為344.42~435.11 mg/100 g和360.58~421.89 mg/100 g,校正集較好的涵蓋了預測集,表明樣本劃分合理。
2.3.1 GA提取有效信息
圖2 長棗光譜的GA篩選圖Fig. 2 GA screening for feature wavelengths
如圖2所示,不同波點被篩選的頻次越高表示該點適應性越強[31],與長棗VC相關(guān)性越高。GA運算過程中,設(shè)定遺傳代數(shù)為100,以最小的RMSECV和最高的R2組合作為篩選標準;經(jīng)過20 次隨機搜索后,最終選定特征波點12 個,占原始光譜信息的9.6%。
2.3.2 SPA提取有效信息
圖3 長棗介電譜的SPA篩選圖(A)和光譜被選中波點(B)Fig. 3 SPA screening of dielectric spectra (A) and selected wavelength points (B)
應用SPA對頻譜數(shù)據(jù)進行有效信息提取,結(jié)果如圖3所示。SPA運算過程中,設(shè)定變量數(shù)選擇范圍為1~10,步長為1,根據(jù)RMSEC隨變量個數(shù)的變化確定最佳特征變量數(shù);如圖3A所示,當變量個數(shù)為5時,RMSEC最小為24.25;變量個數(shù)大于5時,其RMSEC不再減小,最終選定特征波點5 個,占原始光譜信息的4%。
2.3.3 CARS算法提取有效信息
圖4 長棗光譜的CARS算法篩選圖Fig. 4 CARS screening of spectra
如圖4所示,本研究設(shè)定蒙特卡羅采樣50 次,采用5折交叉驗證法計算,因每次運行CARS結(jié)果具有隨機性,故在每個設(shè)定的蒙特卡洛抽樣次數(shù)條件下運行20 次,取20 次所建立的PLS模型中最小RMSECV作為結(jié)果篩選標準。由圖4可知,在1 次CARS算法中,由于衰減指數(shù)函數(shù)的作用,隨著采樣次數(shù)的增加,在采樣前期變量數(shù)快速減少,隨著采樣次數(shù)的增加,變量減少的速度減慢,表明算法“粗選”和“精選”的過程。并且,隨著采樣次數(shù)的增加,單個PLS模型的5折交叉驗證RMSECV呈現(xiàn)由大到小再到大的變化,采樣次數(shù)為11 次時RMSECV最小為25.01。最終從125 個波點中選定26 個波點作為特征波譜組合,占原始光譜信息的20.8%。經(jīng)各算法提取的特征波點見表3。
表3 特征波點列表Table 3 List of characteristic wavelengths
2.4.1 長棗VC預測模型的建立
將各算法提取的特征波點作為輸入量,長棗VC含量作為應變量,建立PLS和LSSVM模型,如表4所示。
表4 基于長棗特征波點建立的VC含量預測模型Table 4 Prediction models for VC content based on characteristic wavelengths
由表4可知,比較PLS模型效果,原始光譜-PLS模型Rc和Rp分別為0.785 1和0.796 3,R均小于0.8,代表模型效果稍差;而經(jīng)GA、SPA、CARS處理后的模型中,僅SPA-PLS模型Rc為0.756 2,小于原始光譜-PLS模型Rc;原因可能為SPA最終僅從125 個全光譜波點中挑選出5 個有效波點,雖然大大減少了冗余信息對模型效果的干擾,但同時亦剔除了部分有效信息,致使模型效果低于原始光譜。GA-PLS和CARS-PLS模型Rc、Rp分別為0.823 5、0.815 3和0.896 2、0.889 2,CARS-PLS模型校正能力明顯優(yōu)于GA-PLS模型,對比RMSEC值和RMSEP,CARSPLS模型分別為10.746 2%和12.145 3%,明顯低于GAPLS模型的17.335 4%和18.463 7%,表明CARS-PLS模型預測精度高于GA-PLS模型,雖然CARS處理原始光譜后得到的有效波點數(shù)稍高于GA法,但該法卻能在降低光譜信息共線性影響的同時,極大程度的保留原始光譜中的有效信息,故選定CARS-PLS模型為最優(yōu)PLS模型。
比較LSSVM模型效果,原始光譜-LSSVM模型Rc和Rp分別為0.746 7和0.732 1,R均小于0.8,代表模型效果稍差;而經(jīng)GA、SPA、CARS處理后的模型中,僅GALSSVM和CARS-LSSVM模型效果有所提升,Rc分別上升到0.755 9和0.832 1;而CARS-LSSVM模型在模型校正及預測能力方面又明顯優(yōu)于GA-LSSVM模型,故選定CARS-LSSVM模型為最優(yōu)LSSVM模型。
比較CARS-PLS和CARS-LSSVM模型可知,前者Rc和Rp分別為0.896 2和0.889 2,兩者較為接近且均大于后者的0.832 1和0.791 5,且CARS-PLS模型的RMSEC和RMSEP均小于CARS-LSSVM模型的16.202 8和22.580 1,充分說明CARS-PLS在模型校正精度、預測精度、模型穩(wěn)定性方面均優(yōu)于CARS-LSSVM模型。綜上可知,CARSPLS模型為最優(yōu)長棗VC含量預測模型。
2.4.2 模型驗證結(jié)果
圖5 CARS-PLS模型驗證Fig. 5 Validation of CARS-PLS model
將隨機選出的20 個未參與建模的樣本作為獨立預測集,驗證CARS-PLS模型的適用性,結(jié)果如圖5所示。實測值與預測值點呈對角線分布且以小幅度在對角線上下波動;t檢驗表明,各項指標預測值與實測值無顯著差異。
本實驗以鮮摘靈武長棗為研究對象,在400~1 000 nm波長范圍內(nèi),優(yōu)選出SNV法為最優(yōu)原始光譜預處理方法,其所建PLS模型Rcv和RMSECV分別為0.839 5和16.248 2;對經(jīng)SNV法處理后的原始光譜通過GA、SPA、CARS法提取有效信息,分別獲得僅占原始光譜9.6%、4%、20.8%的特征波點;對上述各法建立PLS和LSSVM模型并比較其效果可發(fā)現(xiàn),CARS法不僅能對原始光譜有效降維且可獲得最優(yōu)PLS模型效果,CARSPLS模型Rc、Rp和RMSEC、RMSEP分別為0.896 2、0.889 2和10.746 2%、12.145 3%。模型驗證后發(fā)現(xiàn),長棗VC實測值與預測值無顯著差異,表明基于高光譜成像技術(shù)對靈武長棗VC含量的無損檢測是可行的。
[1] 任玉鋒, 任賢, 雷茜. 靈武長棗采后生理及貯藏保鮮技術(shù)研究進展[J]. 河北農(nóng)業(yè)科學, 2009, 13(1): 13-15. DOI:10.16318/j.cnki.hbnykx.2009.01.027.
[2] 李書靜, 李可, 姚新建, 等. 2,6-二氯靛酚鈉法測定果汁飲料中的維生素C[J]. 光譜實驗室, 2011, 28(5): 2391-2394. DOI:10.3969/j.issn.1004-8138.2011.05.058.
[3] 羅陽, 何建國, 賀曉光, 等. 農(nóng)產(chǎn)品無損檢測中高光譜成像技術(shù)的應用研究[J]. 農(nóng)機化研究, 2013, 6(6): 1-6. DOI:10.13427/j.cnki.njyi.2013.06.011.
[4] YU K Q, ZHAO Y R, LIU Z Y, et al. Application of visible and nearinfrared hyperspectral imaging for detection of defective features in loquat[J]. Food and Bioprocess Technology, 2014, 7(11): 3077-3087.DOI:10.1007/s11947-014-1357-z.
[5] ARIANA D P, LU R. Hyperspectral waveband selection for internal defect detection of pickling cucumbers and whole pickles[J].Computers and Electronics in Agriculture, 2010, 74(1): 137-144.DOI:10.1016/j.compag.2010.07.008.
[6] 周竹, 李小昱, 陶海龍, 等. 基于高光譜成像技術(shù)的馬鈴薯外部缺陷檢測[J]. 農(nóng)業(yè)工程學報, 2012, 28(21): 221-228. DOI:10.3969/j.issn.1002-6819.2012.21.031.
[7] 黃文倩, 陳立平, 李江波, 等. 基于高光譜成像的蘋果輕微損傷檢測有效波長選取[J]. 農(nóng)業(yè)工程學報, 2013, 29(1): 272-277.DOI:10.3969/j.issn.1002-6819.2013.01.036.
[8] LI J B, RAO X Q, YING Y B. Detection of common defects on oranges using hyperspectral reflectance imaging[J]. Computers and Electronics in Agriculture, 2011, 78(1): 38-48. DOI:10.1016/j.compag.2011.05.010.
[9] EL MASRYA G, WANG N, CLéMENT V, et al. Early detection of apple bruises on different background colors using hyperspectral imaging[J]. LWT-Food Science and Technology, 2008, 41(2): 337-345.DOI:10.1016/j.lwt.2007.02.022.
[10] 張保華, 黃文倩, 李江波, 等. 基于高光譜成像技術(shù)和MNF檢測蘋果的輕微損傷[J]. 光譜學與光譜分析, 2014, 34(5): 1367-1372.DOI:10.3964/j.issn.1000-0593(2014)05-1367-06.
[11] PIOTR B, WOJCIECH M, JOANNA W. Detection of early bruises in apples using hyperspectral data and thermal imaging[J]. Journal of Food Engineering, 2012, 110(3): 345-355. DOI:10.1016/j.jfoodeng.2011.12.038.
[12] QIN J W, CHAO K L, KIM M S, et al. Hyperspectral and multispectral imaging for evaluating food safety and quality[J].Journal of Food Engineering, 2013, 118(2): 157-171. DOI:10.1016/j.jfoodeng.2013.04.001.
[13] LORENTE D, ALEIXOS N, GóMEZ-SANCHIS J, et al. Recent advances and applications of hyperspectral imaging for fruit and vegetable quality assessment[J]. Food and Bioprocess Technology,2012, 5(4): 1121-1142. DOI:10.1007/s11947-011-0725-1.
[14] 高俊峰, 張初, 謝傳奇, 等. 應用近紅外高光譜成像技術(shù)預測甘蔗可溶性固形物含量[J]. 光譜學與光譜分析, 2015, 35(8): 2154-2158.DOI:10.3964/j.issn.1000-0593(2015)08-215-05.
[15] 張若宇. 番茄可溶性固形物和硬度的高光譜成像檢測[D]. 杭州:浙江大學, 2014. DOI:10.3964/J.ISSN.1000-0593(2015)08-2154-05.
[16] 吳龍國, 何建國, 劉貴珊, 等. 基于近紅外高光譜成像技術(shù)的長棗含水量無損檢測[J]. 光電子: 激光, 2014(1): 135-140. DOI:10.16136/j.joel.2014.01.011.
[17] CRISTINA M, SILVIA G, EMANUEL J N M, et al. Vitamin C distribution in acerola fruit by nearinfraredectral maging[J]. Journal of Spectral Imaging, 2016, 12(6): 1-4. DOI:10.1255/jsi.2016.a6.
[18] 劉燕德, 陳興苗, 孫旭東. 可見/近紅外漫反射光譜無損檢測南豐蜜桔維生素C的研究[J]. 光譜學與光譜分析, 2008, 28(10): 2318-2319.DOI:103964/jissn.1000-0593(2008)10-2318-03.
[19] 夏俊芳, 李小昱, 李培武. 基于小波變換的柑橘維生素C含量近紅外光譜無損檢測方法[J]. 農(nóng)業(yè)工程學報, 2007, 23(6): 170-173.DOI:10.3321/j.issn:1002-6819.2007.06.033.
[20] 徐爽, 何建國, 易東, 等. 基于高光譜圖像技術(shù)的長棗糖度無損檢測[J]. 食品與機械, 2012, 28(6): 168-170. DOI:10.3969/j.issn.1003-5788.20122.06.041.
[21] 丁佳興, 吳龍國, 何建國, 等. 高光譜成像技術(shù)對靈武長棗果皮強度的無損檢測[J]. 食品工業(yè)科技, 2016, 37(24): 58-62. DOI:10.13386/j.issn1002-0306.2016.24.003.
[22] 趙曉梅, 江英, 吳玉鵬. 果蔬中VC含量測定方法的研究[J]. 食品科學,2006, 27(3): 197-198. DOI:10.3321/j.issn:1002-6630.2006.03.046.
[23] 蔣雪松, 周宏平. 基于遺傳算法的農(nóng)產(chǎn)品品質(zhì)無損檢測研究進展[J]. 江蘇農(nóng)業(yè)科學, 2013, 41(12): 17-19. DOI:10.15889/j.issn.1002-1302.2013.12.038.
[24] YE S F, WANG D, MIN S G. Successive projections algorithm combined with uninformative variable elimination for spectral variable selection[J]. Chemometrics and Intelligent Laboratory Systems, 2008,91(2): 194-199. DOI:10.1016/j.chemolab.2007.11.005.
[25] 李江波, 彭彥昆, 陳立平, 等. 近紅外高光譜圖像結(jié)合CARS算法對鴨梨SSC含量定量測定[J]. 光譜學與光譜分析, 2014, 35(5): 1264-1269. DOI:10.3964/J.ISSN.1000-0593(2014)05-1264-06.
[26] WOLD S, RUHE A, WOLD H, et al. The collinearity problem in linear regression. The partial least squares (PLS) approach to generalized inverses[J]. SIAM Journal on Scientific and Statistical Computing,2006, 5(3): 735-743. DOI:10.1137/0905052.
[27] SUYKENS J A K, VANDEWALLE J. Least squares support vector machine classifiers[J]. Neural Processing Letters, 1999, 9(3): 293-300.DOI:10.1023/A:1018628609742.
[28] 劉燕德, 周延睿, 彭彥穎. 基于近紅外漫反射光譜檢測雞蛋品質(zhì)[J].光學精密工程, 2013(1): 40-45. DOI:10.3788/OPE.20132101.0040.
[29] 蔣蘋, 羅亞輝, 胡文武, 等. 基于高光譜的油茶籽內(nèi)部品質(zhì)檢測最優(yōu)預測模型研究[J]. 農(nóng)機化研究, 2015(7): 56-60. DOI:10.13427/j.cnki.njyi.2015.07.013.
[30] 潘國鋒. 基于K-S算法的水質(zhì)硝酸鹽含量光譜檢測方法研究[J]. 光譜實驗室, 2011, 28(5): 2700-2704. DOI:10.3969/j.issn.1004-8138.2011.05.132.
[31] 熊瓊, 葛蓁, 劉志剛. 基于遺傳算法和EDA技術(shù)的果蔬采摘機器人設(shè)計[J]. 農(nóng)機化研究, 2016, 38(8): 214-217. DOI:10.3969/j.issn.1003-188X.2016.08.045.