劉燕德,胡 軍,歐陽玉平,朱丹寧,韓如冰,肖懷春,吳明明,孫旭東
(華東交通大學(xué)機(jī)電工程學(xué)院,江西 南昌 330013)
贛南臍橙可溶性固形物近紅外光譜在線無損檢測
劉燕德,胡 軍,歐陽玉平,朱丹寧,韓如冰,肖懷春,吳明明,孫旭東
(華東交通大學(xué)機(jī)電工程學(xué)院,江西 南昌330013)
通過應(yīng)用近紅外漫透射光譜技術(shù)結(jié)合最小二乘支持向量機(jī)等算法,探索臍橙可溶性固形物含量在線無損檢測的可行性。139個(gè)樣本被分成建模集和預(yù)測集(103∶36),分別用于建立檢測模型和驗(yàn)證檢測模型的預(yù)測能力。漫透射近紅外光譜,經(jīng)過一階微分、多元散射校正和移動窗口平滑組合預(yù)處理后,分別建立了偏最小二乘、偏最小二乘支持向量機(jī)模型,經(jīng)比較發(fā)現(xiàn),偏最小二乘支持向量機(jī)模型的預(yù)測能力更強(qiáng),模型預(yù)測的均方根誤差和相關(guān)系數(shù)分別為0.6423%、0.9059。通過對比發(fā)現(xiàn),主成分分析和徑向基函數(shù)有利于提高最小二乘支持向量機(jī)模型的預(yù)測能力。結(jié)果表明:采用近紅外漫透射光譜技術(shù)結(jié)合最小二乘支持向量機(jī)算法能夠很好地實(shí)現(xiàn)臍橙可溶性固形物含量的在線無損檢測。
近紅外光譜;漫透射;贛南臍橙;可溶性固形物;最小二乘支持向量機(jī)
劉燕德,胡 軍,歐陽玉平,等. 贛南臍橙可溶性固形物近紅外光譜在線無損檢測[J].廣東農(nóng)業(yè)科學(xué),2016,43(9):105-111.
贛南臍橙營養(yǎng)豐富,可溶性固形物含量較高??扇苄怨绦挝锸菃翁?、雙糖、多糖等可溶性糖類的總稱,是衡量臍橙成熟度和口感品質(zhì)的主要指標(biāo)之一[1]??扇苄怨绦挝镆话悴捎们虚_后壓榨果汁進(jìn)行測量,該方法測量相對準(zhǔn)確,但是對贛南臍橙損耗很大,且消耗人力物力,不能滿足大批量水果分選的要求[2-3]。隨著贛南臍橙產(chǎn)量的增加,亟需一種臍橙可溶性固形物檢測方法,實(shí)現(xiàn)無損檢測,通過臍橙可溶性固形物的含量進(jìn)行分級,從而實(shí)行按質(zhì)定價(jià)。
在近紅外光譜中包含了有機(jī)物中所有含氫基團(tuán)的相關(guān)信息,且信息量相當(dāng)豐富。在被測對象近紅外光譜與目標(biāo)組分真實(shí)值之間進(jìn)行回歸分析,建立定量分析模型,可實(shí)現(xiàn)未知樣品目標(biāo)組分的快速無損檢測[4]。近紅外光譜技術(shù)已被證明是農(nóng)產(chǎn)品內(nèi)部品質(zhì)檢測的有效方法之一,近紅外光譜技術(shù)也從靜態(tài)實(shí)驗(yàn)室檢測逐步邁向在線動態(tài)檢測[5]。王偉明等[6]采用平滑去噪處理后的近紅外漫反射光譜,建立了橙子的糖度含量數(shù)學(xué)模型,模型預(yù)測標(biāo)準(zhǔn)偏差為0.019%。徐惠榮等[7]建立了橙子可溶性固形物的多種數(shù)學(xué)模型,表明多元散射校正算法結(jié)合最小二乘支持向量機(jī)模型效果最優(yōu)。在傳統(tǒng)在線檢測系統(tǒng)中,臍橙和果杯緊密配合比較困難,可能造成生產(chǎn)線零部件反射的雜散光直接進(jìn)入檢測器,從而影響檢測精度。本研究采用彈性遮光圈和透光孔組合結(jié)構(gòu),克服了絕大部分雜散光,提高了在線檢測精度,找到一種最適合贛南臍橙的可溶固形物檢測模型。
1.1試驗(yàn)材料
贛南臍橙由江西某果業(yè)公司提供,臍橙的橫向直徑范圍為60~76 mm,縱向直徑范圍為62~91 mm。擦掉表皮灰塵后依次編號,在臍橙頂部每間隔120o做1個(gè)標(biāo)記,每個(gè)樣品共標(biāo)記3個(gè)點(diǎn),在室溫(25℃)靜置12 h后,每個(gè)點(diǎn)均用儀器采集一次近紅外光譜。
1.2近紅外漫透射光譜在線檢測裝置
臍橙光譜的采集和分選采用自行設(shè)計(jì)的在線檢測裝置(圖1)完成。在線檢測裝置的光譜儀選用海洋QE65000型光譜儀,光源為12 V、100 W的鹵鎢燈10盞,在波長350~1 150 nm,積分時(shí)間100 ms、光照強(qiáng)度1 000 W的條件下沿樣品傳送線兩側(cè)沿環(huán)形分布,每側(cè)布置5盞,由直流穩(wěn)壓電源供電,且電壓和電流可調(diào)。樣品運(yùn)動時(shí),兩側(cè)各5盞光源均勻地照射至樣品上。果杯上裝有彈性避光圈,水果置于果杯上時(shí)依靠自重,實(shí)現(xiàn)水果與彈性避光圈的緊密配合。果杯底部為直徑5 mm的透光孔,彈性避光圈和透光孔的組合式結(jié)構(gòu),可以有效避免雜散光進(jìn)入檢測探頭。檢測探頭安裝透光孔正下方,距離果杯底部約2 mm。光譜儀與檢測探頭間使用1 000 μm×2 m光纖連接。
圖1 近紅外漫透射在線檢測系統(tǒng)結(jié)構(gòu)
1.3近紅外漫透射光譜的在線采集
在光譜采集前需要預(yù)熱,每次開機(jī)需預(yù)熱30 min,用白色特氟龍球作參比,校正可見近紅外漫透射光譜在線檢測裝置,在光譜查看界面觀察能量譜強(qiáng)度標(biāo)準(zhǔn)差變化,當(dāng)變化范圍在1%內(nèi),電壓穩(wěn)定,即可以開始光譜采集。每個(gè)臍橙沿赤道標(biāo)號部位采集3條光譜,共150個(gè)樣品。將樣品依次進(jìn)行編號,每個(gè)樣品沿著赤道部位等間弧度標(biāo)記3個(gè)點(diǎn),間隔約120°;試驗(yàn)時(shí)采用人工上果,將贛南臍橙赤道部位放置到果杯凹槽內(nèi),保證贛南臍橙果頂與果柄連線方向與傳送帶運(yùn)動方向一致。傳送鏈帶動果杯移動,經(jīng)過探頭位置,通過硬件觸發(fā)使光譜儀觸發(fā),采用自主開發(fā)的光譜采集軟件采集并保存1條光譜。如圖2所示,硬件觸發(fā)過程如下:鏈輪與編碼盤都安裝在主軸上,鏈輪每4個(gè)齒對應(yīng)編碼盤1個(gè)齒,且鏈輪4個(gè)齒位置安裝1個(gè)果杯。霍爾傳感器位于編碼盤下方2 mm處,編碼盤每轉(zhuǎn)1齒,使得鏈輪傳動1個(gè)果杯的行程,并觸發(fā)傳感器發(fā)出1個(gè)高電位信號,觸發(fā)光譜儀采集1條光譜,并在相應(yīng)的軟件中保存光譜。共用贛南臍橙150個(gè),每個(gè)點(diǎn)測1條光譜,分別求出3條光譜的平均光譜作為該樣品的光譜值。剔除3條空光譜,剔除8條異常光譜,共139條,贛南臍橙每個(gè)標(biāo)記點(diǎn)均對應(yīng)測量可溶性固形物含量真實(shí)值。數(shù)據(jù)處理中每條平均光譜均視為1個(gè)樣品的光譜,按照3∶1的比例隨機(jī)劃分,得到建模集樣品103個(gè),預(yù)測集樣品36個(gè)。圖3為光譜在線檢測設(shè)備實(shí)物圖。
圖2 在線檢測設(shè)備的光譜數(shù)據(jù)采集原理圖
1.4可溶性固形物含量真實(shí)值測量
贛南臍橙可溶性固形物含量真實(shí)值采用PR-101α糖度計(jì)測量。表1為建模集和預(yù)測集的可溶性固形物真實(shí)值分布統(tǒng)計(jì)結(jié)果。所有光譜采集完成后,切下標(biāo)記點(diǎn)果肉適量擠汁于糖度計(jì)測試窗口上,重復(fù)測量3次,取樣品平均值作為樣品可溶性固形物含量的真實(shí)值。
表1 建模集和預(yù)測集的可溶性固形物真實(shí)值分布統(tǒng)計(jì)結(jié)果
圖4 贛南臍橙近紅外漫透射原始光譜
圖3 光譜在線檢測設(shè)備實(shí)物
2.1贛南臍橙近紅外漫透射光譜響應(yīng)特性
圖4為可溶性固形物含量高、中和低3個(gè)代表樣品對應(yīng)的光譜,光譜中存在2個(gè)波峰和1個(gè)波谷,波峰處于725、820 nm處。從波形來看,贛南臍橙近紅外漫透射光譜集中分布在550~950 nm之間。由于光譜兩端存在一些噪聲信號,建模選取550~950 nm之間波段。贛南臍橙表皮呈黃綠色,含有較高的葉綠素,730 nm附近的波谷可能由于O-H三倍頻伸縮振動導(dǎo)致[12]。
由表2對比可知,一階微分、移動窗口平滑和多元散射校正組合預(yù)處理后的效果最好。建模集和預(yù)測集光譜經(jīng)一階微分、平滑和多元散射校正組合處理后,用于后續(xù)建立可溶性固形物數(shù)學(xué)模型和模型預(yù)測。
表2 近紅外漫透射檢測方式結(jié)合不同預(yù)處理方法下贛南臍橙SSC的PLS建模結(jié)果
2.2光譜預(yù)處理方法比較
從圖5可以看出,在500~700、700~800、800~950 nm 3個(gè)波段范圍存在明顯的基線漂移。微分可以消除基線漂移,放大細(xì)節(jié)和高頻噪聲信息,通常微分后要進(jìn)行平滑處理,以消除高頻噪聲[13]。多元散射校正可以消除樣品大小不均而產(chǎn)生的散射效應(yīng)。本實(shí)驗(yàn)分別采用多元散射校正(MSC)、一階微分(1D)及其組合方法處理光譜數(shù)據(jù)。不同預(yù)處理方法的參數(shù)設(shè)置如下:Savitz-ky Golay一階微分窗口寬度5點(diǎn)2階多項(xiàng)式、移動窗口平滑窗口3點(diǎn)。由表2可知,一階微分、平滑和多元散射校正的組合光譜預(yù)處理方法結(jié)果最優(yōu),建模相關(guān)系數(shù)為0.920,建模均方根誤差為0.174%,模型預(yù)測相關(guān)系數(shù)為0.910,預(yù)測集均方根誤差為0.652%。
圖5 贛南臍橙近紅外漫透射預(yù)處理后光譜
圖6為光譜經(jīng)不同光譜預(yù)處理后PLS建模的主成分因子數(shù)變化曲線,為可溶性固形物含量高、中和低3個(gè)代表樣品對應(yīng)一階微分、平滑和多元散射校正組合處理后的光譜。主成分因子數(shù)是決定PLS模型性能的關(guān)鍵因素之一,最佳主成分因子數(shù)由留一法交互驗(yàn)證決定,交互驗(yàn)證均方根誤差(RMSECV)最小值對應(yīng)的主成分因子數(shù)即為PLS最佳主成分因子數(shù)。
圖6 贛南臍橙的可溶性固形物中主成分因子決定圖
2.3可溶性固形物在線檢測數(shù)學(xué)模型
2.3.1偏最小二乘數(shù)學(xué)模型 圖7為建模集的均方根誤差(RMSEC)和預(yù)測集的均方根誤差(RMSEP)隨主成分因子數(shù)的變化曲線。建模時(shí)所選主成分因子數(shù)(PC)過低,可能忽略部分有效光譜信息,導(dǎo)致模型精度降低,出現(xiàn)“欠擬合”現(xiàn)象,例如PC為5或6,模型預(yù)測精度尚未達(dá)到最優(yōu);而當(dāng)所選PC過高時(shí),易出現(xiàn)“過擬合”現(xiàn)象,如建模PC為8或9,RMSEC值更低,但RMSEP值較PC為8時(shí)略高。因此,本試驗(yàn)PLS模型中,最佳主成分因子數(shù)為7。
圖8為校正集和預(yù)測集贛南臍橙可溶性固形物預(yù)測值與真值的散點(diǎn)圖。建模的相關(guān)系數(shù)rc為0.978,建模的均方根誤差RMSEC為0.169 %,預(yù)測的相關(guān)系數(shù)rp為0.901,預(yù)測的均方根誤差RMSEP為0.665%。
圖7 贛南臍橙建模集的均方根誤差和預(yù)測集的均方根誤差隨主成分因子數(shù)的變化曲線
圖8 校正集和預(yù)測集贛南臍橙可溶性固形物預(yù)測值與真值的散點(diǎn)圖
通過模型回歸計(jì)算獲得回歸系數(shù),即不同波長點(diǎn)處對應(yīng)的光譜變量的權(quán)重值,將回歸系數(shù)與光譜變量通過加權(quán)求和再加上截距b=12.17,即可得到臍橙糖度的定量判別(圖9)。
圖9 贛南臍橙回歸系數(shù)曲線
2.3.2最小二乘支持向量機(jī)數(shù)學(xué)模型 影響最小二乘支持向量機(jī)(LS-SVM)性能的關(guān)鍵因素有輸入向量、核函數(shù)和其參數(shù)。輸入向量數(shù)量維數(shù)影響LS-SVM模型的計(jì)算速度和復(fù)雜程度[8-14]。本實(shí)驗(yàn)采用兩種策略,將139個(gè)近紅外光譜波長變量降維后作為LS-SVM的輸入向量。一是采用主成分分析(PCA)方法,將近紅外光譜數(shù)據(jù)壓縮成若干個(gè)主成分得分向量,考察不同主成分得分向量對LS-SVM預(yù)測結(jié)果的影響。圖10為贛南臍橙的可溶性固形物PCALS-SVM建模方法中輸入變量PC決定圖,設(shè)PCA最大主成分因子數(shù)為20,隨著輸入LSSVM主成分得分向量數(shù)量增加,預(yù)測均方根誤差先減小后增大,當(dāng)主成分的得分向量數(shù)量為8時(shí),預(yù)測均方根誤差達(dá)到最小為0.642%。二是采用連續(xù)投影算法(SPA),根據(jù)每個(gè)波長變量正交投影信息量,從139個(gè)近紅外光譜波長變量中,選取可溶性固形物敏感波長變量作為LS-SVM輸入向量。設(shè)置SPA選取最大和最小變量數(shù)分別為30和10,選取結(jié)果如圖8所示。共21個(gè)變量被選為LS-SVM的輸入向量,預(yù)測的均方根誤差為0.371。全譜533個(gè)波長變量作為PCA和SPA的對比組,也被用作LSSVM的輸入向量,依據(jù)預(yù)測均方根誤差最小原則,PCA運(yùn)行結(jié)果最優(yōu),主要8個(gè)主成分得分向量累計(jì)貢獻(xiàn)率為99%,幾乎包含了全光譜的信息,而SPA可能在選擇過程中損失了極少部分可溶性固形物相關(guān)的光譜信息。
圖10 贛南臍橙的可溶性固形物PCA-LS-SVM建模方法中輸入變量PC決定圖
LS-SVM的兩種典型核函數(shù)分別為徑向基核函數(shù)(RBF_kernel)和線性核函數(shù)(Lin_kernel)。由表3可知,依據(jù)模型相關(guān)系數(shù)越大、預(yù)測均方根誤差越小、模型預(yù)測能力越強(qiáng)的原則,徑向基核函數(shù)運(yùn)行結(jié)果優(yōu)于線性核函數(shù)。原因可能是徑向基核函數(shù)泛化能力強(qiáng),可以逼近任意非線性函數(shù),收斂速度快,可成功處理可溶性固形物含量與光譜數(shù)據(jù)間的非線性關(guān)系。采用二步法優(yōu)化LS-SVM核函數(shù)參數(shù),首先以較大步長搜索最佳核函數(shù)參數(shù)范圍,然后以較小步長在初步定位的范圍內(nèi),進(jìn)一步確定最優(yōu)參數(shù),結(jié)果見表3。
表3 近紅外漫透射檢測方式結(jié)合不同類型核函數(shù)的贛南臍橙SSC的LS-SVM建模結(jié)果
本研究對比PLS和LS-SVM模型發(fā)現(xiàn):一階微分、移動窗口平滑和多元散射校正組合預(yù)處理后建立的PCA-LS-SVM數(shù)學(xué)模型預(yù)測結(jié)果最優(yōu),預(yù)測均方根誤差為0.6423%。徐惠榮等[15]采用近紅外透射光譜技術(shù)可溶性固形物的含量,模型預(yù)測的均方根誤差為0.723%,比本實(shí)驗(yàn)結(jié)果略差,原因可能是本實(shí)驗(yàn)裝置采用了彈性避光圈和透光孔的組合結(jié)構(gòu),更有效地抑制了雜散光,同時(shí),PCA-LS-SVM方法在解決小樣本非線性問題方面更具優(yōu)勢。
本試驗(yàn)結(jié)果表明,應(yīng)用可見近紅外漫透射光譜技術(shù)結(jié)合主成分分析、最小二乘支持向量機(jī),可以很好地實(shí)現(xiàn)贛南臍橙可溶性固形物含量的在線無損檢測。運(yùn)用一階微分、移動窗口平滑和多元散射校正組合等多種預(yù)處理方法有效地消除了基線漂移和光散射效應(yīng)。對比模型發(fā)現(xiàn)使用最小二乘支持向量機(jī)的數(shù)學(xué)模型預(yù)測能力優(yōu)于偏最小二乘建立的數(shù)學(xué)模型,模型預(yù)測均方根誤差和相關(guān)系數(shù)分別達(dá)到0.6423%和0.9059。與連續(xù)投影算法相比,主成分分析更適于選取最小二乘支持機(jī)的輸入向量?;趶较蚧撕瘮?shù)的最小二乘支持向量機(jī)模型略優(yōu)于線性核函數(shù)。本研究為其他農(nóng)產(chǎn)品品質(zhì)近紅外漫
透射光譜的在線檢測提供相關(guān)參考依據(jù)。
[1]Wang A C,Xie L J. Technology using near infrared spectroscopic and multivariate analysis to determine the soluble solids content of citrus fruit[J]. Journal of Food Engineering,2014,143:17-24.
[2]王蒙,馮曉元. 梨果實(shí)近紅外光譜無損檢測技術(shù)研究進(jìn)展[J]. 食品質(zhì)量安全檢測學(xué)報(bào),2014,5(3):681-690.
[3]Magwaza L S,Opara U L,Nieuwoudt H,et al. NIR spectroscopy applications for internal and external quality analysis of citrus fruit—A review[J]. Food and Bioprocess Technology,2012,5:425-444.
[4]朱麗偉,馬文廣,胡晉. 近紅外光譜技術(shù)檢測種子質(zhì)量的應(yīng)用研究進(jìn)展[J]. 光譜學(xué)光譜分析,2015,35(2):346-349.
[5]Viegas T R,Mata A L M L. Determination of quality attributes in wax jambu fruit using NIRS and PLS[J]. Food Chemistry,2016,190:1-4.
[6]王偉明,董大明,鄭文剛,等. 梨果糖濃度近紅外漫反射光譜檢測的預(yù)處理方法研究[J]. 光譜學(xué)光譜分析,2013,33(2):359-362.
[7]許文麗,孫通,胡田,等. 基于變量優(yōu)選和快速獨(dú)立成分分析的黃花梨可溶性固形物可見/近紅外光譜檢測[J]. 光譜學(xué)光譜分析,2014,34(12):3253-3256.
[8]許祿,邵學(xué)廣. 化學(xué)計(jì)量學(xué)方法[M]. 第二版.北京:科學(xué)出版社,2004.
[9]劉雪梅,章海亮. 基于DPLS和LS-SVM 的梨品種近紅外光譜識別[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2012 43(9):1000-1298.
[10]王加華,韓東海. 便攜式近紅外水果糖度分析模型簡化研究[J]. 食品安全質(zhì)量檢測技術(shù),2009,1(1):32-38.
[11]嚴(yán)衍祿. 近紅外光譜分析基礎(chǔ)與應(yīng)用[M]. 北京:中國輕工業(yè)出版社,2005.
[12]尼珍,胡昌勤,馮芳. 近紅外光譜分析中光譜預(yù)處理方法的作用及其發(fā)展[J]. 藥物分析雜志,2008,28(5):824-829.
[13]Li J B,Huang W Q,Zhao C J,et al. A comparative study for the quantitative determination of soluble solids content,pH and firmness of pears by Vis/NIR spectroscopy[J]. Journal of Food Engineering,2013,116:324-332.
[14]張利華,馬鈞釗,勒國慶,等. 基于BP神經(jīng)網(wǎng)絡(luò)的倉儲煙草霉變預(yù)測[J]. 華東交通大學(xué)學(xué)報(bào),2013,30(6):71-76.
[15]徐惠榮,陳曉偉,應(yīng)義斌. 基于多元校正法的香梨糖度可見/近紅外光譜檢測[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2010,41(12):1000-1298.
(責(zé)任編輯 白雪娜)
Online detection of soluble solids content for Gannan navel by visible-near infrared diffuse transmission spectroscopy
LIU Yan-de,HU Jun,OUYANG Yu-ping,ZHU Dan-ning,HAN Ru-bing,XIAO Huai-chun,WU Ming-ming,SUN Xu-dong
(School of Mechatronics Engineering,East China Jiaotong University,Nanchang 330013,China)
The feasibility was investigated for online detection of soluble solids content(SSC) of Gannan navel orange by visible-near infrared(visible-NIR) diffuse transmission spectroscopy coupled with least square support vector machine(LS-SVM) algorithm. 139 samples were divided into the calibration and prediction sets(103∶36)for developing calibration models and assessing their performance. The partial least square(PLS) regression and LS-SVM model were developed with the pretreatment by the combination of first derivative(1D),Smoothing and multiplicative scattering correction(MSC). The new samples of prediction set were applied to evaluate the performance of the model. Compared with PLS model,the performance of LS-SVM model was better with the root mean square error of prediction(RMSEP) of 0.6423% and the correlation coefficient of prediction of 0.9059. And the spectral dimension reduction method of principal component analysis(PCA) and the kernel function of radial basis function(RBF) were suitable to improve the predictive ability of LS-SVM model. The results suggested that it was feasible for online detection of SSC of Gannan navel orange by visible-NIR diffuse transmission spectroscopy combined with LS-SVM algorithm.
near infrared spectroscopy;diffuse transmission;Gannan navel orange;soluble solids content;least squares support vector machine
S24
A
1004-874X(2016)09-0105-07
2016-06-30
“十二五”國家863計(jì)劃項(xiàng)目(SS2012AA101306);江西省優(yōu)勢科技創(chuàng)新團(tuán)隊(duì)建設(shè)計(jì)劃項(xiàng)目(20153BCB24002);南方山地果園智能化管理技術(shù)與裝備協(xié)同創(chuàng)新中心項(xiàng)目(贛教高字[2014]60號)
劉燕德(1967-),女,博士,教授,E-mail:1825868002@qq.com