毛欣然, 夏靜靜, 徐惟馨, 韋 蕓, 陳玥瑤, 陳月飛, 閔順耕, 熊艷梅
中國農(nóng)業(yè)大學(xué)理學(xué)院, 北京 100193
我國是梨子屬植物的重要起源地之一, 在全球25個(gè)梨子屬品種中, 我國有14種。 梨是我國三大水果之一, 是生活中常見的水果。 梨果脆甜多汁, 但僅感官很難分辨出它的品質(zhì), 可溶性固形物(soluble solids content, SSC)、 酸度(pH)、 硬度(hardness, HR)是評價(jià)其內(nèi)在品質(zhì)的重要理化指標(biāo), 通常采用濕化學(xué)方法進(jìn)行測定, 存在步驟繁瑣、 耗時(shí)長、 損耗樣品等缺點(diǎn), 無法滿足水果收購、 流通、 質(zhì)量監(jiān)管中大批量樣品品質(zhì)現(xiàn)場檢測要求。 因此, 找到一種快速、 無損檢測水果品質(zhì)方法對提高梨果的分選效率、 落實(shí)優(yōu)質(zhì)優(yōu)價(jià)、 提高消費(fèi)者的滿意度具有重要的意義。
近紅外光譜(near-infrared spectroscopy, NIR) 技術(shù)是一種簡便快速、 無損檢測技術(shù), 已廣泛應(yīng)用于食品與農(nóng)產(chǎn)品品質(zhì)分析, 在梨、 蘋果、 臍橙品質(zhì)指標(biāo)(SSC、 PH、 VC等)檢測中有許多文獻(xiàn)報(bào)道。 章海亮等[1]采用近紅外漫反射法無損檢測3個(gè)品種梨果糖度、 pH值; 李東華等[2]采用近紅外技術(shù)對鞍山、 海城兩產(chǎn)區(qū)南果梨果實(shí)硬度建立了PLS模型, 模型校正集相關(guān)系數(shù)為0.970, 校正均方根誤差為0.124; Alex Goke等[3]采用近紅外光譜結(jié)合PLS法預(yù)測Bartlett梨果糖含量; 羅亞瓊等[4]設(shè)計(jì)了梨糖度無損檢測紅外光譜系統(tǒng), 實(shí)現(xiàn)了對梨糖度快速檢測。 Lee[5]等采用近紅外漫反射光譜對韓國梨含糖量進(jìn)行了無損分析。 Yuan等[6]利用Vis-NIR技術(shù)結(jié)合偏差融合建模方法對“云和”梨糖度進(jìn)行無損分析; Xia[7]等利用Vis/NIR在線半透射技術(shù)建立梨(Pyrusbretschneideri“Ya”) SSC含量的多因素融合模型。 Li等[8]采用可見-近紅外儀器(波長范圍350~1 800 nm)建立3種梨子SSC(9.5%~13%)、 pH(4.5~5.25)、 HR(3.5~13.5)指標(biāo)的LS-SVM模型, 模型RMSEP分別為0.25%、 0.058、 0.62; 韓東海[9]等采用近紅外法檢測蘋果的SSC, 找到了消除果實(shí)大小影響的方法。 上述研究對梨的品質(zhì)檢測研究主要是對單一品種的梨建立模型, 由于不同品種梨的大小、 SSC、 pH、 HR、 色澤等均有較大差異, 對光譜有很大的影響, 適用不同品種梨品質(zhì)檢測的通用模型研發(fā)存在一定的困難。
采用手持式數(shù)字陣列微鏡(DMD)近紅外光譜儀, 建立了外形大小差異顯著的5個(gè)品種梨可溶性固形物(SSC)、 酸度、 硬度三個(gè)品質(zhì)指標(biāo)的近紅外光譜定量模型, 比較偏最小二乘法PLS和最小二乘支持向量機(jī)回歸LS-SVM模型性能優(yōu)劣, 消除梨的大小對建模結(jié)果的影響, 建立了梨三種品質(zhì)指標(biāo)通用模型, 為實(shí)現(xiàn)現(xiàn)場快速測定梨品質(zhì)提供了新的途徑。
表1 五個(gè)品種梨的理化數(shù)據(jù)統(tǒng)計(jì)結(jié)果
數(shù)字陣列微鏡手持近紅外光譜儀(IAS3125, 迅杰光遠(yuǎn)儀器有限公司, 中國), 配套光譜數(shù)據(jù)處理軟件IAS Tool-Box;
WYA-2WA阿貝折射儀(上海申光公司); testo pH計(jì)(德國德圖); GY-4硬度計(jì)(浙江溫州艾德堡)。
蒸餾水、 無水乙醇(分析純, 國藥集團(tuán)化學(xué)試劑有限公司)。
偏最小二乘法PLS算法軟件為Unscrambler 9 .5和LS-SVM算法軟件為matlabR2021a自編程序。
手持式近紅外儀的光譜采集范圍900~1 700 cm-1, 光學(xué)分辨率為12~15 nm, 采樣點(diǎn)間隔1 nm, 掃描次數(shù)32次; 用儀器對梨赤道線120°等間隔采集3個(gè)區(qū)域光譜, 為避免小梨或者形狀不規(guī)則的梨漏光干擾, 采集光譜時(shí)用黑色橡膠圈套住光源, 并盡可能避免病斑、 傷疤等表面缺陷部位, 以三個(gè)區(qū)域光譜的平均光譜代表該梨樣品光譜。
梨的SSC、 pH、 HR測定: 用針在每個(gè)梨上劃出3個(gè)區(qū)域, 測量該區(qū)域光譜后, 再用硬度計(jì)測量該區(qū)域的HR。 因?yàn)椴煌娴拇笮〔煌? 而梨不同的深度硬度也不同, 所以每一個(gè)品種, 選擇一個(gè)固定的深度測定HR, 依據(jù)標(biāo)準(zhǔn)NY/T 2009—2011《水果硬度的測定》測量; 然后將3個(gè)區(qū)域的梨肉挖出, 分別榨汁; 用pH計(jì)依據(jù)標(biāo)準(zhǔn)GB/T10468—1989《水果和蔬菜產(chǎn)品pH值的測定方法》測量3個(gè)區(qū)域的pH; 依據(jù)標(biāo)準(zhǔn)NY/T2637—2014《水果和蔬菜可溶性固形物含量的測定》測量3個(gè)區(qū)域樣品的SSC指標(biāo)。
所有樣品化學(xué)值理化數(shù)據(jù)統(tǒng)計(jì)結(jié)果如表2所示。
在醫(yī)院。我醒來時(shí),兒子說,我已睡了很久。他說他一直在旁邊看著輸液管里的液體,怕它停止嘀嗒。我的眼淚一下子流了出來。
表2 五個(gè)品種的梨的三個(gè)點(diǎn)的化學(xué)值統(tǒng)計(jì)
所有光譜均采用一階導(dǎo)數(shù)進(jìn)行預(yù)處理, 按樣品號順序, 采用4∶1比例進(jìn)行分集[10], 確定校正集樣品143個(gè)與驗(yàn)證集47個(gè), 分別采用偏最小二乘法PLS與最小二乘支持向量機(jī)法LS-SVM建模, 模型評價(jià)指標(biāo)為決定系數(shù)(R2)、 校正集均方根誤差(RMSEC)和預(yù)測集均方根誤差(RMSEP);R2值越大、 RMSEP越小, 則表明模型預(yù)測能力越強(qiáng)。
1.5.1 最小二乘支持向量機(jī)LS-SVM模型
考慮到光譜采集時(shí), 梨的尺寸大小及曲面影響光譜采集的重現(xiàn)性, 導(dǎo)致了模型誤差, 為了擬合并扣除這些因素對模型的影響, 還采用了非線性算法LS-SVM方法建立梨平均光譜與品質(zhì)指標(biāo)測定的數(shù)學(xué)模型。
LS-SVM最小二乘支持向量機(jī)是一種新型支持向量機(jī)方法, 它能夠處理線性和非線性多元分析, 采用最小二乘線性系統(tǒng)作為損失函數(shù), 代替?zhèn)鹘y(tǒng)的支持向量機(jī)采用的二次規(guī)劃方法, 基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則, LS-SVM優(yōu)化以下問題
(1)
式(1)中,λ是正則化參數(shù), 起到權(quán)衡擬合精度與模型復(fù)雜度的作用。 回歸模型可描述為
(2)
式(2)中,xi為輸入向量,αk為拉格朗日乘子, 稱為支持值,b為偏置核函數(shù)。K(x,xi)定義了從原始變量所在的低維度空間向高維度空間做非線性映射的方式。 目前支持向量機(jī)研究中對于核函數(shù)的選擇并無固定的方法, 但從核函數(shù)緊致性和計(jì)算復(fù)雜度來評價(jià), 徑向基核函數(shù)RBF更具優(yōu)勢, 有
K(x,xk)=exp(-‖x-xk‖2/σ2)
(3)
式(3)中,σ2是RBF核函數(shù)寬度。
正則化參數(shù)λ優(yōu)化、 核函數(shù)K(x,xi)選擇和核函數(shù)參數(shù)優(yōu)化是LS-SVM的三個(gè)關(guān)鍵問題。 選用RBF核函數(shù), 用單純型搜索、 十折交叉驗(yàn)證優(yōu)化參數(shù)λ和σ2, 這兩個(gè)參數(shù)決定了LS-SVM的學(xué)習(xí)能力、 預(yù)測能力和泛化能力。
2.1.1 梨子光譜特征
梨樣品的光譜如圖1所示, 波長范圍為900~1 628 nm, 960 nm為O—H的三倍頻吸收, 1 190和1 450 nm分別為C—H的二倍頻彎曲振動(dòng)吸收和O—H的一倍頻彎曲振動(dòng)吸收。 從圖1可以看出, 不同的梨吸光度差異較大, 但特征峰一致。 雪梨在波長為900 nm處吸光度為0.03~0.2左右, 在波長1 450 nm處吸光度在0.6~0.85, 結(jié)果見圖1(b); 蜜梨在波長為900 nm處吸光度為0.1~0.35, 在波長1 450 nm處吸光度在0.75~1, 結(jié)果見圖1(c)。 所以, 小梨吸光度較大, 而大梨吸光度較小。 采用一階導(dǎo)數(shù)消除樣品大小差異對光譜的影響。 以平均光譜的基線點(diǎn)(波長1 100 nm)和一階導(dǎo)數(shù)峰位置(波長1 400 nm)進(jìn)行光譜測定重復(fù)性分析, 1 100 nm處所有樣品光譜的平均值為0.219, 標(biāo)準(zhǔn)偏差為0.074 5, 平均值除以標(biāo)準(zhǔn)偏差為6.37; 所有樣品一階導(dǎo)數(shù)光譜平均值為0.000 568, 標(biāo)準(zhǔn)偏差0.000 089 2, 平均值除以標(biāo)準(zhǔn)偏差得到信噪比為9.25。 1 400 nm處所有樣品光譜的平均值為0.679, 標(biāo)準(zhǔn)偏差0.087 6, 平均值除以標(biāo)準(zhǔn)偏差為7.76; 所有樣品一階導(dǎo)數(shù)光譜平均值為0.007 89, 標(biāo)準(zhǔn)偏差為0.000 753, 平均值除以標(biāo)準(zhǔn)偏差為10.48; 可以看出, 經(jīng)過一階導(dǎo)處理后, 平均光譜值與光譜變化標(biāo)準(zhǔn)差比值明顯增高, 說明經(jīng)過一階導(dǎo)數(shù)處理后光譜基線波動(dòng)性減小, 即梨子大小對光譜影響明顯減少。
圖1 梨的光譜
2.1.2 異常值判斷
為了保證建模成功, 異常樣品處理是必要的步驟。 采用主成分分析得分圖進(jìn)行異常值分析如圖2所示, 從得分圖中判定紅香酥-15, 蜜梨-33為異常樣本; Hotelling’s T2統(tǒng)計(jì)量與杠桿率呈線性關(guān)系, 其臨界極限基于F檢驗(yàn), 紅線為臨界值, 超過紅線樣本為異常樣本, Hotelling’s T2檢驗(yàn)圖見圖7, 判斷紅香酥-2、 紅香酥-15、 紅香酥-27、 紅香酥-33、 蜜梨-10、蜜梨-33、 雪梨-42、 紅肖梨-44為異常樣本, 建模前對所有異常樣本進(jìn)行剔除。
采用偏最小二乘法建立可溶性固形物(SSC)、 酸度(pH)和硬度(HR)的近紅外模型, 平均光譜與一階導(dǎo)數(shù)光譜得到模型結(jié)果如表3所示, 三個(gè)化學(xué)值的一階導(dǎo)PLS的建模結(jié)果如圖3所示。
圖3 三個(gè)化學(xué)值的一階導(dǎo)PLS的建模結(jié)果
表3 PLS模型結(jié)果
一階導(dǎo)數(shù)預(yù)處理后, 三個(gè)指標(biāo)定量模型性能有了顯著提高。 SSC、 pH、 HR預(yù)測值與化學(xué)值相關(guān)關(guān)系見圖3。 SSC值、 pH、 HR值模型預(yù)測集標(biāo)準(zhǔn)差RMSEP依次分別為0.66%、 0.24、 0.23; 一階導(dǎo)數(shù)處理后, 預(yù)測集SSC值、 pH、 HR值模型標(biāo)準(zhǔn)差RMSEP依次降低了20%、 41%、 74%。
與偏最小二乘算法相同分集方法, 建立可溶性固形物(SSC)、 酸度(pH)和硬度(HR)的偏最小二乘支持向量機(jī)回歸LS-SVM模型, 平均光譜與一階導(dǎo)數(shù)光譜建模結(jié)果見表4。 一階導(dǎo)數(shù)光譜LS-SVM模型如圖4、 圖5和圖6所示。
圖4 一階導(dǎo)數(shù)光譜LS-SVM模型糖度預(yù)測值
圖5 梨酸度的一階導(dǎo)數(shù)LSSVM模型預(yù)測值
圖6 梨硬度的一階導(dǎo)數(shù)LSSVM模型
表4 LS-SVM模型結(jié)果
從模型結(jié)果看, 一階導(dǎo)數(shù)預(yù)處理后, 三個(gè)指標(biāo)定量模型性能有了顯著提高。 SSC、 pH、 HR值模型預(yù)測集標(biāo)準(zhǔn)差RMSEP依次分別為0.32%、 0.11%、 0.36%; 一階導(dǎo)數(shù)處理后, 預(yù)測集SSC值、 pH、 HR值模型標(biāo)準(zhǔn)差RMSEP依次降低了37%、 56%、 48%。
模型適用于5個(gè)品種梨子SSC、 酸度和硬度指標(biāo)的快速預(yù)測, 三項(xiàng)品質(zhì)指標(biāo)范圍分別是: SSC為8.2%~14%, 酸度(pH值)為2.4~5.4, 硬度為1.4~7.8 bPa。 對比PLS模型與LS-SVM模型結(jié)果, SSC、 酸度、 硬度預(yù)測模型決定系數(shù)R2分別從0.739 5、 0.933 5、 0.886 6提高到0.976 3、 0.999 9、 0.996 0; 糖度、 酸度、 硬度模型預(yù)測集RMSEP從0.59、 0.19、 0.52降低到0.32、 0.11、 0.36; 三個(gè)模型的決定系數(shù)R2值有明顯的提高, 同時(shí)RMSEP值也有一定程度的下降, 非線性LS-SVM模型性能比線性PLS模型有了大幅度的提高。 分析具體可能有下列原因:
(1)梨子大小影響: 本研究采用5個(gè)品種梨子, 果形最大的雪梨重量362.84 g, 果形最小的蜜梨重量在90 g; 最大的雪梨平均赤道周長27.64 cm, 最小的蜜梨平均赤道周長18.35 cm。 果形差異導(dǎo)致赤道位置曲率差異明顯, 采集光譜有明顯不同, 圖7(a)、 (b)為雪梨和蜜梨的光譜。 為了解決果形大小對光譜的影響, 文獻(xiàn)[9]采用等吸收點(diǎn)校正方法和導(dǎo)數(shù)法扣除果形大小影響。 本工作采用導(dǎo)數(shù)法扣除, 扣除結(jié)果見圖7(c)、 (d), 從圖中可以看出, 一階導(dǎo)數(shù)光譜處理后光譜一致性明顯改善, 但未完全扣除。 因此, 盡管5個(gè)品種梨子的樣品個(gè)體大小差異很大, 采用非線性算法將部分?jǐn)M合扣除了因果形大小帶來的誤差, 提高了模型預(yù)測能力。
圖7 雪梨與蜜梨的光譜
(2)儀器光斑入射角度影響: 盡管測量時(shí)采用黑色密封墊避免外界光的影響, 但由于手持儀器采集光譜時(shí)對準(zhǔn)樣品的角度差異, 加上非平面果形漫反射影響, 使得每次測得光譜存在一定的差異, 采用多次采集光譜進(jìn)行平均是降低這個(gè)因素影響的方法之一, 因此, 采用在赤道測定三個(gè)位置光譜進(jìn)行光譜平均的方法, 部分解決了測定重復(fù)性的問題, 一定程度上也解決了梨子不同部位曲率不同、 品質(zhì)不均勻性的影響。 另外, 非線性模型也擬合了這些因素的影響, 提高了模型的預(yù)測效果。
(3)不同品種梨的酸度與硬度差異較大, 酸梨的酸度在3以下, 蜜梨在4左右, 雪梨在5左右; 酸梨的硬度范圍在5~7左右, 蜜梨的硬度在3~4, 雪梨的硬度在1~3左右。 而不同品種的梨的糖度差異較小, 除了酸梨的糖度最高在13左右; 這就要求建立的模型需要有比較寬預(yù)測范圍, 非線性算法在解決寬范圍模型具有一定的優(yōu)勢。
從上述討論中可以得出, 采用非線性LS-SVM算法保證了本模型適用于大小不同的更多的品種、 更寬的品質(zhì)指標(biāo)范圍的樣品預(yù)測, 模型的準(zhǔn)確度和穩(wěn)定性有了顯著提高。
采用數(shù)字陣列微鏡型便攜式近紅外光譜儀對5個(gè)品種梨的可溶性固形物(SSC)、 酸度(pH)、 硬度進(jìn)行了PLS、 LSSVM建模, 采用三點(diǎn)平均光譜代表樣品光譜和一階導(dǎo)預(yù)處理, 解決了樣品不均勻性、 不同梨大小不同等因素的影響, 結(jié)果表明: LSSVM建模效果明顯優(yōu)于PLS, LSSVM模型糖度(SSC)、 酸度(pH)和硬度(HR)的校正集決定系數(shù)依次為0.976 3、 0.999 9、 0.996 0, 預(yù)測集決定系數(shù)依次為0.923 4、 0.977 7、 0.939 4, 預(yù)測集RMSEP依次為0.316 9、 0.108 9、 0.361 3; 模型RPD依次為6.10、 222.38、 16.95。
綜上, 手持式近紅外儀器可以實(shí)現(xiàn)無損檢測梨的糖度、 酸度、 硬度, 檢測的結(jié)果可以實(shí)現(xiàn)測量不同大小品種的梨, 建立梨的通用模型。 滿足果園管理、 果品銷售及市場監(jiān)管需要, 為實(shí)現(xiàn)不同品種大小梨的品質(zhì)指標(biāo)的無損現(xiàn)場快速檢測提供了新的途徑。