崔蘊涵,許金釵,方智毅,葉大鵬,翁海勇*
(1.福建農林大學機電工程學院,福建 福州 350002;2.現(xiàn)代農業(yè)裝備福建省高校工程研究中心,福建 福州 350002)
蓮子富含蛋白質、脂肪、維生素、礦質元素、氨基酸等基本營養(yǎng)成分,被視為一種營養(yǎng)很高的天然食品[1]。在蓮子加工過程中,含水率是衡量其品質的關鍵指標之一。蓮子的含水率檢測目前主要是采用傳統(tǒng)的熱風烘干法,耗時長,結果滯后,在蓮子烘干過程中無法達到實時檢測的目的。
近紅外光譜技術因操作簡單、速度快、成本低且無需前處理,在食品質量快速檢測中有廣泛的應用前景[2-4]。劉潔等[5]探究了近紅外光譜技術應用于板栗含水率無損檢測的可能性,結果表明,栗仁的建模效果較好,栗殼表面的物理特性會對光譜信噪比造成一定影響。鞠興榮等[6]借助近紅外光譜技術建立了稻谷含水率偏最小二乘(partial least square,PLS)分析模型,驗證集決定系數(shù)高達0.980 6。Guzmán等[7]發(fā)現(xiàn)近紅外視覺系統(tǒng)可用于橄欖離線檢測和在線分選,可以快速區(qū)分不符合最低質量要求的產(chǎn)品。彭云發(fā)等[8]采集了南疆紅棗近紅外光譜數(shù)據(jù)并建立了PLS模型,結果表明,預測值平均偏差為0.41%,實現(xiàn)了南疆紅棗水分的快速檢測。陳琳等[9]利用多種方法分別構建紅茶含水率預測模型。結果表明,利用聯(lián)合區(qū)間偏最小二乘法構建的含水率預測模型效果更優(yōu),其預測集的相關系數(shù)和均方根誤差分別為0.959 3和0.039 5,模型預測精度高。Arslan等[10]采用近紅外光譜法對黑枸杞中總黃酮、花青素等化學成分進行了定量分析,結果表明,近紅外光譜法可用于黑枸杞化學成分檢測。于旭峰等[11]提出了運用近紅外光譜技術檢測新鮮馬鈴薯葉片的含水率,驗證了特征波段結合人工神經(jīng)網(wǎng)絡建立的模型準確度較高,并能極大提高預測效率。除此之外,近紅外光譜技術還應用于核桃[12]、生姜[13]和血橙[14]等農產(chǎn)品的無損檢測。隨著國內外對便攜式近紅外光譜儀器的不斷研發(fā),彌補了臺式近紅外光譜儀不可攜帶的缺點,實現(xiàn)了便攜、實時檢測的目的[15]。張珮等[16]闡述了便攜式近紅外光譜儀在果蔬品質定性和營養(yǎng)指標定量等方面的進展。劉亞超等[17]提出了一種基于便攜式近紅外光譜儀的試驗方法,主要用于大米品質參數(shù)的檢測。李曉云等[18]借助近紅外光譜的無損檢測技術,對牛奶中各種營養(yǎng)成分含量進行了檢測。Zhu等[19]用便攜式近紅外光譜儀和漫射透射光譜法測定富士蘋果的糖含量和硬度,效果理想??梢娊柚銛y式近紅外光譜儀可實現(xiàn)對農產(chǎn)品品質的快速無損檢測,但是關于應用該技術在蓮子干燥過程中含水率的快速檢測報道較少。
因此,本文利用便攜式近紅外光譜儀獲取蓮子干燥過程不同時刻的光譜反射率,建立蓮子含水率快速檢測模型,并對比分析不同光譜數(shù)據(jù)處理方法對模型預測性能的影響。研究結果可以為蓮子含水率的快速檢測提供理論依據(jù)和技術支持。
成熟蓮子(廣昌蓮子和武夷山蓮子):分別采摘自江西廣昌和福建武夷山,根據(jù)相似的外觀(大小和外殼顏色)各選擇100個蓮子樣品,如圖1所示。所有樣品均于2019年采收,置于(4.0±0.5)℃的冷藏室進行存儲備用。在每次干燥試驗前,將蓮子果皮、種皮、蓮心去除,并用蒸餾水沖洗干凈后用于后期試驗數(shù)據(jù)的采集。
圖1 武夷山蓮子和廣昌蓮子代表性樣本Fig.1 Representative lotus seeds of Wuyishan and Guangchang
NIRez-G1便攜式近紅外光譜儀:五鈴光學股份有限公司;DHG-9053A電熱恒溫鼓風干燥箱:上海精宏實驗設備有限公司;JA5003B電子天平:上海精科天美科學儀器有限公司。
1.3.1 樣品的制備
為了得到不同含水率的蓮子樣品,本試驗選擇了0、4、8 min和12 min 4個干燥時間的蓮子用于光譜數(shù)據(jù)的采集。在蓮子干燥過程中,通過稱重法進行含水率測定,每隔4 min通過電子天平測定蓮子質量并計算干燥后蓮子含水率,具體的計算方法如式(1)所示。
式中:Mt為干燥過程中t時刻蓮子的干基含水率,%;mt為干燥過程中 t時刻蓮子的質量,g;m0為蓮子的干基質量,g。
1.3.2 蓮子光譜數(shù)據(jù)采集
本試驗設定采集波段為950 nm~1 650 nm,分辨率10 nm,曝光時間1.27 ms,設置掃描的平均次數(shù)為3次,其平均光譜用于近紅外光譜分析。光譜數(shù)據(jù)采集系統(tǒng)ISUZU_NIRez2_eng_3軟件控制,通過USB電纜連接計算機和近紅外光譜儀。試驗前開啟便攜式近紅外光譜儀進行預熱,至少20 min后開始測量,以保證獲得穩(wěn)定的讀數(shù)。在蓮子樣品的光譜數(shù)據(jù)采集前,首先獲取參考板(聚四氟乙烯)和暗電流的光譜數(shù)據(jù),用于減少暗電流和光照不均勻對蓮子光譜的影響,校正公式如(2)所示。
式中:R為校正后的蓮子光譜反射率;Idark為暗電流;Iraw為蓮子原始光譜值;Iref為參考板光譜反射值。
采集光譜信息時,測量窗口要與蓮子表面緊密接觸。為了采集更加全面的蓮子光譜信息,每個蓮子樣本選取4個不同位置面進行測量,4個面的光譜平均值作為該時刻的光譜值。整個試驗過程要保證儀器處于黑暗環(huán)境,避免外界光線對試驗結果造成影響。
1.3.3 光譜數(shù)據(jù)處理
將原始光譜進行適當?shù)奶幚恚軌蛟鰪娊t外光譜與蓮子含水率測量值的對應關系,提高關系模型的準確性和可靠性[20-21]。本文分別應用卷積平滑(savitzky golay,SG)、標準正態(tài)變量變換(standard normal variate transformation,SNV)、多元散射校正(multiplicative scatter correction,MSC)和歸一化對光譜數(shù)據(jù)進行處理,并比較不同的數(shù)據(jù)處理方法對模型預測性能的影響。
利用Kennard-Stone算法進行樣本按照2∶1的比例劃分成校正集和預測集。蓮子含水率的數(shù)學模型采用PLS法建立。PLS法是一種基于線性回歸方式的多元校正方法,該方法對光譜陣X和濃度Y同時分解,并在分解時加強兩者對應的關系,是光譜多元校正分析中應用最廣泛的方法之一[22]。利用PLS模型預測出的樣品含水率與真實測量值作比較,最后計算出校正決定系數(shù)RC2、校正均方根誤差(root mean square error of calibration,RMSEC)、預測決定系數(shù) RP2、預測均方根誤差(root mean square error of prediction,RMSEP)和剩余預測偏差(residual predictive deviation,RPD),對模型的預測性能進行評價。當模型的RC2、RP2大于0.9,且均方根誤差RMSEC與RMSEP均較小時,可以判定該模型的性能穩(wěn)定,準確度高。RPD一般作為模型預測能力的評判標準,當RPD高于3.0時,該模型預測精準,RPD在2.6~3.0之間,該模型的預測結果可信度較大,如果RPD在2.1~2.5之間,預測能力一般,如果RPD在1.5~2.0之間,預測結果可參考性不大,如果RPD低于1.5,不能作為預測模型。其中決定系數(shù)、均方根誤差和剩余預測偏差的計算方法分別見式(3)、(4)和(5)。
蓮子樣品的含水率統(tǒng)計分析如表1所示。
表1 武夷山蓮子和廣昌蓮子的初始含水率分布情況Table 1 Distribution of initial moisture content of Wuyishan and Guangchang lotus seed samples
廣昌蓮子與武夷山蓮子樣本含水率的最大值、最小值、平均值和標準差均有一定差距,廣昌蓮子的含水率為98.79%~206.10%,武夷山蓮子的含水率為112.26%~195.12%。不同品種的蓮子含水率差距較大,這要求建立的蓮子含水率近紅外模型需要具有較好的魯棒性。
兩種蓮子干燥0、4、8 min和12 min的原始反射光譜如圖2所示。
圖2 武夷山蓮子和廣昌蓮子樣品的光譜反射率Fig.2 Raw spectra of and Wuyishan and Guangchang lotus seed samples
由圖2可知,在950 nm~1 650 nm波長范圍內,不同干燥時間的兩種蓮子表現(xiàn)出了基本相同的光譜形態(tài),且吸收特征波峰明顯。O-H拉伸振動的一級倍頻在1 450 nm處產(chǎn)生,而二級倍頻在960 nm產(chǎn)生峰值變化,蓮子的合頻吸收譜帶不明顯,主要表現(xiàn)在1 220 nm附近。960 nm~1 450 nm皆為水的特征吸收變化區(qū),能在一定程度上代表蓮子水分含量檢測的信息,證明了光譜檢測含水率的可行性。另外從圖2中還可以看出,蓮子在初始時刻的反射率最小,干燥時間越久,蓮子含水率越小,相應的光譜反射率越大。
為了比較不同的預處理方法對蓮子含水率預測模型性能的影響,將武夷山蓮子與廣昌蓮子干燥時間分別為0、4、8 min和12 min的原始光譜數(shù)據(jù)進行SG處理、SNV處理、MSC處理以及歸一化處理,并建立模型,其中武夷山蓮子含水率PLS模型的預測效果如表2所示。
從表2中可以發(fā)現(xiàn),不同的預處理方法對原始光譜的作用效果各不相同,適當?shù)念A處理才能有效提高模型的性能。相較于武夷山蓮子原始光譜建模效果,由MSC預處理后的模型預測效果不佳,影響不顯著,說明由蓮子表面物理特性造成的光譜差異性不大。而利用歸一化處理后的光譜所建立的模型預測決定系數(shù)低于原始光譜模型,SG處理后的校正決定系數(shù)低于原始光譜模型,可能是由于原始光譜信息在經(jīng)過這兩種方法處理后,造成了部分有效信息的丟失。選用SNV預處理方法建立的模型預測性能最好,能有效提高模型的預測決定系數(shù),降低模型的預測均方根誤差,其中校正集的決定系數(shù)(RC2)、均方根誤差(RMSEC)分別為 0.967 7、0.090 1,預測集的決定系數(shù)(RP2)、均方根誤差(RMSEP)、RPD 分別為 0.942 1、0.118 2和 4.157 4,說明該模型預測性能較好,可靠性較高。
表2 武夷山蓮子含水率PLS模型的預測效果Table 2 Results of PLS for moisture content prediction based on the spectra of Wuyishan lotus seed
廣昌蓮子的蓮子含水率PLS模型的預測效果如表3所示。
表3 廣昌蓮子含水率PLS模型的預測效果Table 3 Results of PLS for moisture content prediction based on the spectra of Guangchang lotus seed
由表3可知,經(jīng)過SG預處理后的廣昌蓮子含水率PLS模型預測效果較好,其中預測決定系數(shù)提高到0.916 0,預測均方根誤差降低到0.118 1。經(jīng)SNV處理后的模型雖然提高了預測決定系數(shù),但是預測均方根誤差由0.127 4增大到0.129 7,可能是因為采集光譜時由散射光造成的誤差較小,過度處理反而增大誤差,降低了模型的可靠性。歸一化處理后的模型預測效果最差,預測決定系數(shù)降低至0.890 1,RPD值降低到3.0171,說明歸一化預處理方法對該模型的適用性較差。而經(jīng)MSC預處理的模型預測效果最好,其中校正集的決定系數(shù)與均方根誤差分別為0.945 2、0.103 0,預測集的決定系數(shù)與均方根誤差分別為0.928 6、0.118 7,RPD為3.742 7,在4種預處理方法中最高,模型最可靠。
武夷山蓮子與廣昌蓮子混合樣本含水率PLS模型的預測效果如表4所示。
表4 應用武夷山蓮子和廣昌蓮子混合樣本構建的含水率PLS模型的預測效果Table 4 Results of PLS for water content prediction based on the combined spectra of Wuyishan and Guangchang lotus seed
由表4可知,與單一品種的蓮子原始光譜建立的模型相比,兩個不同品種蓮子混合后的原始光譜建立的模型預測決定系數(shù)(RP2)提高到0.928 3,預測均方根誤差(RMSEP)減少至0.112 5,RPD值增加至3.734 3,提高了模型的準確度和可靠性。4種不同預處理方法中,MSC預處理后模型的效果最好,預測決定系數(shù)(RP2)和預測均方根誤差(RMSEP)分別為 0.945 3、0.108 3,RPD為4.275 0。說明將兩個不同品種蓮子混合后,使得模型在訓練過程加入更多的樣本信息,預測能力得到提升。
本研究利用便攜式近紅外光譜儀采集了不同干燥時間的蓮子含水率和近紅外光譜反射率實時動態(tài)變化情況。結果表明:兩種不同品種蓮子混合后,基于原始光譜建立的PLS模型預測決定系數(shù)為0.928 3,預測均方根誤差為0.112 5,RPD為3.734 3。4種不同預處理方法中,MSC預處理光譜后建立的PLS模型的效果最好,預測決定系數(shù)與預測均方根誤差分別為0.945 3、0.108 3,RPD為4.275 0。說明利用便攜式近紅外光譜儀采集蓮子光譜反射率并建立化學計量學分析模型可實現(xiàn)蓮子含水率的實時監(jiān)測,研究結果可為蓮子烘干過程含水率的快速無損檢測提供技術支持。