汪志強 李大鵬 劉 強 廖舒懷 易宗霈
(中南林業(yè)科技大學(xué)機電工程學(xué)院,湖南 長沙 410004)
油茶是一種營養(yǎng)價值豐富的油料作物[1],近年來其種植面積和規(guī)模不斷擴大[2]。水分對油茶籽干燥時和干燥后影響較大,是一個重要的評價參數(shù)[3]。研究[4]表明,干燥時,水分含量會影響油茶籽干燥品質(zhì)和能耗。同時,在茶油加工步驟中,干燥是第一步工序,水分含量是干燥時要控制的參數(shù);干燥后,水分含量仍會影響油茶籽的貯藏[5]。目前,常用的茶籽水分含量測定方法主要為烘干法,但該法效率低下、耗時耗力[6]。
近年來,利用光譜技術(shù)檢測農(nóng)產(chǎn)品中含油率及含水率、鑒偽等具有快速分析、無損檢測,以及無需樣品準(zhǔn)備等優(yōu)點。周宏平等[7]利用高光譜技術(shù)實現(xiàn)了對油茶籽含油率的無損檢測,利用兩組采集到的漫反射高光譜圖像,結(jié)合化學(xué)方法成功建立了含油率的回歸預(yù)測模型。彭彥昆等[8]通過近紅外光譜法設(shè)計了豬肉水分在線檢測分級系統(tǒng),能夠在線準(zhǔn)確預(yù)測豬肉水分,判斷準(zhǔn)確率達(dá)90%以上。郭文川等[9]利用近紅外光譜檢測油茶籽油的摻偽,對摻偽質(zhì)量分?jǐn)?shù)不低于3%的摻偽油茶籽油的識別準(zhǔn)確率達(dá)100%。Melfsen等[10]用漫反射近紅外光譜法估測了牛奶中脂肪酸含量,最終預(yù)測準(zhǔn)確率達(dá)92%以上。Elsohaby等[11]利用紅外光譜和偏最小二乘回歸預(yù)測了奶牛和肉牛初乳免疫球蛋白G濃度,平均相對誤差為5%。
然而,近紅外光譜檢測方法測得的光譜極易受溫度、樣品種類等因素影響,其中,溫度是最常見的影響因素[12]。分子間的內(nèi)力受溫度影響產(chǎn)生變化,主要表現(xiàn)為光譜振動變化。油茶籽水分中含有O—H鍵,在干燥時,油茶籽表面溫度的不同會影響水分子的振動變化,導(dǎo)致O—H基團對可見/近紅外光譜的吸收波段以及強度發(fā)生變化[13],因此需要修正溫度變化對光譜檢測的影響。
目前,有關(guān)溫度影響可見/近紅外光譜檢測油茶籽含水率的相關(guān)研究尚未見報道。研究擬以不同溫度下干燥的油茶籽為研究對象,提出一種改進的溫度修正模型,解決可見/近紅外光譜檢測時結(jié)果受溫度影響的問題,為采用可見/近紅外光譜檢測干燥過程中油茶籽含水率時消除溫度的影響提供依據(jù)。
1.1.1 材料
油茶籽:選擇新鮮的油茶果360個(平均分為3部分,依次于50,60,70 ℃下進行試驗),去殼,隨機選取360粒顆粒飽滿、大小均勻、無缺陷、單粒均重4 g 的油茶籽樣品,收集其光譜數(shù)據(jù),湖南雪峰山茶油專業(yè)合作社。
1.1.2 主要儀器設(shè)備
光源:HL-1000型,功率為5 W的鹵素光源,上海聞奕光電科技有限公司;
光譜儀:Maya2000 Pro型,波長范圍為199~1 113 nm,使用Y型光纖連接光源和光譜儀,美國Oceanoptics公司;
烘干箱:XGQ-2000型,浙江力辰儀器有限公司;
精密電子天平:JY/YP11003型,浙江力辰科技制造有限公司。
使用自行設(shè)計的光譜平臺采集光譜數(shù)據(jù)(圖1),該系統(tǒng)包括光源、光譜儀、Y型光纖、電腦、置物臺、支架、暗箱。每次采集前為了消除誤差,需進行光譜黑白校正,校正方法[14]:
(1)
式中:
R——油茶籽的反射率;
A——校正前樣本原始的反射數(shù)據(jù);
C——標(biāo)準(zhǔn)白板的參考反射光譜數(shù)據(jù);
D——標(biāo)準(zhǔn)黑板的參考反射光譜數(shù)據(jù)。
先將漫反射標(biāo)準(zhǔn)白板(反射率99%)放置在密閉暗箱中(黑暗環(huán)境),光纖探頭垂直于白板,在其正上方3 cm 處,收集校正的光譜信息;取出烘干箱中的油茶籽,置于光纖探頭正下方2~3 cm 處收集原始反射光譜數(shù)據(jù)。
對每一部分的120粒油茶籽隨機依次編號,分為10組。測量時,先將全部油茶籽放入烘干箱中,依次于50,60,70 ℃下烘干。烘干時,每隔1 h取出一組進行光譜測量,迅速采集光譜數(shù)據(jù),以免溫度下降,模擬干燥時的溫度;為使光譜數(shù)據(jù)與含水率對應(yīng)更準(zhǔn)確,在采集光譜數(shù)據(jù)后,用天平稱重并記錄相應(yīng)數(shù)據(jù),完成一組數(shù)據(jù)收集。1 h后重復(fù)操作直至10 h后全部采集完畢,得到120個包含不同含水率的光譜數(shù)據(jù)。
光譜數(shù)據(jù)由其自帶的軟件讀取,用Microsoft Excel 2019記錄,采用MATLAB 2019 b、Python 3.9軟件處理數(shù)據(jù)。
1. 光譜儀 2. 電腦 3. 光源 4. Y型光纖 5. 暗箱 6. 置物臺 7. 油茶籽 8. 支架 9. 光纖探頭
按GB 5009.3—2016中的直接干燥法測量油茶籽含水率。
采用SPXY算法將每一溫度下的全部樣品劃分為校正集與預(yù)測集,比例為3∶1,用90份樣品建模,其余30份樣品以預(yù)測的方式來建立合適的模型。
為了減少誤差,剔除光譜數(shù)據(jù)中的無用信息,為了提高模型精度和預(yù)測效果,需對原始反射數(shù)據(jù)(RAW)進行預(yù)處理[15]。選取的預(yù)處理方法有多元散射校正(MSC)、標(biāo)準(zhǔn)正態(tài)變量變換(SNV)和標(biāo)準(zhǔn)化縮放(Au)。其中MSC可以消除散射影響,增強采集的光譜和數(shù)據(jù)之間的關(guān)聯(lián);SNV可以消除因為顆粒大小、表面散射對光譜的影響;Au能夠消除因數(shù)據(jù)差異過大產(chǎn)生的誤差[16]。
采用競爭性自適應(yīng)重加權(quán)算法(CARS)[17]來消除因為光譜數(shù)據(jù)量大導(dǎo)致運行速度慢、誤差大、建模效果不理想的缺點,從而選取合適的特征波長建模。
建模方法為偏最小二乘回歸法(PLSR)[18],該方法具有運行速度快,能夠同時考慮光譜信息和相應(yīng)的理化性質(zhì),從而避免信息缺失的優(yōu)點。
表1 RPD值范圍與其對應(yīng)的含義
分別按式(2)~式(4)計算模型的R2、RMSE和RPD值。
(2)
(3)
(4)
式中:
yai——第i個樣本的預(yù)測值,g/g濕基;
yi——第i個樣本的真實值,g/g濕基;
n——樣本數(shù)。
采用斜率/偏差法(S/B)對溫度進行修正,以Ta溫度下建立的模型來預(yù)測Tb溫度下的含水率為例,說明溫度修正的方法。分別建立Ta溫度下的光譜矩陣Xa,Tb溫度下的光譜矩陣Xb,用Xa和其對應(yīng)的含水率真實值矩陣Ma建立模型N,將Xb代入模型N中預(yù)測Tb溫度下的含水率矩陣Mb。假設(shè)Ta溫度下的含水率真實值矩陣Ma和Tb溫度下的含水率矩陣Mb存在如式(5)所示的關(guān)系式[20]。
Ma=B+S×Mb,
(5)
式中:
Mb——修正前Tb溫度下的含水率預(yù)測值,g/g濕基;
Ma——Ta溫度下樣品含水率的真實值,g/g濕基。
(6)
式中:
選用的光譜儀波長范圍為199~1 113 nm,其中199~780 nm屬于可見光范圍,780~1 113 nm屬于近紅外范圍。以60 ℃下采集的油茶籽原始反射光譜為例分析,全波段光譜如圖2所示,為了消除噪音和誤差,有效提取光譜信息,需去除光譜首尾兩端波段,選擇波長范圍為400~1 000 nm,總計1 366個波長點。
由圖2可知,波長為400~1 000 nm時,曲線逐漸上升,反射率逐漸變大,420 nm處出現(xiàn)一個吸收峰,與索雷特吸收有關(guān)[21];960~980 nm附近出現(xiàn)平臺區(qū),形成一個弱吸收峰,是由油茶籽中O—H基團的第二泛頻所導(dǎo)致的[22]。
圖2 60 ℃下采集的油茶籽原始反射光譜圖
試驗發(fā)現(xiàn),不同含水率下溫度對光譜曲線均會產(chǎn)生明顯影響。由于獲取的油茶籽含水率分布范圍較廣(1%~60%),為了更清晰地表明溫度對光譜曲線的影響,以最高含水率范圍(60±1)%內(nèi)的光譜數(shù)據(jù)平均值為例來進行說明。
由圖3可知,同一含水率不同溫度下的光譜曲線雖然走勢一樣,但其高低不一致。其中70 ℃對應(yīng)的光譜曲線最高,而60 ℃對應(yīng)的光譜曲線開始時高于50 ℃的,在650 nm 處變?yōu)樽畹?,之后又逐漸升高,并高于50 ℃的。
圖3 原始光譜曲線和曲線之差比較
為了更明確說明溫度對光譜曲線的影響,以60 ℃下的光譜數(shù)據(jù)建立基準(zhǔn)模型,因此以60 ℃對應(yīng)的光譜曲線為0基準(zhǔn),將50,70 ℃的光譜曲線與60 ℃的進行差值計算,獲得對比曲線。70 ℃對應(yīng)的光譜曲線與60 ℃的光譜曲線反射率之差為正值,表明在該區(qū)域內(nèi)溫度的升高使油茶籽對光譜的反射越來越強,使光譜接收到的信息變多。50 ℃對應(yīng)的光譜曲線先為負(fù)后為正之后又為負(fù),表明其反射強度先小于后大于之后又小于60 ℃對應(yīng)的光譜曲線。
綜上,溫度對光譜曲線產(chǎn)生了明顯影響,是由于溫度變化會影響O—H鍵的振動頻率,進而改變反射率[13]。因此建立油茶籽含水率預(yù)測模型時需要考慮溫度的影響。
以60 ℃下90個校正集樣本作為建模集,其余30個樣本進行預(yù)測,采用MSC、SNV、Au對其原始光譜(RAW)進行預(yù)處理后再進行PLSR建模,結(jié)果見表2。
表2 60 ℃下反射率建模結(jié)果
將50,70 ℃的校正集樣本代入基準(zhǔn)模型中建模,預(yù)測含水率值,結(jié)果如圖4所示。由圖4可知,當(dāng)溫度低于60 ℃時,預(yù)測值偏高;當(dāng)溫度高于60 ℃時,預(yù)測值偏低。
將50,70 ℃下的含水率預(yù)測值與真實值進行回歸分析,得到回歸方程:
M60=1.036M50-5.492,
(7)
M60=1.122M70+3.226。
(8)
由回歸方程可知,50,70 ℃下修正斜率分別為1.036和1.122;偏差分別為-5.492和3.226。
修正前,將50,70 ℃下的預(yù)測集代入基準(zhǔn)模型中,結(jié)果見表3,其RPD值均<2.5,說明預(yù)測結(jié)果較差,精度較低。
用預(yù)測集的30個樣本來評價模型修正結(jié)果,用基準(zhǔn)模型來預(yù)測各溫度下的含水率,將預(yù)測值矩陣、斜率和偏差代入式(6)中進行修正,得到各溫度下含水率的修正值,修正后的結(jié)果見表3。由表3可知,50,70 ℃下的RPD值均>2.5,優(yōu)于修正前的結(jié)果,達(dá)到了良好的預(yù)測精度;而60 ℃下的RPD值雖有所降低,但仍>2.5,可以滿足預(yù)測需要,下降原因可能是預(yù)測時出現(xiàn)過擬合。
圖4 50 ℃和70 ℃樣本建模結(jié)果
表3 各溫度下修正前與修正后結(jié)果比較
觀察式(7)、式(8)和其余回歸方程可知,斜率接近于1,其對預(yù)測值的偏差近似為線性關(guān)系。試驗溫度以60 ℃ 為基準(zhǔn)模型,10 ℃為梯度,每上升或下降一個梯度,計算出其偏差約等于4.359。因此,任意溫度下的修正方程擬合為
(9)
式中:
T——樣品溫度,50~70 ℃。
陸錫昆等[23]利用高光譜技術(shù)檢測油茶籽含水率,其經(jīng)過MSC預(yù)處理建立的PLSR模型的Rp值達(dá)0.939,與試驗結(jié)果類似,但是其利用太陽進行自然烘干來獲取不同的含水率樣品,未研究溫度對光譜的影響,因此其模型可能不適用于干燥時的油茶籽含水率在線檢測。
為了解決干燥時溫度對可見/近紅外光譜技術(shù)檢測油茶籽含水率的影響,分別于50,60,70 ℃下進行相關(guān)干燥試驗。結(jié)果表明,以60 ℃下校正集建立基準(zhǔn)偏最小二乘回歸法模型,對比3種預(yù)處理方式,得到其相對最佳的預(yù)處理方式為多元散射校正處理;同時為了進一步提高模型精度,經(jīng)競爭性自適應(yīng)重加權(quán)算法處理,其預(yù)測集決定系數(shù)、預(yù)測集均方根誤差以及相對分析誤差分別為0.909、3.102%和3.315。用60 ℃下的基準(zhǔn)偏最小二乘回歸法模型來預(yù)測50,70 ℃下的含水率值,由預(yù)測值與真實值計算出斜率和偏差,采用斜率/偏差法計算出預(yù)測集修正后的預(yù)測值,精度明顯提高,相對分析誤差均>2.5,可用于一般性的預(yù)測。同時由單個溫度修正模型分析得到50~70 ℃范圍內(nèi),任意溫度下模型預(yù)測值的修正公式。綜上,斜率/偏差法能夠解決干燥時溫度對油茶籽含水率在線檢測的影響問題。后續(xù)可在多個溫度下進行試驗,以使模型精度更高,應(yīng)用范圍更廣。