孫曉榮, 王賦騰, 劉翠玲, 張 穎, 付新鑫
目前常用的小麥粉水分含量測定方法均為有損檢測,存在操作繁瑣、耗時長、測定時間不易掌控、易受外界因素干擾等缺點,無法滿足小麥粉行業(yè)快速、準確的檢測要求[1,2]。
近紅外光譜分析技術(shù)是近年來快速發(fā)展的一種快速無損檢測技術(shù),該技術(shù)結(jié)合化學(xué)計量學(xué)和計算機高速處理技術(shù)的特點,具有快速、高效、取樣簡單、無污染等優(yōu)點,已經(jīng)廣泛應(yīng)用于多個檢測領(lǐng)域[3,4]。隨著近紅外在線檢測技術(shù)的飛速發(fā)展,近紅外光譜儀也變得越來越精細靈巧。MicroNir—2200近紅外光譜儀將光源、檢測器、分光系統(tǒng)集中于一個微型探頭中,具有體積小、易攜帶、操作簡便、易控制、測量時間短等優(yōu)點,能更實時準確掃描樣品光譜,檢測過程省時簡便[5]。
本文采用MicroNir—2200采集小麥粉近紅外光譜數(shù)據(jù),采用建模軟件Unscramble 9.7建立了小麥粉水分含量近紅外偏最小二乘(partial least square,PLS)校正模型,并利用內(nèi)部交叉驗證和外部預(yù)測集驗證了模型的預(yù)測精度。
1)面粉樣品169個,來源于北京古船食品有限公司。
2)MicroNir—2200,檢測波長范圍為1 150~2 150 nm,光譜采樣間隔8.1 nm,共125個波長點。
1)化學(xué)值測定
按照直接干燥法(GB 5009.3—2010)測定水分含量[6]。原理為利用食品中水分的物理性質(zhì),在101.3 kPa,101~105 ℃下采用揮發(fā)方法測定樣品中干燥后所減失的重量,同時測定吸濕水、部分結(jié)晶水和此條件下能揮發(fā)的物質(zhì)的重量,通過干燥前后的稱量數(shù)值計算出水分的含量。
2)近紅外光譜采集
面粉樣品裝于密封的樣品袋,打開MicroNir—2200近紅外光譜儀光源,待儀器溫度達到穩(wěn)定工作溫度(37~37.8 ℃)后開始掃描樣品。掃描光譜時參數(shù)設(shè)置為單次積分時間5 100 μs,積分次數(shù)100次,光譜掃描間隔為1 s。光譜掃描時將探頭緊貼在光滑的樣品袋表面,連續(xù)掃描5次,每次掃描的不同位置。
3)光譜數(shù)據(jù)處理
對每個樣品多次掃描的光譜求取平均值得到最終建模樣品光譜集;采用樣本選擇方法SPXY算法將樣品光譜劃分為建模集和預(yù)測集,選取20個樣品作為預(yù)測集。
建立近紅外光譜定量模型時,選取的建模集樣品應(yīng)具有代表性,組分濃度在整個范圍內(nèi)盡可能分布均勻,建模集組分濃度變化范圍應(yīng)包括預(yù)測集組分濃度變化范圍[7]。實驗選取的樣品水分的濃度范圍為12.9 %~14.9 %,平均濃度為14.1 %,相對標準差為0.38,滿足建立近紅外光譜定量預(yù)測模型的基本要求。
建模集光譜圖如圖1所示。近紅外光譜的吸收譜帶主要為有機分子含氫基團(C—H,N—H,O—H等)伸縮振動的各級倍頻以及合頻形成。從圖1中可以看出小麥粉的近紅外光譜中含有豐富的化學(xué)官能團信息,幾乎能反映有機物的所有含氫基團的信息,能夠反映出分子的結(jié)構(gòu)和組成狀態(tài),因此,可通過近紅外光譜對有機物樣本進行定量分析[8]。
圖1 小麥粉樣品近紅外光譜
2.3.1 最佳預(yù)處理方法
對比研究了不同預(yù)處理方法對預(yù)測模型效果的影響,如表1,并最終得到實驗最佳預(yù)測模型。
表1 不同預(yù)處理方法建立小麥粉水分含量近紅外預(yù)測模型
實驗選取主成分數(shù)、決定系數(shù)(R-square)、校正均方根誤差(root mean square error of calibration,RMSEC)、交叉驗證均方根誤差(root mean square error of cross verification,RMSECV)、預(yù)測均方根誤差(root mean square error of prediction,RMSEP)5個參數(shù)綜合評價模型的性能。其中R-square表示實際值和預(yù)測值之間的關(guān)系;RMSECV為確定維數(shù)和最優(yōu)校正模型主要依據(jù),其值越小模型越精確;RMSEP用于驗證模型的精度,數(shù)值越小說明模型外部預(yù)測能力越高;RMSEC,RMSECV,RMSEP三者具有一定的數(shù)值大小關(guān)系,RMSEC一定小于RMSECV,但兩者不應(yīng)差異太大,否則說明選取的樣品代表性不好或者表示模型信息提取不充分[9~11]。綜合分析表1中的數(shù)據(jù)可知:當(dāng)采用一階導(dǎo)數(shù)和Savitsky-Golay(S-G)濾波平滑對光譜進行預(yù)處理時所建模型效果最好,與其他模型相比其RMSECV最小,說明模型精度最高,RMSECV略高于RMSEC且RMSEP略高于RMSECV,說明模型所選建模集和預(yù)測集具有代表性,模型擬合度高,R-square較高說明預(yù)測值與真實值比較接近;其主因子數(shù)為5,決定系數(shù)為0.929,校正均方根誤差為0.111,交叉驗證均方根誤差為0.126,預(yù)測均方根誤差為0.154。圖2為原始光譜采用一階導(dǎo)數(shù)和S-G平滑濾波后的光譜。
圖2 光譜經(jīng)過一階導(dǎo)數(shù)和S-G濾波平滑后光譜
2.3.2 近紅外校正模型的分析和驗證
實驗采用unscramble 軟件建立近紅外PLS校正模型,同時采用交叉驗證法和外部預(yù)測集評價模型的性能。由一階導(dǎo)+S-G(7 points)建立模型,如圖3~圖6。其中圖3為主成分分析散點圖,代表選取建模樣本集是否合適,大部分樣本點應(yīng)接近坐標軸且均勻分布。圖3中X軸表示樣本與第一主成分的相關(guān)系數(shù),Y軸表示樣本與第二主成分的相關(guān)系數(shù),各個點的位置代表各樣本的主成分綜合得分大小,得分點與某一坐標軸越接近說明與相應(yīng)的主成分越相關(guān);圖3中長軸為X軸,說明第一主成分反映出原始數(shù)據(jù)較多的信息??芍獙嶒炦x取樣本較合適,但有小部分點遠離坐標軸,此類點在一定情況下可當(dāng)作異常點剔除,但剔除前應(yīng)綜合考慮此類點是否具有代表性或唯一性,避免誤刪。圖4為所建模型的回歸系數(shù),代表所測光譜的各個波長區(qū)間光譜信息與小麥粉中水分含量的相關(guān)性,可以確定波長區(qū)間與小麥粉水分含量的信息相關(guān)度,為信息的進一步篩選提供了依據(jù)。圖4中縱坐標數(shù)值代表因變量相關(guān)性大小,因變量Y大于0說明此區(qū)間信息與水分成正相關(guān),區(qū)間內(nèi)蘊含大量與水分正相關(guān)的信息。從圖4可知1 190~1 250 nm波長區(qū)間光譜信息與水分呈正相關(guān),而1 640~1 690 nm波長區(qū)間光譜信息與水分呈負相關(guān)。圖5為剩余驗證方差,表示因變量Y的方差與主因子數(shù)的關(guān)系,預(yù)測方差的基本趨勢隨主因子數(shù)的增加而減少,一般情況下,剩余方差曲線趨于平緩的第一個因子數(shù)與模型最佳主因子數(shù)相等,從圖5中可看出,模型最佳主因子數(shù)為5。圖6為近紅外校正模型真實值和內(nèi)部交叉驗證預(yù)測值散點圖,由圖6可以樣本的真實值和內(nèi)部校正預(yù)測值很接近,決定系數(shù)較高,校正均方根誤差和交叉驗證均方根誤差較小,說明模型的內(nèi)部預(yù)測效果好。
模型建立后,利用外部校驗的方法驗證前述最優(yōu)校正模型的性能,預(yù)測樣品集數(shù)目為20,預(yù)測均方根誤差為0.154,偏差為0.017,表明:最優(yōu)校正模型擬合度好,預(yù)測誤差小,能很好地預(yù)測未知小麥粉樣本的水分含量。
圖3 主成分分析
圖4 回歸系數(shù)
圖5 剩余驗證方差
圖6 小麥粉水分含量近紅外校正模型
2.3.3 實驗結(jié)果分析
由表1可知實驗評定的最佳預(yù)處理方法為一階導(dǎo)數(shù)結(jié)合S-G濾波平滑的方式,說明MicroNir—2200長時間工作會產(chǎn)生一定的基線平移現(xiàn)象,而且光譜采集時產(chǎn)生了一定的噪聲。從表1的數(shù)據(jù)可知,大部分的預(yù)測模型內(nèi)部驗證結(jié)果和外部驗證結(jié)果基本一致,即RMSEP略大于RMSECV,但是采用多元散射校正+一階導(dǎo)+S-G濾波平滑或多元散射校正+基線+矢量歸一化預(yù)處理方法時,所建模型RMSEP遠大于RMSECV,預(yù)測效果很差,可能的原因是建模采用的預(yù)處理方法過多,過多的預(yù)處理方法導(dǎo)致了信號的缺失,再進行外部預(yù)測時反而預(yù)測效果很差。
本實驗采用MicroNir—2200掃描小麥粉樣品的近紅外光譜,采用Unscramble軟件建立基于偏最小二乘法的小麥粉水分含量近紅外光譜校正模型。結(jié)果表明:所建小麥粉水分含量近紅外模型具有較好的準確性和穩(wěn)定性,可應(yīng)用于小麥粉水分含量的快速檢測及質(zhì)量控制,結(jié)果準確可靠,該研究為下一步建立小麥粉的在線快速檢測水分含量提供扎實的理論研究基礎(chǔ)和分析模型。
后續(xù)研究應(yīng)加入更多不同品種的小麥粉以及增強樣本的代表性,選取實驗樣本時應(yīng)盡可能在整個濃度范圍內(nèi)均勻分布,提高實驗操作精度以達到同時提高模型的穩(wěn)健性和適用范圍。
參考文獻:
[1] 閆李慧,王金水,金華麗,等.基于近紅外光譜技術(shù)的面粉水分無損檢測模型的建立[J].現(xiàn)代食品科技,2011,27(2):235-238.
[2] 吳靜珠,劉 倩,陳 巖,等.基于近紅外與高光譜技術(shù)的小麥種子多指標檢測方法[J].傳感器與微系統(tǒng),2016,35(7):42-44.
[3] 耿 姝,陳 勇,金 葉,等.基于近紅外技術(shù)的金銀花藥材多指標成分快速檢測[J].中國現(xiàn)代應(yīng)用藥學(xué),2016,33(2):144-150.
[4] 張玉華,孟 一,張應(yīng)龍,等.近紅外光譜技術(shù)在食品安全領(lǐng)域應(yīng)用研究進展[J].食品科技,2012(10):283-286.
[5] 馮 幫,陳 斌,顏 輝.便攜式近紅外光譜檢測系統(tǒng)的開發(fā)[J].現(xiàn)代儀器與醫(yī)療,2014(2):12-16.
[6] 國家標準化管理委員會.GB 5009.3—2010食品中水分的測定[S].北京:中國標準出版社,2010.
[7] 金華麗,卞 科.近紅外光譜法檢測小麥粉中的水分含量[J].中國糧油學(xué)報,2010,25(8):109-112.
[8] 劉翠玲,胡玉君,孫曉榮,等.基于近紅外光譜技術(shù)的小麥粉灰分含量檢測方法研究[J].糧油食品科技,2015,23(6):76-79.
[9] 周照艷,岳 勇,王 濤,等.PLS因子數(shù)對定量模型性能穩(wěn)定性的影響分析[J].計算機工程與設(shè)計,2014(5):1788-1791.
[10] 吳靜珠,吳勝男,劉翠玲,等.近紅外和高光譜技術(shù)用于小麥籽粒蛋白含量預(yù)測探索[J].傳感器與微系統(tǒng),2013,32(2):60-62.
[11] 王寧寧,申兵輝,關(guān)建軍,等.近紅外光譜分析技術(shù)識別奶粉中淀粉摻假的研究[J].光譜學(xué)與光譜分析,2015,35(8):141-146.