鞠 皓, 姜洪喆, 周宏平
(南京林業(yè)大學(xué)機(jī)械電子工程學(xué)院,南京 210037)
油料作物是指種子含有大量脂肪,可以用于提取油脂供食用或工用、醫(yī)用的作物[1]。常見(jiàn)的包括花生、大豆、油菜、芝麻等草本油料作物以及油茶、核桃等木本油料作物。我國(guó)是油料生產(chǎn)和消費(fèi)大國(guó),2019年我國(guó)油料總產(chǎn)量為6 666.0萬(wàn)t,僅食用油消費(fèi)量高達(dá)3 978.0萬(wàn)t[2]。油料產(chǎn)品含有豐富的營(yíng)養(yǎng)成分,如脂肪酸、植物甾醇、生育酚、角鯊烯等,對(duì)降低膽固醇、預(yù)防心血管疾病有重要作用[3]。隨著社會(huì)發(fā)展和生活水平的提高,人們對(duì)優(yōu)質(zhì)健康的食用油料油脂的需求越來(lái)越大,但是油料作物生產(chǎn)受氣候、環(huán)境、技術(shù)等因素的影響,而且糧油市場(chǎng)又存在制假售假等非法行為,因此油料作物及產(chǎn)品的品質(zhì)檢測(cè)不僅能夠穩(wěn)定糧油市場(chǎng)的正常秩序,還直接影響到人們的身體健康和生命安全。
目前,對(duì)油料產(chǎn)品品質(zhì)的檢測(cè)大多采用傳統(tǒng)的化學(xué)分析方法,如氣相色譜法、液相色譜法以及氣相色譜質(zhì)譜聯(lián)用法等,但該類方法不僅需要配制試劑,而且整個(gè)檢測(cè)過(guò)程操作復(fù)雜、耗時(shí)長(zhǎng)、成本高[4, 5]。與傳統(tǒng)的化學(xué)檢測(cè)方法相比,近紅外光譜、高光譜成像、拉曼光譜以及太赫茲光譜等無(wú)損檢測(cè)技術(shù),具有無(wú)需化學(xué)試劑、操作簡(jiǎn)單、耗時(shí)短等優(yōu)點(diǎn),彌補(bǔ)了傳統(tǒng)檢測(cè)方法的不足[6-10]。其中,近紅外光譜及高光譜成像技術(shù)已有大量研究證實(shí)其在油料作物及產(chǎn)品品質(zhì)無(wú)損檢測(cè)方面具有重大潛力。
為追蹤近紅外光譜及高光譜成像技術(shù)在油料產(chǎn)品品質(zhì)檢測(cè)方面的研究進(jìn)展,本研究綜述了其在油料作物理化指標(biāo)的測(cè)定、食用油真實(shí)性鑒別以及在油料作物品種識(shí)別與產(chǎn)地鑒定中的研究現(xiàn)狀,討論了其存在的優(yōu)勢(shì)及不足,并對(duì)油料產(chǎn)品品質(zhì)的近紅外光譜及高光譜成像無(wú)損檢測(cè)技術(shù)的發(fā)展前景進(jìn)行展望。
近紅外光譜(NIRS)是一種利用電磁波譜近紅外區(qū)域進(jìn)行光譜分析的方法,美國(guó)材料檢測(cè)協(xié)會(huì)(ASTM)將近紅外光譜區(qū)定義為780~2 526 nm的區(qū)域。由于近紅外光譜與有機(jī)分子中含氫官能團(tuán)(C—H、O—H、N—H、S—H)振動(dòng)的合頻以及各級(jí)倍頻的吸收一致,因此當(dāng)近紅外光照射到油料作物樣品時(shí),其基本成分(如脂肪、蛋白質(zhì)、水分等)的結(jié)構(gòu)、組成差異會(huì)使光譜在特定波長(zhǎng)上發(fā)生偏移[11-13]。近紅外光譜技術(shù)的一個(gè)重要特點(diǎn)在于其技術(shù)本身的成套性,即近紅外光譜儀、化學(xué)計(jì)量學(xué)和應(yīng)用模型的三位一體,因此通過(guò)化學(xué)計(jì)量學(xué)手段提取近紅外光譜中的有效信息并建立合理模型,能夠定性和定量地檢測(cè)油料作物的化學(xué)成分,以及實(shí)現(xiàn)食用油摻假的鑒別[14, 15]。
高光譜成像(HSI)技術(shù)結(jié)合了光譜技術(shù)快速、無(wú)損的優(yōu)點(diǎn),同時(shí)借助成像技術(shù)獲取樣品的圖像,提供詳盡的空間信息[16]。如圖1所示,典型的高光譜成像系統(tǒng)主要由鹵素?zé)艄庠础⒊上窆庾V儀、CCD相機(jī)、相機(jī)鏡頭、傳送平臺(tái)、步進(jìn)電機(jī)以及計(jì)算機(jī)硬件及軟件等組成。高光譜圖像數(shù)據(jù)采集方式有點(diǎn)掃描、線掃描以及面掃描3種,其中點(diǎn)掃描方式的精度最高,而線掃描應(yīng)用最為廣泛[17]。圖2為典型的高光譜圖像以及像素點(diǎn)光譜曲線提取示意圖,高光譜圖像是由二維空間維度(x,y)和一維光譜維度(λ)組成的三維數(shù)據(jù)立方體(x,y,λ),因此高光譜圖像也稱之為高光譜立方或者高光譜數(shù)據(jù)立方[18]。
注:1 相機(jī);2 光譜儀;3 鏡頭;4 光源;5 樣品;6 運(yùn)動(dòng)平臺(tái);7 步進(jìn)電機(jī);8 計(jì)算機(jī)。圖1 高光譜成像系統(tǒng)示意圖[19]
圖2 油茶果高光譜圖像立方體
近紅外光譜與高光譜成像的數(shù)據(jù)處理通常包括光譜數(shù)據(jù)的采集、光譜信息的預(yù)處理、特征波選取以及模型的建立與評(píng)價(jià)等步驟,其流程如圖3所示。通過(guò)Savitzky-Golay卷積平滑算法、多元散射校正(MSC)、標(biāo)準(zhǔn)正態(tài)變量變換(SNV)、導(dǎo)數(shù)算法等對(duì)原始光譜進(jìn)行預(yù)處理,消除光譜數(shù)據(jù)的無(wú)關(guān)信息和噪聲。利用連續(xù)投影算法(SPA)、無(wú)信息變量消除法(UVE)、間隔區(qū)間偏最小二乘法(iPLS)、主成分分析(PCA)等算法篩選特征波長(zhǎng)。應(yīng)用偏最小二乘回歸、逐步多元線性回歸、主成分回歸等建立定量分析模型,以及支持向量機(jī)(SVM)、線性學(xué)習(xí)機(jī)(LMD)、k-近鄰算法(KNN)等建立定性判別模型。最后借助相關(guān)系數(shù)(R)、決定系數(shù)(R2)以及均方根誤差(RMSE)等對(duì)建立的模型進(jìn)行評(píng)價(jià),通常情況下,模型預(yù)測(cè)集的均方根誤差越小,相關(guān)系數(shù)或決定系數(shù)越大,模型的性能越好[20]。
圖3 光譜分析流程圖
表1 近紅外光譜及高光譜成像技術(shù)在油料產(chǎn)品理化成分檢測(cè)中的應(yīng)用
水分、蛋白質(zhì)以及脂肪(酸)等是油料產(chǎn)品的重要營(yíng)養(yǎng)成分。近年來(lái)基于近紅外光譜以及高光譜成像的含水率、含油量、蛋白質(zhì)含量以及脂肪酸含量等理化成分的快速檢測(cè)技術(shù)得到了快速發(fā)展,并且在花生、大豆、油菜籽、油茶、橄欖以及核桃等主要油料作物中得以廣泛應(yīng)用(表1)。
這些研究表明,近紅外光譜及高光譜成像技術(shù)已廣泛應(yīng)用于油料作物常規(guī)理化成分的檢測(cè),并具有良好的預(yù)測(cè)效果。未來(lái),智能化、小型化以及便攜式光譜儀的研究和利用,將極大地有利于油料產(chǎn)業(yè)的發(fā)展。
油料作物的內(nèi)部品質(zhì)與其品種和產(chǎn)地直接相關(guān)。由于光照、土壤類型和溫濕度的差異性,不同品種和產(chǎn)地的油料作物,其所含脂肪酸等營(yíng)養(yǎng)元素的種類和數(shù)量也不盡相同。此外,隨著市場(chǎng)競(jìng)爭(zhēng)和貿(mào)易的發(fā)展,市場(chǎng)上一些非法添加、冒充名特優(yōu)產(chǎn)品等不法現(xiàn)象時(shí)有發(fā)生,嚴(yán)重侵害了消費(fèi)者的權(quán)益。因此為維護(hù)油料作物品質(zhì)及標(biāo)識(shí)信息的準(zhǔn)確性,進(jìn)行品種的識(shí)別和產(chǎn)地的鑒定顯得尤為重要。
夷娜[34]采用833~2 500 nm波段的近紅外光譜對(duì)新疆的和田、喀什和阿爾蘇3個(gè)地區(qū)的核桃進(jìn)行產(chǎn)地溯源研究,結(jié)果發(fā)現(xiàn),基于全波段的偏最小二乘判別分析(PLS-DA)模型對(duì)新疆核桃產(chǎn)地溯源的判別效果最佳,和田、喀什、阿克蘇地區(qū)預(yù)測(cè)集的判別準(zhǔn)確率均達(dá)到95%以上。田瓊等[35]采用570~1850 nm光譜范圍內(nèi)的近紅外光譜儀對(duì)來(lái)自阿根廷、巴西、烏拉圭和美國(guó)等四個(gè)國(guó)家的進(jìn)口大豆進(jìn)行光譜數(shù)據(jù)的采集,首先通過(guò)MSC、SNV、Savitzky-Golay平滑濾波等方法進(jìn)行光譜數(shù)據(jù)的預(yù)處理,然后采用主成分分析對(duì)光譜數(shù)據(jù)進(jìn)行降維,最后分別基于SVM、KNN以及ANN建立大豆產(chǎn)地的鑒別模型。結(jié)果表明,采用ANN建模的效果最好,其總體測(cè)試集準(zhǔn)確率高達(dá)95.65%。
除用于油料作物的產(chǎn)地鑒定之外,近紅外光譜和高光譜成像技術(shù)還可以對(duì)不同品種的油料進(jìn)行識(shí)別。董小玲等[36]在450~1 000 nm波段范圍內(nèi)對(duì)6種菜籽的可見(jiàn)-近紅外光譜進(jìn)行采集,通過(guò)主成分載荷曲線法提取出17個(gè)特征光譜變量,進(jìn)而建立菜籽品種的線性判別分析(LDA)模型,其誤判率僅為2.42%。鄭田甜等[37]利用600~1 100 nm波段的可見(jiàn)-近紅外反射光譜對(duì)花育20號(hào)、花育22號(hào)、花育32號(hào)等3種不同品種的花生進(jìn)行光譜信息的采集,采用小波分析對(duì)原始光譜進(jìn)行壓縮、降噪和特征提取,通過(guò)PCA進(jìn)行數(shù)據(jù)降維,以馬氏距離作為判別函數(shù)建立LDA模型,其對(duì)3種花生的平均正確識(shí)別率達(dá)到95%。馬文強(qiáng)等[38]采用傅里葉變換近紅外光譜儀,在1 042~2 632 nm波段范圍內(nèi)對(duì)4個(gè)不同品種的核桃仁進(jìn)行光譜信息采集,通過(guò)MSC和SNV方法對(duì)原始光譜進(jìn)行預(yù)處理,并基于SVM建立了核桃仁分類識(shí)別模型,結(jié)果表明其對(duì)4個(gè)核桃仁品種的總體正確識(shí)別率高達(dá)96%。
除了近紅外光譜,高光譜成像技術(shù)將傳統(tǒng)成像技術(shù)與光譜技術(shù)進(jìn)行有機(jī)結(jié)合,其圖譜合一的特點(diǎn)能在油料作物檢測(cè)時(shí)同時(shí)獲得其表面特性以及內(nèi)部品質(zhì)信息,在油料作物品種識(shí)別方面亦具有廣闊的應(yīng)用前景。Zhu等[39]采用373~1 043 nm波段范圍的高光譜成像系統(tǒng)采集了10個(gè)不同品種大豆的光譜圖像,利用Savitzky-Golay平滑、一階導(dǎo)數(shù)、標(biāo)準(zhǔn)正態(tài)變量、快速傅里葉變換(FTT)、希爾伯特變換(HT)和MSC等算法進(jìn)行光譜數(shù)據(jù)的預(yù)處理,通過(guò)競(jìng)爭(zhēng)自適應(yīng)加權(quán)算法(CARS)、SPA和PCA篩選特征波長(zhǎng),進(jìn)而分別基于貝葉斯分類器、SVM、KNN、集成學(xué)習(xí)(EL)和ANN建立大豆品種的識(shí)別模型,結(jié)果表明MSC-CARS-EL模型的識(shí)別準(zhǔn)確率最高為100%。
此外,由于糧食需求的增加,轉(zhuǎn)基因技術(shù)在作物種植中的應(yīng)用快速增長(zhǎng),但基于轉(zhuǎn)基因作物存在的安全隱患和爭(zhēng)議等現(xiàn)實(shí)問(wèn)題,許多國(guó)家對(duì)轉(zhuǎn)基因食品進(jìn)口有法律限制,必須進(jìn)行標(biāo)記,因此對(duì)轉(zhuǎn)基因與非轉(zhuǎn)基因產(chǎn)品的識(shí)別和檢測(cè)具有重要意義[40]。王海龍等[41]采用874~1 734 nm波段范圍的高光譜成像系統(tǒng)對(duì)3種不同非轉(zhuǎn)基因親本大豆及其他轉(zhuǎn)基因大豆共10個(gè)品種的光譜圖像進(jìn)行采集,通過(guò)移動(dòng)平均法(MA)進(jìn)行光譜預(yù)處理,并基于PLS-DA算法,建立3種非轉(zhuǎn)基因親本大豆的判別模型,其相應(yīng)預(yù)測(cè)集的判別準(zhǔn)確率分別為100%、96.25%和92.5%,結(jié)果表明高光譜成像技術(shù)可以有效地對(duì)非轉(zhuǎn)基因大豆進(jìn)行識(shí)別。
研究表明,在油料作物品種的識(shí)別和產(chǎn)地鑒定方面,近紅外光譜技術(shù)能夠在一定程度上提供解決方案,而高光譜成像技術(shù)則可以提供更多的形態(tài)學(xué)數(shù)據(jù),實(shí)現(xiàn)對(duì)產(chǎn)品進(jìn)行形態(tài)學(xué)分析,在一定程度上提高品種識(shí)別和產(chǎn)地鑒定的準(zhǔn)確度。
食用植物油作為油料作物的主要產(chǎn)品,是日常膳食中不可或缺的必需品之一,既可以作為烹調(diào)菜品的熱媒介質(zhì),而且還富含油酸、亞麻酸等有益于人體健康的不飽和脂肪酸[42]。由于來(lái)源植物的不同,食用植物油所含脂肪酸的數(shù)量、種類等也多種多樣,因此其營(yíng)養(yǎng)價(jià)值也存在較大差異,最直接的體現(xiàn)就是市場(chǎng)價(jià)格的差異性。不少不法廠商為了獲取更大的經(jīng)濟(jì)效益,對(duì)食用植物油進(jìn)行摻假或者以次充好,更有甚者在食用油中摻入地溝油等不可食用的油類,嚴(yán)重影響著人體健康。典型的食用油摻假行為是在高價(jià)食用油中摻入低價(jià)油,如山茶油、橄欖油中摻入菜籽油、大豆油等。還有以劣質(zhì)低等油(如混合橄欖油、橄欖果渣油)冒充優(yōu)質(zhì)油品(特級(jí)初榨橄欖油),以次充好[43]。因此,進(jìn)行食用油的摻偽檢測(cè)研究對(duì)食品安全有著重要意義。而由于近紅外光譜的定性識(shí)別特性,其可以對(duì)食用油中的摻雜、摻偽等行為進(jìn)行鑒別。表2綜述了近紅外光譜技術(shù)在食用油真實(shí)性鑒別中的應(yīng)用。
相較于近紅外光譜,高光譜成像技術(shù)由于包含了圖像信息和光譜信息,數(shù)據(jù)量大、信息冗余增加,因此在食用油的摻偽檢測(cè)方面的應(yīng)用相對(duì)較少。Simona等[51]利用高光譜成像系統(tǒng)采集了97個(gè)橄欖油樣品在340~890 nm波段的高光譜圖像,借助ANN算法建立了特級(jí)初榨橄欖油的鑒別模型,其分類準(zhǔn)確率達(dá)到97%。Zou等[52]為了鑒別紅花籽油中不同的摻假植物油,在387~1 035 nm的波段范圍內(nèi)獲取了4種紅花籽油樣品的高光譜圖像,采用L2歸一化(L2NN)、對(duì)數(shù)轉(zhuǎn)換歸一化(LTN)、中值濾波(MF)、矩形窗平滑BS)以及min-max標(biāo)準(zhǔn)化(MMS)等算法對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理,并結(jié)合CatBoost、梯度提升決策樹(shù)(GBDT)、隨機(jī)森林(RF)以及光梯度提升機(jī)(LightGBM)等算法模型對(duì)不同類型的油樣進(jìn)行預(yù)測(cè),結(jié)果表明,MF-GBDT模型對(duì)4種油樣的識(shí)別率均達(dá)到100%。
表2 近紅外光譜技術(shù)在食用油真實(shí)性鑒別中的應(yīng)用
食用油的真實(shí)性對(duì)人類健康有著極其重要的影響,而當(dāng)前食用油市場(chǎng)各種摻偽現(xiàn)象層出不窮,摻偽方式多種多樣,使得油脂的摻偽檢測(cè)成為食品安全監(jiān)控領(lǐng)域的一項(xiàng)難題,因此亟需開(kāi)發(fā)簡(jiǎn)單、快速、準(zhǔn)確的食用油摻偽檢測(cè)技術(shù)。而近紅外光譜具有較強(qiáng)的物質(zhì)穿透能力,對(duì)于各種物理狀態(tài)的樣品可不經(jīng)過(guò)任何處理直接進(jìn)行檢測(cè),具有高效、無(wú)損、綠色環(huán)保等特點(diǎn)。研究表明,近紅外光譜及高光譜成像技術(shù)可以有效地應(yīng)用于多元植物油摻偽鑒定的定性、定量分析。
盡管在油料作物及產(chǎn)品品質(zhì)檢測(cè)過(guò)程中,與強(qiáng)大的化學(xué)計(jì)量學(xué)相互結(jié)合的近紅外光譜與高光譜成像技術(shù)在油料作物理化成分測(cè)定、品種識(shí)別和產(chǎn)地鑒定以及食用油真實(shí)性鑒別等方面表現(xiàn)良好,具有巨大的應(yīng)用潛力,但在其實(shí)際應(yīng)用時(shí)仍然有一些障礙需要克服。第一,建模方式和特征波長(zhǎng)的選擇仍然需要進(jìn)行大量研究,從而最大限度地保留有效的光譜波長(zhǎng)。第二,基于特定樣本所建立的校正模型缺乏通用性和穩(wěn)定性,對(duì)于模型轉(zhuǎn)移還有待進(jìn)一步研究。第三,高光譜成像技術(shù)受制于高昂的設(shè)備成本以及緩慢的圖像處理速度,難以實(shí)現(xiàn)商業(yè)化的應(yīng)用。
近紅外光譜及高光譜成像技術(shù)在油料作物及產(chǎn)品品質(zhì)檢測(cè)的后續(xù)發(fā)展可以從幾個(gè)方面入手:
開(kāi)發(fā)更多提取特征波長(zhǎng)的算法,并基于選定的特征波長(zhǎng)建立多光譜成像系統(tǒng),得益于多光譜成像系統(tǒng)較低的設(shè)備成本和較高的處理速度,有望在工業(yè)領(lǐng)域得以廣泛應(yīng)用。
改進(jìn)高光譜圖像的處理算法,進(jìn)一步提高其計(jì)算和分析圖像的能力,使得該技術(shù)能快速、準(zhǔn)確地確定油料產(chǎn)品中的理化成分。
開(kāi)發(fā)建立用于油料作物及產(chǎn)品品質(zhì)分析的商業(yè)化、通用型的光譜模型數(shù)據(jù)庫(kù),并對(duì)其進(jìn)行定期的維護(hù)和升級(jí),從而避免針對(duì)同一應(yīng)用點(diǎn)的模型進(jìn)行重復(fù)開(kāi)發(fā),提高其利用率和穩(wěn)健性。
利用遷移學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等算法,開(kāi)發(fā)具有高穩(wěn)定性和精確度的模型更新與傳遞技術(shù),增強(qiáng)模型的通用性。
應(yīng)著重發(fā)展小型化和便攜化的近紅外光譜設(shè)備。未來(lái),隨著5G通信、云平臺(tái)以及深度學(xué)習(xí)等技術(shù)的發(fā)展,基于物聯(lián)網(wǎng)和大數(shù)據(jù)建立光譜數(shù)據(jù)的云端處理系統(tǒng),開(kāi)發(fā)出基于智能手機(jī)的便攜式近紅外設(shè)備將極大地便利用戶對(duì)市場(chǎng)、超市中的油料作物及產(chǎn)品進(jìn)行實(shí)時(shí)檢測(cè)。