曹錫磊 陳琦 杜湘婷
摘? 要:基于光譜儀、可見光以及數(shù)據(jù)回歸分析,設(shè)計了實驗光路進行了蘋果的糖度分析。光譜儀選用海洋光學的光譜儀,采用了200 nm至1 000 nm的白光光源進行實驗,數(shù)據(jù)采用了PLSR算法進行回歸分析,采用紅富士進行實驗,通過標準光譜儀預實驗獲取對糖度較為敏感的波長,發(fā)現(xiàn)在570 nm、682 nm出現(xiàn)了吸收峰,并使用PLSR算法進行回歸分析,實驗結(jié)果顯示相關(guān)系數(shù)r達到了0.721,可以證明其有預測效果。
關(guān)鍵詞:可見光;蘋果糖度;回歸分析
中圖分類號:TS255.7? ? ? ? ? ? ? ? 文獻標識碼:A文章編號:2096-4706(2021)20-0131-04
Experiment of Apple Sugar Content Detection Based on Visible Light Regression Analysis
CAO Xilei, CHEN Qi, DU Xiangting
(Fujian Normal University, Fuzhou 350117, China)
Abstract: Based on spectrometer, visible light and data regression analysis, an experimental light path is designed to analyze the sugar content of apple. The spectrometer is a Marine Optics spectrometer, and the white light source from 200 nm to 1 000 nm is used for the experiment, data are regressed and analyzed by PLSR algorithm, Red Fuji apple is used for the experiment, the wavelength sensitive to sugar is obtained through the pre experiment of standard spectrometer. It is found that there are absorption peaks at 570 nm and 682 nm, and the regression analysis is carried out by PLSR algorithm. The experimental results show that the correlation coefficient r reaches 0.721, which can prove it has reached prediction effect.
Keywords: visible light; apple sugar content; regression analysis
0? 引? 言
農(nóng)產(chǎn)品作為副食,已經(jīng)成為人類補充營養(yǎng)的重要來源之一,在這些農(nóng)產(chǎn)品中,諸如蘋果、香蕉等水果含有著極其豐富的營養(yǎng)。隨著經(jīng)濟的發(fā)展,人們的生活水平在不斷地提高,與此同時,人們對副食的需求量及其質(zhì)量要求也在不斷提高,目前我國水果行業(yè)不斷地發(fā)展,規(guī)模在不斷的擴大,已經(jīng)成為產(chǎn)值達萬億級的產(chǎn)業(yè)。相較于全球而言,我國水果消費量極高,目前已經(jīng)是水果消費大國,行業(yè)規(guī)模極大,水果產(chǎn)業(yè)對我國GDP有著巨大貢獻,截至2018年,水果行業(yè)的市場規(guī)模達到了約兩萬億元。在產(chǎn)量上,2018年我國水果產(chǎn)量就已接近3億噸,穩(wěn)居世界第一[1]。因此對于農(nóng)產(chǎn)品的質(zhì)量檢測就成為一個十分值得探究的課題。
隨著我國人民生活質(zhì)量的提高,對于食品質(zhì)量的檢測要求也隨之增高,據(jù)調(diào)查,目前市場主流糖度檢測為有損檢測,對于需要無損檢測的應(yīng)用場景有著致命缺陷,有損檢測技術(shù)逐漸無法滿足于當代人們對于食品質(zhì)量檢測的需求,在不破壞水果的前提下,依靠人的主觀判斷水果品質(zhì)顯然不夠穩(wěn)定,且費時費力。
國內(nèi)外主流的無損檢測多研究的是近紅外光譜,由于智能手機的攝像頭無法獲取此波段的光譜,這使得主流無損檢測技術(shù)難以運用于智能手機,在農(nóng)產(chǎn)品的無損檢測中對于可見光方面的研究十分不足。
相較于近紅外光譜,可見光對光柵的要求較低,比較容易獲得光譜,且使用可見光作為光源可以節(jié)約成本,功率較低,節(jié)能環(huán)保。實驗采用了蘋果進行糖度檢測,由于蘋果內(nèi)部不同成分對不同波長的光吸收程度的不同,通過分析蘋果表面反射的光線可以在保證蘋果不受損傷的前提下對蘋果的糖度進行預測。
1? 理論部分
1.1? PLSR算法
PLSR算法(Partial least squares regression),其全稱為偏最小二乘回歸算法,是一種基于多因變量Y對多自變量X回歸建模方法,其中,將糖度與吸光度進行回歸分析,PLSR算法在回歸分析的過程中,不僅僅對單一變量進行分析,而是綜合考慮了自變量與因變量主成分之間的相關(guān)性[2]。
PLSR算法的原理為設(shè)多個因變量yi以及多個自變量xb,通過觀測n個樣本點來研究自變量以及因變量的統(tǒng)計關(guān)系,即波長對應(yīng)的強度與糖度有關(guān)成分的相關(guān)程度,以此建立自變量與因變量的統(tǒng)計數(shù)據(jù)列表{x1…xi}、{y1…yb},令t1為自變量數(shù)據(jù)表線性組合中的成分,對應(yīng)u1為因變量數(shù)據(jù)表線性組合的成分,在為回歸分析提取成分時需滿足兩個條件:
(1)自變量與因變量中所提取的成分應(yīng)攜帶其數(shù)據(jù)表中的變異信息。
(2)自變量與因變量中所提取的成分應(yīng)盡可能相關(guān)。
提取出自變量和因變量的成分之后,PLSR算法實施對自變量提取成分的回歸分析,同時進行因變量提取成分的回歸。若得到的回歸分析方程即吸光度和糖度之間可以達到一個滿意的擬合度,則算法運算將被終止,否則,算法將獲取X對自變量提取成分解釋后的剩余信息,同時取Y對因變量提取成分解釋后的剩余信息進行第二輪的成分提取。這個過程將會一直持續(xù)到能達到一個較滿意的精度,之后運算終止。若最終對自變量共提取m個成分,偏最小二乘回歸將通過實施對應(yīng)的提取m個因變量成分,然后再表達成yk關(guān)于原變量x1,x2,…,xi的回歸方程。在對吸光度與糖度的回歸分析中可以得到一整套每個波長對應(yīng)糖度相關(guān)程度的回歸分析模型。
1.2? 剔除離群點
在建立可見光譜模型時,將實驗所取得的樣品集分為兩個部分,分別為訓練用的校正集以及驗證用的預測集兩部分,用校正集的樣本進行回歸分析模型的構(gòu)建,當能找到一套回歸模型后使用其來預測預測集的樣本,通過比較通過模型擬合出的預測值與使用標準量具記錄的真實值之間的差異,來判斷模型預測性能的好壞。RMSEC和RMSEP是預測值與其真實值之間的誤差平方和和均方根值。RMSEC和RMSEP由以下公式計算:
2? 實驗部分
2.1? 儀器設(shè)備
光譜儀采用了海洋光學的光譜儀(USB 4000,Ocean Optics Inc.U.S.)、波長范圍為200 nm ~ 1 045 nm的白光光源、抬升裝置以及傳輸用光纖探頭。使用配套的SpectraSuite軟件連接光譜儀收集數(shù)據(jù),標準糖度儀采用速為(SWEVY)手持式折光儀糖分測量儀。算法方面采用The Unscrambler X軟件中內(nèi)置的PLSR算法進行回歸分析。
2.2? 實驗方法與步驟
實驗場地使用遮光布進行暗環(huán)境的搭建,讓光纖探頭以固定距離傾斜對準蘋果赤道,電腦連接海洋光學的光譜儀準備隨時獲取光譜數(shù)據(jù)并進行記錄保存,控制探頭與蘋果距離,盡量選擇光滑處進行實驗,如圖1所示,以排除因表面凹凸不平導致的錯誤數(shù)據(jù),對每個照射點進行標記并使用標準量具進行真實值獲取[4]。
具體步驟如下:
(1)選用蘋果種類為紅富士,光源、光譜儀通過光纖相互連接,連接運行時注意保持光纖順暢以避免傳輸過程中受到影響,光纖探頭放置于蘋果正上方約2 cm的距離然后固定。
(2)取下蘋果并將白板置于探頭下2 cm處,拉上遮光布避免環(huán)境光影響,通過電腦記錄基準白板的光譜數(shù)據(jù)。實驗每更換一種蘋果將進行一次環(huán)境數(shù)據(jù)的記錄,并且在處理時分開進行處理;且此后每次測量都不可拉開遮光布。
(3)將探頭偏移一個角度,使其與蘋果正面形成一個小角度傾角,以避免鏡面反射的干擾。
(4)對共計60個蘋果進行繞赤道取樣,得到了300組漫反射光譜數(shù)據(jù)。在獲取光譜數(shù)據(jù)同時對測量點進行標記,挖取果肉榨汁使用速為手持糖度儀對標記點的糖度進行測量記錄。挖取果肉速度要快,避免氧化對測量造成影響。
(5)使用SpectraSuite軟件進行數(shù)據(jù)的導出,導出格式為txt,使其可以導入MATLAB進行初步處理。
(6)將整理好的數(shù)據(jù)轉(zhuǎn)化為吸光度,將暗背景與基準白板同時導入以消除環(huán)境以及光源產(chǎn)生的誤差,最后使用吸光度公式進行轉(zhuǎn)化。
2.3? 實驗數(shù)據(jù)處理及結(jié)論
實驗一共收集了幾種算法進行最佳算法組合選擇,分別為連續(xù)投影算法(successive projections algorithm, SPA)、Kennard–Stone(KS)、交叉驗證法、偏最小二乘回歸(Partial least squares regression, PLSR)[5]。SPA算法用于選擇特征波長,KS算法和交叉驗證法用于選擇出訓練集和預測集,PLSR用于建立回歸模型。根據(jù)R2、校正均方根誤差和預測均方根誤差這三個指標,在全光譜+KS+PLSR和全光譜+交叉驗證+PLSR的比較中我們選擇了交叉驗證法,在全光譜+交叉驗證+PLSR和SPA+交叉驗證+PLSR的比較中我們選擇了全光譜。
實驗將SpectraSuite軟件的數(shù)據(jù)進行導出,相關(guān)儀器參數(shù)設(shè)置為:
(1)數(shù)據(jù):Sun Jun 13 10:39:54 CST 2021
(2)暗光譜:否
(3)參考光譜:否
(4)光譜儀:QEB1452
(5)積分時間(微秒):100 000 (QEB1452)
(6)去除暗噪聲:否(QEB1452)
(7)使用脈沖信號/燈:否(QEB1452)
(8)光譜像素值:1 044,其中初始數(shù)據(jù)波長范圍為247.25 nm~1 045.27 nm。
部分初始數(shù)據(jù)如表1所示。
將光強轉(zhuǎn)換為吸光度,將初步獲得的吸光度數(shù)據(jù)進行歸一化處理,并進行吸光度曲線的繪制。通過觀察曲線可以發(fā)現(xiàn)3種蘋果均在570 nm、682 nm存在吸收峰,如圖2所示。記錄這兩個吸收峰,并將差距較大的曲線剔除。
將吸光度數(shù)據(jù)導入The Unscrambler X軟件,使用PLSR算法進行回歸分析,在剔除了誤差較大的點后,取存在吸收峰的570 nm、682 nm進行篩選后,在其他具有較小關(guān)系系數(shù)的波長輔助預測下,預測集相關(guān)系數(shù)r方值達到了0.721,如圖3、4所示。
由此得到最優(yōu)算法為全光譜+交叉驗證+PLSR算法。此外在對數(shù)據(jù)進行處理時還發(fā)現(xiàn),用PLSR算法進行離群點的剔除能夠大大增加預測的精度和穩(wěn)定度。實驗數(shù)據(jù)證明了570 nm、682 nm這兩個吸收峰與糖度之間在回歸模型中分別存在著相對于其他波長而言較大負相關(guān)系數(shù)以及正相關(guān)系數(shù)。
通過算法以及回歸模型對采集的部分樣本進行了預測,得到如表2所示的數(shù)據(jù)。
3? 結(jié)? 論
實驗找到了兩個與糖度分別具有較大相關(guān)系數(shù)的波長,但是存在著容易受到蘋果本身具有的不規(guī)則斑點的影響,并且損傷部分也會對預測結(jié)果造成不同程度的影響,建議可以在研究糖度的同時對不同的斑點、損傷部分進行特征波長的提取,并在回歸分析時剔除掉相應(yīng)的波長相關(guān)系數(shù)。其次,此次所尋找的波長是針對三類蘋果的共同特征波長,建議可以嘗試將單種蘋果拿出進行進一步的分析研究,進一步優(yōu)化單種蘋果的預測模型。
實驗所使用的光源波段為可見光波段,這意味著該研究的成果更加有利于向商業(yè)化的便攜式糖度檢測儀與智能手機結(jié)合,但是使用現(xiàn)成光譜儀不方便進行小型化開發(fā),建議可以通過采集光源照射蘋果后周圍產(chǎn)生的圖像進行特殊的圖像處理獲得理想的分析圖像,并采用神經(jīng)網(wǎng)絡(luò)算法進行進一步分析建模。
參考文獻:
[1] 何琳純.中國水果市場發(fā)展分析研究 [J].中國管理信息化,2020,23(19):149-150.
[2] 羅批,郭繼昌,李鏘,等.基于偏最小二乘回歸建模的探討 [J].天津大學學報,2002(6):783-786.
[3] 畢榮道,趙旻.基于PCA及霍特林T2分布的在線近紅外建模研究 [J].電子技術(shù)與軟件工程,2021(13):189-191.
[4] ZHANG Y Q,CHEN Y,WU Y,et al. Accurate and nondestructive detection of apple brix and acidity based on visible and near-infrared spectroscopy [J].Applied optics,2021,60(13):4021-4028.
[5] 高升,王巧華,付丹丹,等.紅提糖度和硬度的高光譜成像無損檢測 [J].光學學報,2019,39(10):355-364.
作者簡介:曹錫磊(2001.05—),男,漢族,廣東廉江人,本科在讀,研究方向:工程光學。