張立欣
(塔里木大學信息工程學院,新疆 阿拉爾 843300)
中醫(yī)認為蘋果具有生津止渴、潤肺除煩、健脾益胃、養(yǎng)心益氣等功效,并且味道酸甜適口,營養(yǎng)豐富,因此成為老幼皆宜的水果之一。中國是世界上最大的蘋果生產(chǎn)國,種植面積和產(chǎn)量均占世界50%以上。由于環(huán)境因素、土壤特征等不同,導致各地蘋果的品質(zhì)存在差異。例如,阿克蘇地區(qū)晝夜溫差大、光照充足、土壤肥沃、采用冰川雪融水澆灌等特性,使阿克蘇蘋果的果核部分糖分堆積成透明狀,形成了世界上獨一無二的“冰糖心”。但是,市場上假冒阿克蘇“冰糖心”蘋果的現(xiàn)象屢禁不止,因此,研究不同產(chǎn)地蘋果的品質(zhì)差異并進行產(chǎn)地溯源,讓消費者明白消費,對提高人民的生活質(zhì)量,更好地規(guī)范交易市場,保證農(nóng)產(chǎn)品的真實性, 為地理標志產(chǎn)品、地區(qū)特征性產(chǎn)品產(chǎn)地真?zhèn)舞b別,具有重要的理論意義和現(xiàn)實意義。
蘋果的主要成分包括水分、總糖、總酸等,對蘋果內(nèi)在品質(zhì)的檢測靠化學檢測方法,雖然化學檢測方法準確,但是費時費力,不適合進行大批量操作。光譜分析法可以克服這些缺點實現(xiàn)快速無損檢測,尤其是在固體有機物采集及對蘋果主要成分的檢測分析方面。雷鷹等人[1]利用便攜式光譜儀器可以快速、無損地現(xiàn)場檢測出蘋果糖度。王轉(zhuǎn)衛(wèi),陳帥帥,劉亞,樊書祥等人[2-5]結合化學計量學方法,建立的蘋果內(nèi)部成分含量與近紅外光譜之間的預測模型精度較高。歐陽愛國等人[6]采用STS 和QE 兩款不同光譜儀,搭建的試驗平臺可實現(xiàn)蘋果可溶性固形物含量的測量。
內(nèi)部成分含量的差異,會導致光譜曲線的差異,為基于光譜技術進行分類奠定了基礎。Arana I 等人[7]對來自西班牙Cadreita 和Villamayor de Monjardin 2 個地區(qū)的葡萄光譜結合偏最小二乘法建立識別模型,準確率分別達到了97.2%和79.2%。Fu X P 等人[8]采用傅里葉變換近紅外漫反射光譜儀對來自于浙江檀溪和淳安的枇杷進行分析,并結合主成分分析- 概率神經(jīng)網(wǎng)絡進行產(chǎn)地鑒別,其校正集和驗證集樣品的識別率分別為97%和86%,能有效地將2 個地區(qū)的枇杷分開。張鵬等人[9]探索近紅外光譜定性分析技術鑒別蘋果產(chǎn)地的可行性,對天津、陜西和北京3個產(chǎn)地富士蘋果,建立主成分分析結合最小二乘法產(chǎn)地鑒別模型,預測集的鑒別正確率為98.33%。
國內(nèi)外的研究表明,光譜技術在農(nóng)產(chǎn)品的檢測分析中具有廣泛的應用,但是應用光譜技術對阿克蘇“冰糖心”蘋果識別的研究相對較少。以阿克蘇“冰糖心”蘋果、甘肅花牛蘋果、甘肅靜寧蘋果為研究對象,利用光譜分析的理論和方法,建立蘋果的產(chǎn)地識別模型,為無損鑒別阿克蘇“冰糖心”蘋果提供理論參考,對蘋果的產(chǎn)地溯源具有重要意義。
以新疆阿克蘇“冰糖心”蘋果、甘肅天水花牛蘋果、甘肅靜寧蘋果為試驗對象,挑選表面無缺陷、直徑范圍為65~85 mm、大小均勻的蘋果樣品,放置在冰柜內(nèi)保存,試驗前分批拿出,待其恢復到室溫后開始試驗。
試驗中所用的高光譜系統(tǒng)為北京卓立漢光公司的Hyperspectral Sorting System 推掃式高光譜分選系統(tǒng),光譜測定范圍900~1 700 nm(實際可測量到1 750 nm),光譜分辨率5 nm,光譜采樣點4 nm,樣本在室溫20~25 ℃環(huán)境下進行掃描,對每一個樣本進行5×5 感興趣區(qū)域提取平均光譜值,通過ENVI5.3 導出為 Excel 文件。
總糖測定根據(jù)GB/T 36058—2018 中所需的儀器設備、試劑及步驟實現(xiàn)。
總酸測定根據(jù)GB/T 12456—2008 所需的儀器設備、試劑及步驟實現(xiàn)。
還原糖測定根據(jù)GB 5009.7—2016 中直接滴定法所需的儀器設備、試劑及步驟實現(xiàn)。
有效酸度測定借助酸度計(即pH 計) 來測定。
可溶性糖測定根據(jù)GB/T 36056—2018 中所需的儀器設備、試劑及步驟實現(xiàn)。
借助于SPSS 軟件對蘋果的內(nèi)部成分含量進行差異性分析,在F 檢驗差異顯著的情況下,采用新復極差法進行多重比較分析。
利用不同產(chǎn)地蘋果的光譜數(shù)據(jù),借助于MATLAB2019b 軟件,采用連續(xù)投影算法(Successive projection algorithm,SPA) 提取有效波長變量,建立貝葉斯判別分析模型(Bayes discriminant analysis model,Bayes)。
將光譜數(shù)據(jù)集以3∶1 的比例間隔分為訓練集和測試集,依靠訓練集建立模型,測試集將通過已經(jīng)建立好的模型進行驗證,以準確率為標準來評判模型的優(yōu)劣。
為比較“冰糖心”蘋果與其他蘋果內(nèi)部成分含量上的差異,選取地理位置上較近的,同樣是國家地理標志產(chǎn)品的甘肅花牛蘋果和靜寧蘋果作為對比。
2.1.1 總糖含量的比較
總糖含量的高低是決定果實品質(zhì)的重要指標之一。
總糖含量的方差分析見表1。
表1 總糖含量的方差分析
由表1 可知,F(xiàn) 檢驗統(tǒng)計量的值為5.650,顯著性檢驗的p 值僅為0.042,小于0.05。因此,可以得出結論,3 個產(chǎn)地的蘋果在總糖含量方面存在顯著性差異。
總糖含量的多重比較結果見圖1。
圖1 總糖含量的多重比較結果
由圖1 可知,阿克蘇“冰糖心”蘋果的總糖含量最高為14.15%,而花牛蘋果的總糖含量最低為11.57%,它們之間存在顯著的差異。靜寧蘋果的總糖含量居中,與“冰糖心”蘋果、花牛蘋果的總糖含量之間的差異不顯著。
2.1.2 總酸含量的比較
總酸含量對果實的風味影響很大,是決定蘋果味感的重要成分。
總酸含量的方差分析見表2。
表2 總酸含量的方差分析
由表2 可知,F(xiàn) 檢驗統(tǒng)計量的值為6.382,顯著性檢驗的p 值僅為0.033,小于0.05。因此,可以得出結論,3 個產(chǎn)地的蘋果在總酸含量方面存在顯著性差異。
總酸含量的多重比較結果見圖2。
圖2 總酸含量的多重比較結果
由圖2 可知,阿克蘇“冰糖心”蘋果的總酸含量最高為0.26%,而花牛蘋果的總酸含量為0.21%,靜寧蘋果的總酸含量為0.22%,“冰糖心”蘋果和花牛蘋果、靜寧蘋果在總酸含量上都具有顯著性差異,而花牛蘋果和靜寧蘋果在總酸含量上的差異不顯著。
2.1.3 還原糖含量的比較
還原糖含量的方差分析見表3。
表3 還原糖含量的方差分析
由表3 可知,F(xiàn) 檢驗統(tǒng)計量的值為14.399,顯著性檢驗的p 值僅為0.005,遠小于0.05,3 個產(chǎn)地的蘋果在還原糖含量方面具有極顯著性差異。
還原糖含量的多重比較結果見圖3。
由圖3 可知,阿克蘇“冰糖心”蘋果的還原糖含量最低為9.91%,而花牛蘋果的還原糖含量為10.80%,靜寧蘋果的還原糖含量最高為11.12%,“冰糖心”蘋果和花牛蘋果、靜寧蘋果在還原糖含量上都具有顯著性差異,而花牛蘋果和靜寧蘋果在還原糖含量上的差異不顯著。
圖3 還原糖含量的多重比較結果
2.1.4 有效酸含量的比較
pH 值的方差分析見表4。
表4 pH 值的方差分析
由表4 可知,F(xiàn) 檢驗統(tǒng)計量的值為6.708,顯著性檢驗的p 值僅為0.002,遠小于0.05,可以得出3 個產(chǎn)地的蘋果的pH 值具有極顯著性的差異。
有效酸含量的多重比較結果見圖4。
圖4 有效酸含量的多重比較結果
由圖4 可知,“冰糖心”蘋果的平均pH 值為4.01,花牛蘋果為4.13,靜寧蘋果為3.97,“冰糖心”蘋果和花牛蘋果的pH 值具有顯著的差異,與靜寧蘋果的pH 值差異不顯著?;ㄅLO果和靜寧蘋果的pH 值具有顯著性的差異。
2.1.5 可溶性糖含量的比較
可溶性糖含量的方差分析見表5。
表5 可溶性糖含量的方差分析
由表5 可知,F(xiàn) 檢驗統(tǒng)計量的值為38.742,顯著性檢驗的p 值小于0.001。因此,3 個產(chǎn)地的蘋果可溶性糖含量具有極顯著性的差異。
可溶性糖含量的多重比較結果見圖5。
由圖5 可知,“冰糖心”蘋果的可溶性糖含量最高為15.39%,而花牛蘋果可溶性糖含量最低為12.84%,靜寧蘋果的居中為13.48%,“冰糖心”蘋果和花牛蘋果、靜寧蘋果在可溶性糖含量都具有顯著性差異,而花牛蘋果和靜寧蘋果在可溶性糖含量上的差異不顯著。
圖5 可溶性糖含量的多重比較結果
不同產(chǎn)地的蘋果在總糖、總酸、還原糖、有效酸和可溶性糖含量存在差異,成分含量的差異會導致高光譜曲線的差異,為基于高光譜技術對蘋果的產(chǎn)地溯源研究提供了信息。
2.2.1 光譜特征分析
采集的蘋果光譜數(shù)據(jù)中,剔除異常值后,共得到阿克蘇“冰糖心”蘋果、花牛蘋果、靜寧蘋果樣本各72 個。
原始光譜圖見圖6。
圖6 原始光譜圖
由圖1 可知,1 060 nm 波段附近有一個明顯的波峰,這是N-H 基團的3 倍頻帶,1 180 nm 處的波谷位于C-H 的3 倍頻帶,1 440 nm 處的波谷是H2O 2 倍頻吸收帶等。如果樣品的組成相同,則其光譜也相同,反之亦然。因此,高光譜分析法是一種間接的分析技術。在對未知樣本產(chǎn)地溯源之前,需要獲得樣品的光譜數(shù)據(jù)和產(chǎn)地之間的關聯(lián)模型。如果建立了光譜與產(chǎn)地的對應關系,只要測得樣品的光譜,就能很快判別其產(chǎn)地。
將樣本以3∶1 的比例間隔產(chǎn)生訓練集和測試集,即得162 個樣本組成的訓練集和54 個樣本組成的測試集。訓練集用于建立判別分析模型,測試集用于檢驗模型。
2.2.2 特征波長選取
波長變量之間具有很強的相關性,全光譜波長變量參與建模,會導致共線性,也會增加模型的復雜性。因此,需要提取體征波長變量來參與建模[10]。連續(xù)投影算法(SPA) 通過計算光譜矩陣中某一波長對其他波長的投影,在該波長序列中選取投影量最大的波長作為下一個波長,序列中每個波長都與其前一個波長相關性最小,能最大程度消除共線性對模型的干擾,降低建模過程的復雜度。指定波長數(shù)為2~20,采用均方根誤差最小來確定最終參與建模的波長變量個數(shù)。
SPA 選取變量過程見圖7。
圖7 SPA 選取變量過程
由圖7 可知,隨著變量個數(shù)的增加,均方根誤差呈現(xiàn)遞減的趨勢,當選取的變量個數(shù)為13 時,均方根誤差達到0.103 5,此時,再增加有效變量的個數(shù),均方根誤差并無明顯的減小。因此,選取13 個有效變量作為建模輸入自變量。
SPA 選取的變量見圖8。
圖8 SPA 選取的變量
由圖8 可知,小方框?qū)臋M坐標即為有效變量對應的波長,分別為957.98,967.41,992.65,1 053.06,1 098.00,1 140.05,1 271.40,1 338.17,1 392.12,1 439.71,1 588.15,1 633.69,1 686.63 nm。
2.2.3 模型建立
以提取出的特征波長變量作為輸入自變量,建立貝葉斯判別分析模型。
Bayes 訓練集判別結果見表6,測試集判別結果見表7。
由表6 和表7 可知,Bayes 判別分析模型訓練集總準確率為95.68%,測試集總準確率為98.15%。
表6 Bayes 訓練集判別結果
表7 測試集判別結果
2.2.4 模型比較
采用目前在光譜定性分析應用較為廣泛的偏最小二乘判別分析(PLSDA) 模型進行建模。
PLSDA 訓練集的判別結果見表8,PLSDA 測試集的判別結果見表9。
表8 PLSDA 訓練集的判別結果
表9 PLSDA 測試集的判別結果
PLSDA 判別分析模型訓練集總準確率為85.19%,測試集總準確率為87.04%,低于Bayes 模型的,這是由于蘋果內(nèi)部結構復雜,除了線性關系外,還有非線性關系。因此,具有線性和非線性預測能力的Bayes 模型準確率較高。
對3 個不同產(chǎn)地的蘋果內(nèi)部品質(zhì)的比較研究表明,在總糖、總酸、還原糖、有效酸和可溶性糖含量上,阿克蘇“冰糖心”蘋果與花牛蘋果都具有顯著性差異;在總酸、還原糖、可溶性糖含量上,“冰糖心”蘋果和靜寧蘋果具有顯著性差異;花牛蘋果和靜寧蘋果在有效酸含量上具有顯著性差異,其他成分和靜寧蘋果無顯著性差異。
不同產(chǎn)地蘋果內(nèi)部成分含量的差異導致高光譜曲線的差異。基于高光譜技術的理論和方法,建立蘋果產(chǎn)地的Bayes 判別分析模型,其訓練集和測試集的準確率分別為95.68%和98.15%,優(yōu)于PLSDA 模型,可用于蘋果的產(chǎn)地溯源。
隨著大數(shù)據(jù)、物聯(lián)網(wǎng)和云計算的發(fā)展,光譜技術將會為智能工廠提供更快、更準、更有用的化學感知信息[11],解決蘋果品質(zhì)信息無法有效快速獲取的關鍵科技問題,實現(xiàn)對農(nóng)產(chǎn)品的產(chǎn)地溯源。