陳 琦, 潘天紅, 李魚強, 林 鴻
1. 合肥工業(yè)大學食品與生物工程學院, 安徽 合肥 230601 2. 安徽大學電氣工程與自動化學院, 安徽 合肥 230601 3. 黃山海關茶葉質量安全研究中心, 安徽 黃山 245000 4. 江蘇大學電氣信息工程學院, 江蘇 鎮(zhèn)江 212013
太平猴魁茶屬于綠茶尖茶, 主要產于安徽省黃山市黃山區(qū)三合村猴坑、 猴崗和嚴家三個村落[1]。 太平猴魁茶成品具有“兩葉一芽、 扁平挺直、 魁偉重實、 色澤蒼綠、 蘭香高爽、 滋味甘醇”等特點, 深受廣大消費者喜愛[1-2]。 隨著市場的不斷擴大, 茶葉摻假現(xiàn)象的不斷發(fā)生損害了太平猴魁茶的市場形象, 實現(xiàn)精準產地鑒別分析對促進太平猴魁茶發(fā)展具有重要意義。
傳統(tǒng)感官分析方法主要通過外觀、 湯色、 滋味及香氣等感官指標實現(xiàn)產地鑒別分析, 但手工工藝制備的茶葉成品外觀差異較小, 導致基于人工經驗的感官評審方法無法實現(xiàn)快速、 精準的產地鑒別分析[3]。 目前主要通過化學分析方法實現(xiàn)茶葉高精度產地鑒別, 然而化學分析檢測繁瑣、 成本高, 并且目前沒有統(tǒng)一的化學檢測標準可用于太平猴魁茶產地鑒別分析。
近紅外光譜(near infrared spectroscopy,NIR)作為一種無損分析方法, 具有快速、 非破壞性、 無污染等特點, 已在茶葉生產過程得到廣泛應用[4-5]。 然而不同產地茶葉內含成分種類及其含量基本相同, 不同產地樣本光譜特征峰分布基本相同, 導致常規(guī)分析方法無法有效選擇光譜特征。 卷積神經網絡(convolutional neural networks,CNN)作為典型的深度學習網絡模型之一, 具有很強的特征提取和模型表達能力, 已被廣泛應用于NIR特征提取分析[6-9]。
本研究以不同產地光譜特征以及CNN模型, 以太平猴魁茶為研究對象, 利用1-D CNN模型提取NIR特征, 建立基于1-D CNN和NIR的太平猴魁茶產地鑒別模型, 并采用蒙特卡羅方法進行產地鑒別模型穩(wěn)定性分析, 為太平猴魁茶產地鑒別及溯源分析提供新方法。
材料: 選取太平猴魁茶地理保護范圍黃山市黃山區(qū)的猴坑、 猴崗、 顏家、 三合、 石河坑、 汪王嶺共6個不同產地樣本, 每個產地各20個樣品。 按照采摘時間從指定地點采集樣品, 委托黃山市猴坑茶業(yè)有限公司按照太平猴魁茶傳統(tǒng)工藝進行制備, 樣本信息如表1所示。
表1 樣品信息Table 1 Sample information
試驗儀器: IRTracer-100NIR儀(日本島津)、 KN 295 Knifetec樣品磨(瑞典FOSS)、 石英樣品杯(日本島津)。
1.2.1 樣品制備
將茶葉用粉碎機粉碎50 s, 將粉碎的試樣過0.154 mm的篩, 密封放于4 ℃冰箱中備用。
1.2.2 儀器條件
光闌: 自動, 延遲10 s; 增益: 1; 模式: 能量掃描; 零填充: 4倍; 動鏡速度: 2.8 mm·s-1; 測定模式: 吸光度; 掃描波數(shù)范圍: 10 000~4 000 cm-1; 掃描次數(shù): 45次; 光束: 內部; 檢測器: MCT; 光源: 鎢燈光源; 變跡函數(shù): SqrTriangle; 分辨率: 4 cm-1。
1.2.3 光譜采集
取適量樣品于石英樣品杯中, 高度約為5 mm, 保證樣品杯底部樣品均勻無縫隙、 厚度均勻, 放在漫反射掃描裝置的放樣口處, 蓋好樣品室蓋板, 掃描光譜。
因背景噪聲、 雜散光和人工操作等因素影響, 導致所采集數(shù)據包含噪聲信號[10]。 在分析之前對所采集的原始光譜數(shù)據進行預處理。 選取標準正態(tài)變換(standard normal variants,SNV)作為預處理方法[11]。
卷積神經網絡是一種多層非全連接的高性能非線性深度學習方法, 其基本結構由卷積層、 池化層和全連接層組成, 在正向傳播過程中利用卷積層和池化層相互交替學習實現(xiàn)原始數(shù)據特征提??; 在反向傳播過程中則利用梯度下降法最小化誤差函數(shù)實現(xiàn)參數(shù)調整, 以此完成權值更新[12]。
對于圖像等二維形式的數(shù)據, 一般采用大小的卷積核和池化核進行特征提取, 但本試驗采集的NIR是一維數(shù)據, 因此采用1-D CNN進行特征分析, 其一維卷積和池化分析過程如圖1所示。
圖1 1-D CNN提取特征過程Fig.1 Feature selection process of 1-D CNN
為確定最佳網絡結構和系統(tǒng)參數(shù), 選擇預測準確率(correct identification rate, CIR)和運行時間作為模型性能評估指標, 其中CIR定義為
式中, N表示全部樣本,NC表示對應分析數(shù)據集中預測準確樣本數(shù)。
選取黃山區(qū)太平猴魁茶共120個樣本(表1)進行光譜采集, 原始光譜如圖2(a)所示。 經SNV預處理后的光譜圖如圖2(b)所示, 相比于圖2(a), 預處理光譜特征峰更加明顯。
圖2 太平猴魁茶光譜數(shù)據(a): 原始光譜; (b): 預處理光譜Fig.2 Spectra of Taiping Houkui tea(a): Original data; (b): Preprocessed data
太平猴魁茶原始光譜波長點(12 446)較多, 容易導致網絡訓練時間過長。 為降低模型計算成本, 需要對原始數(shù)據通過間隔采樣實現(xiàn)降維處理。 為選擇最佳采樣間隔, 將樣本隨機劃分為訓練集(84, 占70%)和測試集(36, 占30%), 分析對比不同采樣間隔數(shù)據預測精度和計算時間(表2)。
表2 不同采樣間隔預測結果Table 2 Prediction results with different sampling intervals
分析結果表明, 基于原始光譜數(shù)據的1-DCNN模型計算時間過長且模型預測準確率較低, 當采樣間隔為6時,CNN模型測試集預測精度達到最大(96.67%), 當采樣間隔繼續(xù)增大時, 1-DCNN模型計算時間減少, 但預測性能快速下降, 綜合考慮模型預測精度和計算時間, 選擇6作為最佳采樣間隔。
為確定最佳網絡結構, 分別計算2—5層網絡結果模型損失函數(shù)(圖3)。 分析結果表明, 3層網絡結構模型目標函數(shù)可在最短(約85步, 如圖3紅色實線所示), 迭代步長內實現(xiàn)收斂, 因此選擇具有3層網絡的1-D CNN模型。
圖3 不同1-D CNN結構訓練集損失函數(shù)Fig.3 Loss function values of training set fordifferent 1-D CNN structure
對于NIR數(shù)據, 重疊特征峰和獨立特征峰的存在導致模型結果對于卷積核大小及數(shù)目更加敏感, 卷積核過小導致模型計算過程復雜; 卷積核過大則容易造成特征丟失。 為確定最佳卷積核大小, 分別討論7—39不同大小卷積核分析結果(圖4)。
圖4 不同大小卷積核CIR Fig.4 CIR of different convolution kernel sizes
對于卷積核數(shù)目, 按照2n進行設置, 并分別測試了卷積核數(shù)目為n=3,4,5,6,7的分析結果。 考慮到池化操作會減少卷積特征維度, 以2為梯度遞減相鄰層卷積核數(shù)目, 具體分析結果如表3所示。
表3 不同數(shù)目卷積核CIRTable 3 CIR of different convolution kernel number
由圖4可知, 當卷積核大小為41時, CIR達到最大值, 由表3可知, 當卷積核數(shù)目大于32時, 運行時間顯著增大。 結合圖4和表3, 確定最佳卷積核大小和數(shù)目分別為41和32。
為防止因數(shù)據集參數(shù)過大而引起過擬合現(xiàn)象, 采用Dropout方法進行網絡結構優(yōu)化。 對比網絡結構優(yōu)化前后模型的預測結果發(fā)現(xiàn), 在引入Dropout后模型性能有明顯提升, 其預測集準確率從91.67%提高到100%。
為確定最佳激活函數(shù), 分別對比含有4種不同激活函數(shù)(ReLU, Sigmoid, PReLU和ELU)網絡模型預測結果。 其中, Sigmoid激活函數(shù)預測準確率最低(75%), PReLU(95.83%)和ReLU(93.33%)次之, ELU激活函數(shù)預測準確率最高(98.33%)。 因此, 選擇ELU作為1-D CNN模型激活函數(shù)。
根據圖5模型結構和系統(tǒng)參數(shù)所建1-D CNN模型如圖5所示, 圖中所示結構含有3個卷積層(C1, C3, C5), 其卷積核大小分別為41, 39和37, 由MSRA初始化卷積核權重。 3個池化層(S2, S4, S6)按照設定步長和窗口大小降低數(shù)據維度。 在分析過程中, 為防止梯度消失, 在每一次卷積后進行批處理化(batch normalization,BN)。 通過Softmax分類器實現(xiàn)對特定分析對象的分類預測。
圖5 1-D CNN模型結構Fig.5 Model structure of 1-D CNN model
根據圖5模型結構所建1-D CNN模型的預測結果如圖6所示, 圖中橫縱軸數(shù)值表示不同產地屬性, 對角線變量大小表示正確預測數(shù), 可知基于CNN和NIR的太平猴魁茶產地鑒別模型預測準確率為100%。
圖6 1-D CNN模型預測結果Fig.6 Prediction results of 1-D CNN model
為驗證1-D CNN模型篩選NIR特征變量的有效性, 分別選取不同產地樣本, 對比原始數(shù)據和不同卷積層篩選數(shù)據的分布情況[見圖7(a)—(d)]。 由圖7(a)可知, 原始光譜數(shù)據主要分布在8 700~5 600和5 300~4 000 cm-1兩個區(qū)間, 經第一層卷積網絡獲得特征峰主要分布在7 800~6 700, 6 400~5 200和5 200~4 200 cm-1, 第二層篩選的特征峰主要分布在10 000~7 100, 6 300~5 400和5 400~4 200 cm-1, 第三層篩選特征峰主要分布在10 000~7 300, 6 300~5 800和5 500~4 400 cm-1。 結合太平猴魁茶主要品質成分官能團的分布, 可以發(fā)現(xiàn)1-D CNN能夠有效提取太平猴魁茶內含成分粗纖維(7 502~5 446 cm-1)、 茶多酚(6 101~4 246 cm-1)、 咖啡堿(7 502~5 446和4 424~4 246 cm-1)和游離氨基酸(7 502~5 800和5 450~4 246 cm-1)的NIR特征[13]。 對比分析圖7(a)和(d)可知, 1-D CNN模型在有效選擇光譜特征的同時能夠實現(xiàn)不同產地特征變量差異化表示, 有助于提高太平猴魁茶產地鑒別模型分析能力。
圖7 光譜特征分布(a): 原始光譜; (b): 第一卷積層; (c): 第二卷積層; (d): 第三卷積層Fig.7 Spectral feature distribution(a): Original spectrum; (b): First convolutional layer; (c): Second convolutional layer; (d): Third convolutional layer
為驗證1-D CNN模型有效性, 采用相同的訓練集和測試集樣本, 對主成分分析(principal component analysis,PCA)和1-D CNN模型分別進行100次蒙特卡羅試驗, 不同方法所建模型的訓練集和測試集分析結果如表5所示。 分析結果表明, 相比于原始數(shù)據(41.29%, 40.57%), 基于PCA特征篩選的產地鑒別模型準確率有所下降(30.96%, 31.93%), 其主要原因是不同產地光譜變量分布相似, PCA無法有效選擇特征光譜; 1-D CNN模型能夠顯著提高太平猴魁茶產地鑒別精度(98.48%~97.73%), 可實現(xiàn)太平猴魁茶高精度產地鑒別分析。 此外, 測試結果標準差表明基于1-D CNN的產地鑒別模型穩(wěn)定性更高。
表5 蒙特卡羅試驗結果對比Table 5 Comparison of Monte Carlo experimental results
基于太平猴魁茶不同產地NIR信息, 結合CNN特征表示方法, 提出基于1-D CNN的太平猴魁茶產地鑒別模型。 試驗結果表明CNN能夠有效篩選不同產地樣本NIR特征, 實現(xiàn)太平猴魁茶高精度產地鑒別分析(100%); 100次蒙特卡羅試驗表明, 相比于原始數(shù)據(40.57%, 7.06)和PCA模型(31.93%, 6/96), 基于1-D CNN的產地鑒別模型具有更高的預測精度(97.73%)和更小的標準差(3.47), 該方法為太平猴魁茶等名貴茶葉產地鑒別及溯源分析提供新思路。