楊春蘭,薛大為,鮑俊宏
(蚌埠學(xué)院 電子與電氣工程系,安徽 蚌埠 233030)
?
黃山毛峰茶貯藏時間電子鼻檢測方法研究
楊春蘭,薛大為*,鮑俊宏
(蚌埠學(xué)院 電子與電氣工程系,安徽 蚌埠 233030)
利用電子鼻對6個貯藏時間5個等級的黃山毛峰茶進行檢測,首先獲取反映茶葉香氣的原始特征向量,再通過主成分分析法(PCA)提取出前5個主成分作為主特征向量,然后以主特征向量作為BP神經(jīng)網(wǎng)絡(luò)(BPNN)的輸入,建立黃山毛峰茶貯藏時間預(yù)測模型(PCA-BPNN)。結(jié)果表明:PCA-BPNN對于貯藏0 d的茶葉,最大預(yù)測誤差為11 d,5個(6.67%)樣本預(yù)測誤差超過13 d;對于貯藏60 d的茶葉,最大預(yù)測誤差為13 d,4個(5.33%)樣本預(yù)測誤差超過10 d;對于貯藏120 d的茶葉,最大預(yù)測誤差為16 d,7個(9.33%)樣本預(yù)測誤差超過10 d;對于貯藏180 d的茶葉,最大預(yù)測誤差為19 d,8個(10.67%)樣本預(yù)測誤差超過10 d;對于貯藏240 d的茶葉,最大預(yù)測誤差為21 d,8個(10.67%)樣本預(yù)測誤差超過10 d;對于貯藏300 d的茶葉,最大預(yù)測誤差為14 d,6個(8.00%)樣本預(yù)測誤差超過10 d。該研究所建立的PCA-BPNN預(yù)測模型可用于檢測黃山毛峰茶貯藏時間,且與以原始特征變量作為輸入的BPNN模型相比,性能更好。
電子鼻;PCA;BPNN;預(yù)測模型
茶葉香氣與茶葉品質(zhì)密切相關(guān),是反映茶葉品質(zhì)的重要因素。茶葉香氣是由上百種揮發(fā)性物質(zhì)共同作用而形成的整體信息反映[1],構(gòu)成復(fù)雜,因而少數(shù)幾個傳感器難以對其進行有效檢測。電子鼻技術(shù)的出現(xiàn)為復(fù)雜氣味檢測提供了一種有效的途徑。電子鼻[2]是一種仿生物嗅覺功能的檢測儀器,主要由傳感器陣列和模式識別方法組成,可以對氣味的整體信息進行識別。電子鼻技術(shù)在水果[3-4]、酒類[5-6]、肉類[7-8]等食品工業(yè)領(lǐng)域已經(jīng)有著廣泛的應(yīng)用。根據(jù)文獻檢索結(jié)果,電子鼻技術(shù)在茶葉品質(zhì)檢測方面也有一定報道,但大都集中于對不同等級茶葉品質(zhì)的檢測方面[9-10],對于不同貯藏時間茶葉品質(zhì)檢測方面研究報道很少。眾所周知,茶葉的品質(zhì)不僅取決于茶葉的等級,而且與茶葉貯藏時間的長短有關(guān),等級越高品質(zhì)越好,貯藏時間越長品質(zhì)越差。
黃山毛峰茶因盛產(chǎn)于安徽黃山地區(qū)而得名,是中國的名茶之一,但對其品質(zhì)檢測的研究報道不多,尤其是對于不同貯藏時間其品質(zhì)檢測方面的研究在檢索范圍內(nèi)尚未見報道。因此,本文擬利用電子鼻技術(shù)對不同貯藏時間的黃山毛峰茶品質(zhì)進行檢測,并嘗試建立起一種可以預(yù)測茶葉貯藏時間的有效方法。模式識別是電子鼻重要的組成部分。BP神經(jīng)網(wǎng)絡(luò)[11](back propagation neural network,BPNN)具有非線性映射能力強、結(jié)構(gòu)簡單、泛化能力強等優(yōu)點,是模式識別中廣泛使用的方法。由于茶葉香氣構(gòu)成復(fù)雜,為了全面獲取茶葉的香氣信息,通常需要選擇較多的特征變量來構(gòu)成原始特征向量,而這些變量之間往往會存在一定的相關(guān)性,如果以這些變量作為神經(jīng)網(wǎng)絡(luò)的輸入,不但建模的效率低,且準(zhǔn)確度也會下降。因此,本研究將主成分分析法(principal component analysis,PCA)與BPNN結(jié)合(以下簡稱為PCA-BPNN),建立黃山毛峰茶貯藏時間的預(yù)測模型。首先,通過電子鼻傳感器陣列獲取各等級不同貯藏時間茶葉香氣的原始特征向量,再通過主成分分析法提取出能夠反映香氣整體信息的主特征向量,最后以主特征向量作為神經(jīng)網(wǎng)絡(luò)的輸入建立茶葉貯藏時間預(yù)測模型。
1.1茶葉樣品
試驗用茶葉樣品是從某黃山毛峰茶廠專門訂購的。為了保證試驗結(jié)果的可靠性,要求各等級新鮮茶葉均采自同一茶園且加工工藝統(tǒng)一,這樣可以盡量保持客觀條件一致,以減少隨機因素的影響。茶葉樣品共有5個等級,分別為R100,R200,R400,R1000,R2000,其中,數(shù)字表示價格(元·kg-1)。從2014年6月1日開始,各等級茶葉樣品每50 g分別采用錫紙袋加干燥劑獨立密封包裝,放入溫度為5 ℃的冰柜中保存。
1.2儀器設(shè)備
儀器采用PEN3型便攜式電子鼻,該電子鼻由德國Airsense公司生產(chǎn),系統(tǒng)主要組成部分包括:傳感器陣列、數(shù)據(jù)采集軟件、輔助功能單元(采樣/清洗通道、吸附/解附單元)。傳感器陣列包含10個金屬氧化物傳感器,各傳感器特性如表1所示。傳感器輸出為G/G0,其中G為傳感器接觸揮發(fā)性氣體的電導(dǎo)率,G0為傳感器在經(jīng)過活性炭過濾之后的純凈空氣中的電導(dǎo)率。
1.3試驗方法
從2014年6月1日至2015年3月30日,對不同等級茶葉樣品每隔60 d做一次檢測,連續(xù)檢測300 d,即0,60,120,180,240,300 d各檢測一次。每次試驗時,室溫保持在26 ℃,從冰柜中取出5種不同等級的干茶葉并分別準(zhǔn)備45個重復(fù)樣品,每個樣品5 g,放入250 mL燒杯中雙層薄膜密封,靜置45 min。電子鼻每隔1 s采樣一次,連續(xù)采樣60 s,清洗時間50 s。
表1各傳感器特性
Table 1The properties of the sensors
傳感器響應(yīng)特性檢測范圍(mL·m-3)W1C(S1)對芳香成分靈敏10W5S(S2)靈敏度大,對氨氧化合物很靈敏1W3C(S3)對氨水、芳香成分靈敏10W6S(S4)對氫氣有選擇性100W5C(S5)對烷烴、芳香成分靈敏1W1S(S6)對甲烷靈敏100W1W(S7)對硫化成分靈敏,對烴和硫的有機成分較靈敏1W2S(S8)對乙醇靈敏100W2W(S9)對芳香成分、有機硫化物靈敏1W3S(S10)對烷烴靈敏100
1.4數(shù)據(jù)分析及建模方法
茶葉香氣成分構(gòu)成復(fù)雜,各個傳感器對于同一香氣都有響應(yīng),存在信息交叉。而為了盡可能全面地反映原始數(shù)據(jù)包含的信息,選擇的原始特征變量較多。因此,對原始特征向量采用PCA進行降維處理,消除冗余信息[12],提取出主特征向量。
神經(jīng)網(wǎng)絡(luò)可以任意精度逼近非線性函數(shù),且泛化能力強,是模式識別中經(jīng)常采用的方法。BPNN是神經(jīng)網(wǎng)絡(luò)中最常用的一種,具有結(jié)構(gòu)簡單、設(shè)計方便等優(yōu)點。因此,本研究采用BPNN建立茶葉貯藏時間的預(yù)測模型。
2.1原始特征向量的選擇
電子鼻典型響應(yīng)曲線如圖1所示。從響應(yīng)曲線可以看出,各傳感器在60 s以后響應(yīng)趨于穩(wěn)態(tài)。根據(jù)各傳感器響應(yīng)曲線的變化特點,選擇各傳感器最大響應(yīng)值、第60 s時的響應(yīng)值(即穩(wěn)態(tài)值)、60 s內(nèi)響應(yīng)的均值、60 s內(nèi)響應(yīng)曲線積分值作為原始特征變量。則由特征變量構(gòu)成40維的特征向量:
X=(x1,x2,……,x39,x40)
(1)
圖1 電子鼻典型響應(yīng)曲線Fig.1 Typical response curve of electronic nose
式(1)中:x1,……,x10分別為10個傳感器最大響應(yīng)值;x11,……,x20分別為10個傳感器第60 s時響應(yīng)值x21,……,x30分別為10個傳感器響應(yīng)60 s內(nèi)的平均值;x31,……,x40分別為10個傳感器響應(yīng)60 s內(nèi)的積分值。
2.2相關(guān)性分析
對各等級不同貯藏時間茶葉樣本原始特征向量進行相關(guān)性分析,其中相關(guān)系數(shù)采用Pearson相關(guān),顯著性檢驗采用Two-tailed檢驗。根據(jù)相關(guān)性分析的結(jié)果,部分變量之間的相關(guān)系數(shù)值較大,存在明顯的相關(guān)性。如果以這些變量作為神經(jīng)網(wǎng)絡(luò)的輸入,將會降低模型的預(yù)測精度。因此,有必要通過主成分分析消除原始特征向量中包含的重疊和冗余信息。不同貯藏時間R200茶葉部分變量相關(guān)系數(shù)矩陣如表2所示。
2.3PCA分析
為了克服原始數(shù)據(jù)量級的大小對主成分分析的影響,在主成分分析前對原始特征向量進行如下標(biāo)準(zhǔn)化處理:
(2)
表2不同貯藏時間R200茶葉部分變量相關(guān)系數(shù)矩陣
Table 2Correlation coefficient matrix of partial variables of R200 under different storage time
變量x1x2x11x12x21x22x31x32x11.000x20.1631.000x110.4940.3901.000x120.4760.322-0.2081.000x210.776-0.3980.7590.1861.000x220.0360.6790.3470.7020.2331.000x310.4260.1920.529-0.1300.6730.1001.000x320.2680.5670.2510.4600.2810.3270.8051.000
通過主成分分析,發(fā)現(xiàn)各等級不同貯藏時間茶葉原始特征向量前5個主成分方差都大于1,且累計方差貢獻率均超過90%。因此,選擇前5個主成分作為主特征變量可以概況原始變量的主要信息,原始特征向量由40維降為5維。5個等級6個不同貯藏時間前5個主成分方差及貢獻率如表3所示。
2.4PCA-BPNN預(yù)測模型設(shè)計
BPNN由輸入層、中間層和輸出層組成,網(wǎng)絡(luò)的學(xué)習(xí)過程中通過誤差反向傳播不斷修正連接權(quán)和閾值,直到誤差達到設(shè)定精度或?qū)W習(xí)次數(shù)達到最大設(shè)定次數(shù)學(xué)習(xí)結(jié)束。設(shè)計中采用單中間層的3層網(wǎng)絡(luò)結(jié)構(gòu)。輸入層節(jié)點數(shù)等于輸入變量(即主成分)個數(shù),為5個;網(wǎng)絡(luò)輸出為茶葉貯藏時間預(yù)測值,輸出層節(jié)點數(shù)為1個。中間層節(jié)點數(shù)選擇沒有統(tǒng)一的有效方法,設(shè)計過程中依靠經(jīng)驗法在一定的單元數(shù)范圍內(nèi)經(jīng)過多次試驗確定。中間層激勵函數(shù)選擇Tansig函數(shù),輸出層激勵函數(shù)選擇Purelin函數(shù),學(xué)習(xí)率為0.1,動量因子為0.5,誤差精度設(shè)定為0.01。將各等級每個不同貯藏時間45個茶葉樣品分成2部分,其中30個樣本作為學(xué)習(xí)樣本,15個樣本作為預(yù)測樣本。PCA-BPNN不同中間層節(jié)點數(shù)學(xué)習(xí)結(jié)果如表4所示??梢钥闯觯?dāng)中間層為10個節(jié)點時,平均學(xué)習(xí)次數(shù)最少,為2 223次,性能較好。因此,PCA-BPNN結(jié)構(gòu)設(shè)計為5-10-1。同時,為了比較網(wǎng)絡(luò)性能,還設(shè)計了以原始特征變量為輸入的BPNN(以下稱為BPNN),設(shè)計方法、參數(shù)設(shè)置與前面相同,經(jīng)過反復(fù)試驗確定最佳網(wǎng)絡(luò)結(jié)構(gòu)為40-18-1,平均學(xué)習(xí)次數(shù)為3 431次。R400等級茶葉兩種網(wǎng)絡(luò)的學(xué)習(xí)曲線如圖2所示,由圖2可以看出,PCA-BPNN相比BPNN學(xué)習(xí)效率明顯提高。
表3茶葉不同貯藏時間前5個主成分方差及貢獻率
Table3Thevarianceandcontributionrateofthefirstfiveprincipalcomponentsofteaunderdifferentstoragetime
等級主成分方差貢獻率/%累計貢獻率/%R100F145.5648.5548.55F222.4723.9472.49F39.7210.3682.85F48.288.8291.67F51.691.8093.47R200F147.1646.3446.34F232.4731.9078.24F36.526.4084.64F45.315.2289.86F52.692.6492.50R400F145.8944.6244.62F237.1036.0780.69F36.025.8586.54F45.114.9791.51F53.012.9394.44R1000F150.7653.1753.17F224.3225.4778.64F37.357.7086.34F44.134.3390.67F51.011.0691.73R2000F149.2449.2849.28F227.4627.4876.76F311.3111.3288.08F43.093.0991.17F52.312.3193.48
2.5PCA-BPNN模型預(yù)測結(jié)果
利用PCA-BPNN和BPNN對5個等級不同貯藏時間的15個測試樣本進行預(yù)測。兩個網(wǎng)絡(luò)模型對各等級茶葉貯藏時間預(yù)測結(jié)果如表5所示。
表4PCA-BPNN不同中間層節(jié)點數(shù)學(xué)習(xí)結(jié)果
Table 4Learning results of PCA-BPNN with different node numbers in middle layer
隱層單元數(shù)學(xué)習(xí)次數(shù)誤差445640.01641320.01736850.01823450.011022230.011228510.011541070.012039810.01
表5兩個網(wǎng)絡(luò)模型對各等級茶葉貯藏時間的預(yù)測結(jié)果
Table 5Predicted storage time of each level by 2 networks
從分析結(jié)果看,PCA-BPNN最大預(yù)測誤差為21 d,BPNN為35 d;PCA-BPNN預(yù)測誤差超過10 d的樣本數(shù)及比例均小于BPNN。說明PCA-BPNN的預(yù)測精度優(yōu)于BPNN。PCA-BPNN對各等級茶葉不同貯藏時間預(yù)測平均值如圖3所示。
圖2 R400等級茶葉2種網(wǎng)絡(luò)的學(xué)習(xí)曲線Fig.2 Learning curves of 2 networks for R400
圖3 PCA-BPNN對各等級茶葉不同貯藏時間預(yù)測平均值Fig.3 Predicted average value of each level of tea under different storage time using PCA-BPNN
本文利用電子鼻對5個等級6個貯藏時間下的黃山毛峰茶進行檢測。通過PCA提取出不同貯藏時間各等級茶葉前5個主成分,以5個主成分作為BPNN的輸入建立了茶葉貯藏時間預(yù)測模型。從預(yù)測結(jié)果分析,PCA-BPNN對于5個等級6個貯藏時間的茶葉樣本最大預(yù)測誤差為21 d。對于貯藏0 d的茶葉,最大預(yù)測誤差為11 d,5個(6.67%)樣本預(yù)測誤差超過10 d;對于貯藏60 d的茶葉,最大預(yù)測誤差為13 d,4個(5.33%)樣本預(yù)測誤差超過10 d;對于貯藏120 d的茶葉,最大預(yù)測誤差為16 d,7個(9.33%)樣本預(yù)測誤差超過10 d;對于貯藏180 d的茶葉,最大預(yù)測誤差為19 d,8個(10.67%)樣本預(yù)測誤差超過10 d;對于貯藏240 d的茶葉,最大預(yù)測誤差為21 d,8個(10.67%)樣本預(yù)測誤差超過10 d;對于貯藏300 d的茶葉,最大預(yù)測誤差為14 d,6個(8.00%)樣本預(yù)測誤差超過10 d。與以原始特征向量作為輸入量建立的BPNN的預(yù)測模型相比,PCA-BPNN建模效率和預(yù)測精度更高,性能更好。因此,PCA與BPNN結(jié)合的方法可用于黃山毛峰茶不同貯藏時間的檢測,且更有效,對于其他種類茶葉品質(zhì)檢測亦具有一定的借鑒意義。
[1]趙菁. 綠茶特征香氣成分及與品質(zhì)的關(guān)系研究[D].杭州:浙江大學(xué),2002.
[2]楊俊. 電子鼻識別中的預(yù)處理與模糊神經(jīng)網(wǎng)絡(luò)算法[D].大連:大連理工大學(xué),2007.
[3]尹芳緣,曾小燕,徐薇薇,等.基于電子鼻的芒果儲存時間預(yù)測方法研究[J].傳感技術(shù)學(xué)報,2012,25(9):1199-1203.
[4]HUI G H, WU Y L, YE D D, et al. Study of peach freshness predictive method based on electronic nose[J].FoodControl, 2012, 28(1):25-32.
[5]LIU M, HAN X, TU K, et al. Application of electronic nose in Chinese spirits quality control and flavour assessment[J].FoodControl, 2012, 26(2):564-570.
[6]ZHOU Q, ZHANG S, LI Y, et al. A Chinese liquor classification method based on liquid evaporation with one unmodulated metal oxide gas sensor[J].Sensors&ActuatorsBChemical, 2011, 160(1):483-489.
[7]洪雪珍,韋真博,海錚,等.基于電子鼻和神經(jīng)網(wǎng)絡(luò)的牛肉新鮮度的檢測[J].現(xiàn)代食品科技, 2014,30(4):279-285.
[8]BALASUBRAMANIAN S, PANIGRAHI S, LOGUE C M, et al. Neural networks-integrated metal oxide-based artificial olfactory system for meat spoilage identification[J].JournalofFoodEngineering, 2009, 91(1):91-98.
[9]于慧春,王俊.電子鼻技術(shù)在茶葉品質(zhì)檢測中的應(yīng)用研究[J].傳感技術(shù)學(xué)報, 2008, 21(5):748-752.
[10]陳哲,趙杰文.基于電子鼻技術(shù)的碧螺春茶葉品質(zhì)等級檢測研究[J].農(nóng)機化研究,2012,34(11):133-137.
[11]唐萬梅. BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化問題的研究[J].系統(tǒng)工程理論與實踐,2005 (10): 95-100.
[12]ZHENG L, LUKAC R, WU X, et al. PCA-based spatially adaptive denoising of CFA images for single-sensor digital cameras.[J].IEEETransactionsonImageProcessing, 2009, 18(4):797-812.
(責(zé)任編輯高峻)
Study on analysis method of storage time of Huangshanmaofeng tea by electronic nose
YANG Chun-lan, XUE Da-wei*, BAO Jun-hong
(DepartmentofElectronicandElectricalEngineering,BengbuUniversity,Bengbu233030,China)
Five levels of Huangshanmaofeng tea with 6 varied storage time were detected by electronic nose. Firstly, the original feature vectors presenting the tea odor were acquired. Then, the first 5 principal components were extracted as the principal feature vectors by principal component analysis (PCA). With the principal feature vectors used as BPNN input, a new model called PCA-BPNN for storage time analysis of Huangshanmaofeng tea was built. After experimental test, it was shown that for the tea of 0 d storage, the maximum prediction error (MPE) was 11 d, and the samples of prediction error exceeding 10 d was 5 (6.67%); for the tea of 60 d storage, MPE was 13 d, and the samples of prediction error exceeding 10 d was 4 (5.33%); for the tea of 120 d storage, MPE was 16 d, and the samples of prediction error exceeding 10 d was 7 (9.33%); for the tea of 180 d storage, MPE was 19 d, and the samples of prediction error exceeding 10 d was 8 (10.67%); for the tea of 240 d storage, MPE was 21 d, and the samples of prediction error exceeding 10 d was 8 (10.67%); for the tea of 300 d storage, MPE was 14 d, and the samples of prediction error exceeding 10 d was 6 (8.00%). In conclusion, PCA-BPNN model could be used to analyze the storage time of Huangshanmaofeng tea, and the proposed model was better than BPNN, which used original feature vectors as the input.
electronic nose; PCA; BPNN; prediction model
10.3969/j.issn.1004-1524.2016.04.21
2015-12-15
安徽省高等學(xué)校省級自然科學(xué)研究項目(KJ2013Z195);安徽省高等學(xué)校優(yōu)秀青年人才基金項目(2012SQRL218);國家級大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計劃項目(201511305023)
楊春蘭(1980—),女,安徽固鎮(zhèn)人,碩士,講師,研究方向為儀器儀表與智能檢測、食品品質(zhì)檢測。E-mail: chlyang1981@126.com
,薛大為,E-mail: bbxuedawei@163.com
TP29
A
1004-1524(2016)04-0676-06
楊春蘭,薛大為,鮑俊宏. 黃山毛峰茶貯藏時間電子鼻檢測方法研究[J]. 浙江農(nóng)業(yè)學(xué)報,2016,28(4): 676-681.