秦剛,宋海燕,陸輝山
(1.山西農(nóng)業(yè)大學(xué) 工學(xué)院,山西 太谷030801;2.中北大學(xué) 機(jī)械工程與自動(dòng)化學(xué)院,山西 太原030051)
醋是山西特色產(chǎn)品之一,但市場(chǎng)上山西醋品種太多 ,“寧化府”,“水塔”,“東湖”,“四眼井” ……數(shù)不勝數(shù),這使得一些投資少、技術(shù)低的“游擊隊(duì)”、“雜牌軍”趁機(jī)而入充斥市場(chǎng),嚴(yán)重影響了山西“老陳醋”的形象。對(duì)山西老陳醋開展品種快速鑒別,建立其品牌庫(kù),可以大大改善此局面。
近紅外光譜分析技術(shù)是一種快速、無(wú)損、綠色的分析檢測(cè)技術(shù),在農(nóng)產(chǎn)品[1~4]和食品安全領(lǐng)域的應(yīng)用越來(lái)越廣,如在液體食品(如酒類[5~8]和醋[9~14]等)的主要成分檢測(cè)和品種、陳釀年份上的應(yīng)用。陳醋陳釀過(guò)程中由于生產(chǎn)工藝的不同導(dǎo)致陳醋內(nèi)部成分和品質(zhì)的差異,這為利用可見/近紅外光譜技術(shù)對(duì)不同品種的老陳醋進(jìn)行判別分析提供了依據(jù)。
本文采用可見/近紅外透射光譜分析技術(shù)分別獲取4個(gè)(東湖、古燈、寧化府、水塔)不同品牌山西老陳醋的光譜特性曲線,并對(duì)其進(jìn)行分析,建立主成分分析和神經(jīng)網(wǎng)絡(luò)鑒別模型,并進(jìn)行了驗(yàn)證。
試驗(yàn)樣品均為市售常見山西老陳醋,分別為東湖、古燈、寧化府、水塔品種,每個(gè)品種60個(gè)樣本,共240個(gè)樣本。建模時(shí)樣本隨機(jī)分成校正樣本和預(yù)測(cè)樣本,校正樣本設(shè)置為180個(gè),每個(gè)品種45個(gè);預(yù)測(cè)樣本設(shè)置為60個(gè),每個(gè)品種15個(gè)。
老陳醋的可見/近紅外透射光譜曲線使用美國(guó)ASD(Analytical Spectral Device)公司的Handheld FieldSpec光譜儀及其相應(yīng)的透射附件進(jìn)行采集。其光譜采樣間隔(波段寬)1.5 nm,測(cè)定范圍350~2500 nm,掃描次數(shù)30次,分辨率3.5 nm。液體樣品池為5 mm光程的石英比色皿,試驗(yàn)采用空氣為參比,在室溫下進(jìn)行光譜采集。
經(jīng)ASD View Spec Pro軟件對(duì)光譜數(shù)據(jù)進(jìn)行一階、二階微分處理,然后再以ASCII碼形式將原始、一階、二階微分光譜導(dǎo)出,最后在MAT LAB環(huán)境中實(shí)現(xiàn)主成分神經(jīng)網(wǎng)絡(luò)定性判別。
人工神經(jīng)網(wǎng)絡(luò)技術(shù)是一種大規(guī)模并行的非線性動(dòng)力系統(tǒng)。在識(shí)別那些人們所不易觀察的變量之間的相互關(guān)系上,也擁有較強(qiáng)的能力,因此得到預(yù)測(cè)科學(xué)研究者的重視[15]。與建立各種數(shù)學(xué)模型一樣,正確獲取輸入變量是建立神經(jīng)網(wǎng)絡(luò)最關(guān)鍵的一步。大量光譜數(shù)據(jù)的輸入,既增加了計(jì)算量 ,又會(huì)使所建模型與訓(xùn)練樣本集產(chǎn)生“過(guò)擬合”,反而影響模型精度。因此,本研究將主成分分析作為神經(jīng)網(wǎng)絡(luò)的前處理。主成分分析是多元統(tǒng)計(jì)中的一種數(shù)據(jù)挖掘技術(shù)。其主要思路是將原變量進(jìn)行轉(zhuǎn)換,使數(shù)目較少的新變量成為原變量的線性組合,而且新變量在不丟失原始信息的前提下,能夠最大限度地表征原變量的數(shù)據(jù)結(jié)構(gòu)特征,并且彼此之間不相關(guān),以達(dá)到簡(jiǎn)化的目的。
4個(gè)不同品種山西老陳醋的原始可見/近紅外平均光譜如圖1所示。從圖中可以看出:4個(gè)品種(東湖DH 、古燈GD、寧化府NHF、水塔 ST)山西陳醋的可見/近紅外光譜曲線變化趨勢(shì)基本一致,光譜在500~600nm和1400~1900nm波段處有比較強(qiáng)的吸收峰;在600~1900nm波段范圍內(nèi)可直觀地看出品種間的差別,但真正區(qū)分判別還必須結(jié)合化學(xué)計(jì)量學(xué)方法對(duì)所得的光譜數(shù)據(jù)進(jìn)行處理,通過(guò)建立老陳醋品種的分類判別模型才能知道它們之間的差異。圖2是其對(duì)應(yīng)的一階微分可見/近紅外平均光譜,從中可以看出4個(gè)品種的光譜差異很難區(qū)分。
圖1 不同品種山西老陳醋的原始可見/近紅外光譜Fig.1 Vis/NIR transmittance raw spectra of four different varieties of mature vinegar
圖2 不同品種山西老陳醋的一階微分可見/近紅外光譜Fig.2 1st derivative transmittance spectra of four different varieties of mature vinegar
從圖1可以看出,光譜曲線的首端和末段都有較大的噪音,為消除這些影響選取600~1900 nm波段的光譜進(jìn)行研究。為研究不同老陳醋品種光譜間的差異,找到可以區(qū)分不同品種陳醋的最佳譜圖,分別對(duì)4個(gè)不同品種的原始光譜、一階微分光譜、二階微分光譜采用主成分神經(jīng)網(wǎng)絡(luò)進(jìn)行鑒別分析。再對(duì)其原始光譜、一階微分光譜、二階微分光譜數(shù)據(jù)進(jìn)行主成分分析后,原始光譜、一階微分光譜、二階微分光譜的前32、42、40個(gè)主成分的累計(jì)貢獻(xiàn)率達(dá)到99.9%,說(shuō)明這些主成分能夠很好地表征原數(shù)據(jù)的信息。將這些主成分?jǐn)?shù)作為神經(jīng)網(wǎng)絡(luò)的輸入,1、2、3、4分別表示不同品種,作為神經(jīng)網(wǎng)絡(luò)的輸出(1表示東湖,2表示古燈,3表示寧化華府,4表示水塔),建立不同品種陳醋的神經(jīng)網(wǎng)絡(luò)模型。表1為采用主成分神經(jīng)網(wǎng)絡(luò)對(duì)校正樣本分類的鑒別結(jié)果。本研究中,采用四舍五入法來(lái)計(jì)算正確分類百分比,例如對(duì)東湖老陳醋,其輸出值若在0.45~1.45范圍內(nèi),則認(rèn)為其判別正確。
表1 校正樣本純醋品種的鑒別結(jié)果Table 1 Analysis results for calibration set
由表1可以看出,原始光譜結(jié)合主成分神經(jīng)網(wǎng)絡(luò)對(duì)陳醋品種的鑒別效果最佳,樣品正確分類百分比為92.1%,其次為一階微分光譜,二階微分光譜的鑒別效果最差。
根據(jù)上述分析,選用原始光譜結(jié)合主成分神經(jīng)網(wǎng)絡(luò)建立的鑒別模型對(duì)預(yù)測(cè)集的60個(gè)樣品的原始光譜進(jìn)行預(yù)測(cè)分析,其分析結(jié)果見圖3。
從圖3可以看出,東湖有4個(gè)鑒別錯(cuò)誤,其正確分類百分比為73.3%;古燈有2個(gè)鑒別錯(cuò)誤,其正確分類百分比為86.7%;寧化府有1個(gè)鑒別錯(cuò)誤,其正確分類百分比為93.3%;水塔有2個(gè)鑒別錯(cuò)誤,其正確分類百分比為86.7%。60個(gè)樣本的總體正確分類百分比為85.0%。由此可見,原光譜數(shù)據(jù)結(jié)合主成分神經(jīng)網(wǎng)絡(luò)技術(shù)實(shí)現(xiàn)陳醋品種鑒別還是可行的。
圖3 人工神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)60個(gè)未知純醋樣品Fig.3 Prediction results for 60 unknown samples by PCA-ANN
本文應(yīng)用可見/近紅外透射光譜分析技術(shù)結(jié)合主成分神經(jīng)網(wǎng)絡(luò)對(duì)山西陳醋品種進(jìn)行了判別分析。結(jié)果表明:應(yīng)用可見/近紅外原始透射光譜結(jié)合主成分神經(jīng)網(wǎng)絡(luò)判別分析法,對(duì)山西老陳醋的不同品種進(jìn)行分類,校正集分類的正確率為92.1%,預(yù)測(cè)正確率為85.0%??梢?近紅外透射光譜分析技術(shù)用于山西老陳醋品種的定性分析具有簡(jiǎn)單快速、無(wú)需樣品預(yù)處理的優(yōu)點(diǎn),且具有較好的分類結(jié)果,對(duì)山西老陳醋的品種快速鑒別有一定實(shí)用價(jià)值。
[1]夏俊芳,李培武,李小昱,等.不同預(yù)處理對(duì)近紅外光譜檢測(cè)臍橙Vc含量的影響[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2007,38(6):107-111.
[2]鄒小波,趙杰文,夏蓉,等.蘋果糖度近紅外光譜小波去噪和iPLS建模[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2006,37(6):79-82.
[3]田海清,應(yīng)義斌,徐惠榮,等.西瓜可溶性固形物含量近紅外透射檢測(cè)技術(shù)[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2007,38(5):111-113.
[4]曾一凡,劉春生,孫旭東,等.可見/近紅外光譜技術(shù)無(wú)損檢測(cè)果實(shí)堅(jiān)實(shí)度的研究[J].農(nóng)業(yè)工程學(xué)報(bào),2008,24(5):250-252.
[5]彭幫柱,龍明華,岳田利,等.傅立葉變換近紅外光譜法檢測(cè)白酒總酸和總酯[J].農(nóng)業(yè)工程學(xué)報(bào),2006,22(12):216-219.
[6]陳斌,王豪,林松,等.基于相關(guān)系數(shù)法與遺傳算法的啤酒酒精度近紅外光譜分析[J].農(nóng)業(yè)工程學(xué)報(bào),2005,21(7):99-102.
[7]于海燕,應(yīng)義斌,傅霞萍,等.近紅外透射光譜應(yīng)用于黃酒酒齡的定性分析[J].光譜學(xué)與光譜分析,2007,27(5):920-923.
[8]H Y Yu,H R Xu.Prediction of Trace Metals in Chinese Rice Wine by Fourier Transform Near-infrared Spectroscopy[J].Transactions of the ASABE,2006,49(5):1463-1467.
[9]陳斌,黃傳旭,李國(guó)權(quán),等.模極大值法在食醋近紅外光譜定量分析中的應(yīng)用[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2005,36(5):65-67.
[10]Fei Liu,Yong He,Li Wang.Determination of effective wavelengths for discrimination of fruit vinegars using near infrared spectroscopy and multivariate analysis[J].Analy tica Chimica Acta,2008,615(1):10-17.
[11]王莉,劉飛,何勇.應(yīng)用可見/近紅外光譜技術(shù)進(jìn)行白醋品牌和pH值的快速檢測(cè)[J].光譜學(xué)與光譜分析,2008,28(4):813-816.
[12]王莉,李增芳,何勇,等.應(yīng)用近紅外光譜技術(shù)快速檢測(cè)果醋糖度[J].光譜學(xué)與光譜分析,2008,28(8):810-813.
[13]Fei Liu,Yong He,Li Wang.Comparison of calibrations foe the determination of soluble solids content and pH of rice vinegars using visible and short-wave near infrared spectroscopy[J].Analytica Chimica Acta,2008,610(2):196-204.
[14]M onica Casale,Maria-Jose Saiz Abajo,Jose-M aria Gonzalez Saiz,et al.Study of the aging and oxidation processes of vinegar samples from different origins during storage by near-infrared spectroscopy[J].Analytica Chimica Acta,2006,557:360-366.
[15]楊建剛.人工神經(jīng)網(wǎng)絡(luò)實(shí)用教程[M].杭州:浙江大學(xué)出版社,2001:1-5.