黃曉瑋,鄒小波,趙杰文,石吉勇,張小磊
(江蘇大學(xué)食品與生物工程學(xué)院,江蘇鎮(zhèn)江212013)
花茶在中國具有悠久的歷史,是一種獨特的茶葉品種,如玫瑰花茶、洛神花花茶、月季花茶等等.花茶不僅僅味道芳香,而且花茶中含有的花青素有較強的保健作用.花青素又稱花色素,是一類廣泛存在于植物中的水溶性天然色素,屬花青素類化合物,其抗自由基氧化能力為維生素E的50倍、維生素C的20倍,另外花青素還具有抗炎癥、抑制腫瘤、抗誘變、皮膚保健、改善微循環(huán)、保護腦和脊髓神經(jīng)、抑制酶活性、抗病毒抗真菌、抗?jié)?、促進毛發(fā)生長、減肥等很多功效,因此花青素含量可作為衡量花茶質(zhì)量的重要指標[1-3].目前花青素含量的常規(guī)檢測方法主要有分光光度計檢測法、高效液相色譜法(HPLC),這些方法檢測結(jié)果準確,但是費時、費力,消耗大量化學(xué)試劑,運行和維護的成本較高,不利于大樣本的快速檢測[3-5].
近紅外光譜法(near infrared spectroscopy,NIR)是一種快速無損的檢測方法,隨著計算機軟件技術(shù)的發(fā)展,其在石油、醫(yī)藥、農(nóng)產(chǎn)品等的檢測上顯示出了巨大的潛力[6-11],因此本研究用近紅外光譜方法檢測花茶花青素含量.由于樣本成分的復(fù)雜性和相干性,在對樣品近紅外光譜數(shù)據(jù)建立預(yù)測模型時,為了減小運算時間、剔除噪聲過大的譜區(qū),需要確定組分的特征譜區(qū)[12-14].此外優(yōu)選特征譜區(qū)也具有一定實際運用價值,因為工程應(yīng)用中的濾光片和LED光源都有一定的帶寬,優(yōu)選到的特征譜區(qū)可以為挑選合適的濾光片和LED光源提供參考.
國內(nèi)外學(xué)者對近紅外光譜特征波長選擇方法的研究有很多,文獻[15]中有詳細介紹,每種方法均有各自的優(yōu)劣[16-17].例如,目前比較常用的光譜信息提取方法有區(qū)間偏最小二乘法(interval partial least squares,iPLS),該方法雖然能有效提取光譜中與特定組分最相關(guān)的譜區(qū),但建模時光譜區(qū)間的挑選方法比較單一,往往只考察單個子區(qū)間或者少數(shù)幾個子區(qū)間,使得挑選出來的子區(qū)間不能很好地表征光譜的特征信息,難以保證模型具有最佳的預(yù)測效果.
蟻群算法(ant colony optimization,ACO)是近年來發(fā)展起來的一種優(yōu)化算法,它是模仿螞蟻覓食方式的一種啟發(fā)式算法[18],但利用蟻群算法來優(yōu)化選擇光譜區(qū)間的研究報道較少.本研究將ACO和iPLS相結(jié)合來優(yōu)選光譜區(qū)間,發(fā)揮各自的長處,既發(fā)揮ACO的魯棒性和分布式計算特性的能力,又利用iPLS去除變量之間的共線性能力,提高模型的精度和預(yù)測能力.
研究發(fā)現(xiàn),螞蟻在其覓食路上會留下一種被稱為信息素的物質(zhì),并且在搜尋的過程中能夠感知出信息素的存在及強度,以此作為其選擇路徑的參考.螞蟻在覓食過程中,通常朝著信息素強度大的方向運動,某一條路經(jīng)過的螞蟻越多、信息素便越強、后來者選擇該路徑的概率也就越大.此外,信息素還會揮發(fā),路徑越長、時間越長,信息素揮發(fā)得愈多,信息素的強度就越小.信息素的累積和揮發(fā)的總和成為信息交流的媒體.相互協(xié)作的蟻群就是通過這種信息正反饋原理來完成最佳路徑搜尋的.
圖1是ACO-iPLS的流程圖.
圖1 ACO-iPLS優(yōu)選光譜區(qū)間的流程圖
假設(shè)將光譜分為m個區(qū)間,有k只螞蟻來進行優(yōu)化.其算法簡要介紹如下:
1)信息素含量初始化.每個區(qū)間擁有相同的信息素含量,τi(0)=?(i=1,2,…,m).
2)解的選擇.每只螞蟻基于概率函數(shù)選取特征區(qū)間,最簡單有效的概率選擇方法為
其中:τi(t)是區(qū)間i在時間t時所擁有的信息素含量.這一選擇過程簡要描述如下:① 多個區(qū)間的選擇概率和通過公式accu(i)=accu(i-1)+P(i)來計算,其中accu(0)=0,當然accu(m)=1(m是所有區(qū)間總數(shù));② 產(chǎn)生一個 (0,1)之間的隨機變量,如果這個隨機變量在accu(i-1)和accu(i)之間,則第i個區(qū)間入選.這種選擇方法廣泛用于遺傳算法中,顯然,光譜區(qū)間擁有的信息素量越多就越容易被選到,可以通過權(quán)重函數(shù)來調(diào)整各個區(qū)間的選擇概率.
3)解的計分評價.建立一個標準或客觀函數(shù)來評價多得的解.本研究中基于已選區(qū)間上的iPLS模型預(yù)測精度作為每只螞蟻所選區(qū)間的評價參數(shù),即模型的預(yù)測均方根誤差RMSEP的倒數(shù)作為評價函數(shù).
4)信息素含量的更新.每個區(qū)間的信息素含量的更新通過以下公式計算:
其中:i為第i個光譜區(qū)間;r為區(qū)間信息素含量遺留率,對應(yīng)信息素含量揮發(fā)率e(r=1-e),r為(0,1)之間的常數(shù);Δτi(t)為信息素含量的增長值,它與每只螞蟻在所選區(qū)間上建立的iPLS模型精度成正比,即建立在該區(qū)間上的模型精度越高則信息素含量越多.在整個選擇過程中,信息素含量的揮發(fā)率可以通過預(yù)先設(shè)定的揮發(fā)率e來獲得.
重復(fù)以上2)到4)步中k個螞蟻的“選擇”、“計分評價”和“更新”這一迭代過程,最終通過一定數(shù)量的迭代后,理論上所有螞蟻都會收斂到相同的區(qū)間變量上,從而得到最佳光譜區(qū)間.更多有關(guān)ACO的算法請參考文獻[19-21].
從超市購買6種花茶(山茶花茶、洛神花花茶、月季花茶、玫瑰花茶、康乃馨花茶、勿忘我花茶),每種花茶分別用粉碎機粉碎,并過40目篩,然后按照四分法原則,隨機稱取2 g左右的粉末作為一個樣本,每種花茶取10個平行樣本,6種花茶共60個樣本.
設(shè)備包括AntarisⅡ型傅里葉變換近紅外光譜儀(美國賽默飛世爾公司);UV-1601型紫外分光光度計.
本試驗采用InGaAs檢測器,波數(shù)范圍10 000~4 000 cm-1,掃描次數(shù)為32次;分辨率為8 cm-1,波數(shù)間隔為3.853 6 cm-1,每條光譜包含有1 557個變量.數(shù)據(jù)采集過程中,室內(nèi)濕度保持基本不變,溫度保持在25℃左右.由于花茶粉末為不透明顆粒,所以試驗采用積分球的漫反射式采樣方式,每個樣本掃描一次后將樣品池旋轉(zhuǎn)120°,共掃描3次,取其平均光譜作為該樣本的原始光譜,如圖2所示.
圖2 花茶原始光譜圖
采用pH試差法測定花茶中花青素的含量,具體方法如下:準確稱取2 g花茶粉末,加入100 mL含有1 mol·L-1檸檬酸的70%乙醇溶液,放入60℃水浴鍋中浸提4 h后,經(jīng)真空抽濾,60℃旋轉(zhuǎn)蒸發(fā)10 min,取0.5 mL濃縮后的溶液于2個50 mL容量瓶中,分別用pH值為1的鹽酸緩沖液和pH為4.5的醋酸鈉緩沖液定容至刻度線,分別靜置50 min和80 min,用分光光度計在513 nm和730 nm下測定吸光度值,花青素質(zhì)量分數(shù)的計算公式為[22]
其中:A為吸光度,A=(A513pH1.0-A700pH1.0)-(A513pH4.5-A700pH4.5);DF為稀釋因子;ε 為矢車菊花青素-3-葡萄糖普的消光系數(shù),26 900;MW為矢車菊花青素-3-葡萄糖普的相對分子質(zhì)量,449.4;V為最終體積,mL;Wt為產(chǎn)品質(zhì)量,mg;L為光程,1 cm.
60個樣本花茶中的花青素含量統(tǒng)計結(jié)果如表1所示,花青素質(zhì)量分數(shù)為 0.175 9~1.603 6 mg·g-1,每種花茶隨機選擇其中6個樣本作為校正集,4個樣本作為預(yù)測集,校正集共36個樣本,預(yù)測集共24個樣本.
試驗中花茶樣本顆粒的粒徑大小和樣本的密實度不可能完全一致,將會影響到光在固體顆粒內(nèi)的漫反射.因而,需要對樣本的原始光譜數(shù)據(jù)進行預(yù)處理,本試驗采用SNV預(yù)處理.SNV首先從原光譜中減去該條光譜的平均值,再除以標準偏差,主要用于消除由于樣品顆粒大小不均勻和密實度不一樣對光譜的影響[16,23-25],預(yù)處理后的光譜圖如圖3所示.
圖3 經(jīng)SNV預(yù)處理后的花茶光譜圖
表1 花茶樣本花青素質(zhì)量分數(shù)實測值
花茶粉末近紅外光譜不僅包含了花青素信息,還包含了除花青素以外的組分信息.同時,由于花青素在近紅外光譜的多個波長處有吸收,且近紅外光譜的譜峰較寬,致使近紅外光譜在1個波長處有多個譜峰重疊,難以確定花青素特征子區(qū)間寬度.為了使ACO-iPLS準確定位包含花青素特征波長的子區(qū)間,需要對子區(qū)間劃分總數(shù)進行優(yōu)化.
ACO-iPLS通過選擇光譜子區(qū)間寬度、螞蟻數(shù)、迭代次數(shù)、PLS模型變量數(shù)來選擇最佳光譜區(qū)間進行建模.目標函數(shù)是判斷種群中個體優(yōu)劣和群體優(yōu)化程度的標準,選擇1個合適的目標函數(shù)可以加速算法收斂,提高計算精度.目標函數(shù)包括方差、標準差等.試驗結(jié)果表明,選擇均方差作為目標函數(shù)能夠較快地收斂,因此文中選擇了均方根誤差作為目標函數(shù).
將預(yù)處理后的光譜數(shù)據(jù)劃分為m個子區(qū)間,m的取值范圍為10~30.當m取不同值時,采用ACO-iPLS選擇的特征子區(qū)間如表2所示.
表2 ACO-iPLS子區(qū)間優(yōu)選結(jié)果
從表2中可以看出,當光譜劃分為12(即m=12)時,對應(yīng)的交互驗證均方根誤差(RMESCV)最小,選擇窗口寬帶為122 cm-1,每個光譜子區(qū)間對所建模型的權(quán)重系數(shù)是不相同的,如圖4所示.
圖4 ACO-iPLS光譜區(qū)間選擇
選擇權(quán)重系數(shù)≥0.3的子區(qū)間進行建模,滿足上述條件的共有3個子區(qū)間:第1子區(qū)間(系數(shù)為1.00);第9子區(qū)間(系數(shù)為0.81);第10子區(qū)間(系數(shù)為1.00),這3個子區(qū)間對應(yīng)的光譜范圍分別為4 000 ~4 466,7 764 ~8 231,8 235 ~8 701 cm-1.在上述3個子區(qū)間的基礎(chǔ)上,用iPLS建模,將所選光譜區(qū)間集合劃分為25個子區(qū)間時,模型的預(yù)測精度和計算效率最高,校正集預(yù)測值和實測值之間的相關(guān)系數(shù)為0.901 3;預(yù)測集預(yù)測值和實測值之間的相關(guān)系數(shù)為0.864 2,其RMSECV和RMSEP分別為0.160 0和0.202 0 mg·g-1,如圖5 所示.
圖5 ACO-iPLS最佳模型的預(yù)測值與實測值之間的關(guān)系
為了對建模效果進行比較,分別對PLS、iPLS進行建模,結(jié)果如表3所示.從表3中可以看出,ACO-iPLS建模波數(shù)變量數(shù)為366個,而PLS模型和iPLS模型需要的波數(shù)變量數(shù)分別 1 557個和86個,ACO-iPLS模型的精度要優(yōu)于其他2個模型(雖然預(yù)測集的R值稍低,但RMSEP值較小,表明模型對外部樣本的預(yù)測能力較高);iPLS建模只需一個光譜區(qū)間,較ACO-iPLS建模所需的少,但是模型的精度和預(yù)測能力較ACO-iPLS有一定的差距.
表3 不同譜區(qū)篩選的模型的結(jié)果
本研究利用ACO-iPLS對花茶粉末近紅外光譜優(yōu)選出3個花青素對應(yīng)的特征子區(qū)間,并結(jié)合花青素含量值建立了光譜模型.對應(yīng)的RMSECV和RMSEP分別為 0.160 0 mg·g-1和 0.202 0 mg·g-1,校正集和預(yù)測集相關(guān)系數(shù)為0.901 3和0.864 2.研究結(jié)果充分表明,同全光譜PLS模型、iPLS模型相比,ACO-iPLS極大地減少了建模所需的波數(shù)點,降低了模型復(fù)雜度,同時明顯提高了模型的預(yù)測精度和計算效率,為近紅外光譜技術(shù)的在線運用提供了一套建模解決方案.
References)
[1]方世輝,徐國謙,夏 濤,等.花茶窨制中幾個主要因子對花茶香氣的影響[J].安徽農(nóng)業(yè)大學(xué)學(xué)報,2004,31(4):440-445.Fang Shihui,Xu Guoqian,Xia Tao,et al.Influences of main factors on the aroma of flowering teas[J].Journal of Anhui Agricultural University,2004,31(4):440-445.(in Chinese)
[2]陳 健,孫愛東,高雪娟,等.藍莓花青素的提取及抗氧化性的研究[J].北京林業(yè)大學(xué)學(xué)報,2011,33(2):126-129.Chen Jian,Sun Aidong,Gao Xuejuan,et al.Extraction and antioxidation of anthocyanins from blueberry[J].Journal of Beijing Forestry University,2011,33(2):126-129.(in Chinese)
[3]Sarma Annamraju D,Sreelakshmi Yellamraju,Sharma Rameshwar.Antioxidant ability of anthocyanins against ascorbic acid oxidation[J].Phytochemistry,1997,45(4):671-674.
[4]李鳳英,崔蕊靜,鄭立紅,等.植物中原花青素含量的分析測定[J].食品與發(fā)酵工業(yè),2004,30(5):147-149.Li Fengying,Cui Ruijing,Zheng Lihong,et al.Study on deter mination of contents of proanthocyanidins in plants[J].Food and Fermentation Industries,2004,30(5):147-149.(in Chinese)
[5]Patil Ganapathi,Madhusudhan M C,Ravindra Babu B,et al.Extraction,dealcoholization and concentration of anthocyanin from red radish[J].Chemical Engineering and Processing:Process Intensification,2009,48(1):364-369.
[6]李 剛,趙 靜,李家星,等.可見-近紅外反射光譜用于疾病快速篩查[J].光學(xué)學(xué)報,doi:10.3788/AOS201131.0317001.Li Gang,Zhao Jing,Li Jiaxing,et al.Visible-Infrared reflectance spectroscopy applied in rapid screen of diseases[J].ActaOpticaSinica, doi:10. 3788/AOS201131.0317001.(in Chinese)
[7]郭偉良,王 丹,宋 佳,等.近紅外光譜法同時快速定量分析蛹蟲草菌絲體中4種有效成分[J].光學(xué)學(xué)報,doi:10.3788/AOS201131.0230002.Guo Weiliang,Wang Dan,Song Jia,et al.Simultaneous and rapid quantitative analysis of four components in cordyceps militaris mycelium powder using near infrared spectroscopy[J].Acta Optica Sinica,doi:10.3788/AOS201131.0230002.(in Chinese)
[8]張海紅,張淑娟,王鳳花,等.應(yīng)用可見-近紅外光譜快速識別沙棘汁品牌[J].光學(xué)學(xué)報,2010,30(2):574-578.Zhang Haihong,Zhang Shujuan,Wang Fenghua,et al.Study on fast discrimination of seabuckthorn juice varieties using visible-nir spectroscopy[J].Acta Optica Sinica,2010,30(2):574-578.(in Chinese)
[9]聶黎行,王鋼力,李志猛,等.近紅外光譜法在中藥生產(chǎn)過程分析中的應(yīng)用[J].光學(xué)學(xué)報,2009,29(2):541-547.Nie Lixing,Wang Gangli,Li Zhimeng,et al.Application of near infrared spectroscopy in process analysis of TCM manufacturing[J].Acta Optica Sinica,2009,29(2):541-547.(in Chinese)
[10]周子立,蔣璐璐,談黎虹,等.基于光譜技術(shù)鑒別機油品種的新方法[J].光學(xué)學(xué)報,2009,29(8):2203-2207.Zhou Zili,Jiang Lulu,Tan Lihong,et al.Discrimination of oil varieties by using near infrared spectral technology[J].Acta Optica Sinica,2009,29(8):2203-2207.(in Chinese)
[11]趙建華,趙崇文,魏周君,等.基于近紅外光譜技術(shù)的多組分毒性氣體檢測研究[J].光學(xué)學(xué)報,2010,30(2):567-573.Zhao Jianhua,Zhao Chongwen,Wei Zhoujun,et al.Study on monitoring multi-component toxic gases based on near-infrared spectroscopic method[J].Acta Optica Sinica,2010,30(2):567-573.(in Chinese)
[12]石吉勇,鄒小波,趙杰文,等.BiPLS結(jié)合模擬退火算法的近紅外光譜特征波長選擇研究[J].紅外與毫米波學(xué)報,2011,30(5):458-462.Shi Jiyong,Zou Xiaobo,Zhao Jiewen,et al.Selection of wavelength for strawberry NIR spectroscopy based on BiPLS combined with SAA[J].Journal of Infrared and MillimeterWaves,2011,30(5):458-462.(in Chinese)
[13]孫旭東,章海亮,歐陽愛國,等.南豐蜜桔可溶性固形物近紅外特征波段選擇[J].農(nóng)業(yè)機械學(xué)報,2009,40(7):129-132.Sun Xudong,Zhang Hailiang,Ouyang Aiguo,et al.Selection of NIR characteristic wavelength bands for soluble solids content in nanfeng mandarin fruit[J].Transactions of the Chinese Society for Agricultural Machinery,2009,40(7):129-132.(in Chinese)
[14]Shi Jiyong,Zou Xiaobo,Zhao Jiewen,et al.Near infrared quantitative analysis of total flavonoid content in fresh Ginkgo biloba leaves based on different wavelength region selection methods and partial least squares regression[J].Journal of Near Infrared Spectroscopy,2012,20(2):295-305.
[15]Zou Xiaobo,Zhao Jiewen,Povey Malcolm J W,et al.Variables selection methods in near-infrared spectroscopy[J].Analytica Chimica Acta,2010,667(1/2):14-32.
[16]Chen Quansheng,Jiang Pei,Zhao Jiewen.Measurement of total flavone content in snow lotus(Saussurea involucrate)using near infrared spectroscopy combined with interval PLS and genetic algorithm[J].Spectrochimica Acta Part A-Molecular and Biomolecular Spectroscopy,2010,76(1):50-55.
[17]Zou Xiaobo,Zhao Jiewen,Huang Xingyi,et al.Use of FT-NIR spectrometry in non-invasive measurements of soluble solid contents(SSC)of'Fuji'apple based on different PLS models[J].Chemometrics and Intelligent Laboratory Systems,2007,87(1):43-51.
[18]Franco Allegrini,Alejandro Olivieri C.A new and efficient variable selection algorithm based on ant colony optimization.Applications to near infrared spectroscopy/partial least-squares analysis[J].Analytica Chimica Acta,2011,699(1):18-25.
[19]劉甲林.基于改進蟻群算法的油品調(diào)和配方優(yōu)化研究[D].大連:大連理工大學(xué)電氣工程學(xué)院,2011.
[20]郭 亮,吉海彥.蟻群算法在近紅外光譜定量分析中的應(yīng)用研究[J].光譜學(xué)與光譜分析,2007,27(9):1703-1705.Guo Liang,Ji Haiyan.Application study of ant colony algorithm in near infrared spectroscopy quantitative analysis[J].Spectroscopy and Spectral Analysis,2007,27(9):1703-1705.(in Chinese)
[21]朱 峰,陳 莉.蟻群與遺傳算法融合的聚類算法研究[J].西北大學(xué)學(xué)報:自然科學(xué)版,2009,39(5):745-749.(5):601-605.Zhang Zhe,Liu Dengying.Non-Fourier effects in rapid transient heat conduction in a spherical medium[J].Journal of Engineering Thermophysics,1998,19(5):601-605.(in Chinese)
[2]Moosaie A.Non-Fourier heat conduction in a finite medium with insulated boundaries and arbitrary initial conditions[J].International Communications in Heat and Mass Transfer,2008,35(1):103-111.
[3]Lord H M,Shulman Y.A generalized dynamical theory of thermoelasticity[J].Journal of the Mechanics and Physics of Solids,1967,15(5):299-309.
[4]Green A E,Lindsay K A.Thermoelasticity[J].Journal of Elasticity,1972,2(1):1-7.
[5]Green A E,Naghdi P M.Thermoelasticity without energy dissipation[J].Journal of Elasticity,1993,31(3):189-208.
[6]Huang H M,Su F,Sun Y.Thermal shock of semi-infinite body with multi-pulsed intense laser radiation[J].Acta Mechanica Solida Sinica,2010,23(2):175-180.
[7]Yilbas B S,Al-Aqeel N.Analytical investigation into laser pulse heating and thermal stresses[J].Optics and Laser Technology,2009,41(2):132-139.
[8]王穎澤,張小兵,葛風華.急速熱沖擊作用下實心球體的熱彈性響應(yīng)分析[J].江蘇大學(xué)學(xué)報:自然科學(xué)版,2012,33(4):414-419.Wang Yingze,Zhang Xiaobing,Ge Fenghua.Thermoelastic response of a solid sphere under transient thermal shock[J].Journal of Jiangsu University:Natural Science Edition,2012,33(4):414-419.(in Chinese)[9]Tian X G,Shen Y P.Study on generalized magnetothermoelastic problems by FEM in time domain[J].Acta Mech Sinica,2005,21(4):380-387.
[10]Wang X,Xu X.Thermoelastic wave induced by pulsed laser heating[J].Applied Physics A:Materials Science and Processing,2001,73(1):107-114.
[11]Bagri A,Eslami M R.A unified generalized thermoelasticity solution for cylinders and spheres[J].International Journal of Mechanical Sciences,2007,49(12):1325-1335.
[12]Wang Y Z,Zhang X B,Song X N.A unified generalized thermoelasticity solution for the transient thermal shock problem[J].Acta Mechanica,2012,223(4):735-743.
[13]王洪鋼.熱彈性力學(xué)概論[M].北京:清華大學(xué)出版社,1989.