盧 艷,王 鈞,戴陽(yáng)軍
(1.江蘇費(fèi)森尤斯醫(yī)藥藥品有限公司,江蘇常熟215533;2.浙江工業(yè)大學(xué)食品科學(xué)系,浙江杭州310014;3.常熟理工學(xué)院生物與食品工程學(xué)院,江蘇常熟215500)
均值離差平方和在近紅外光譜識(shí)別靈芝和云芝提取物的應(yīng)用
盧艷1,王鈞2,戴陽(yáng)軍3
(1.江蘇費(fèi)森尤斯醫(yī)藥藥品有限公司,江蘇常熟215533;2.浙江工業(yè)大學(xué)食品科學(xué)系,浙江杭州310014;3.常熟理工學(xué)院生物與食品工程學(xué)院,江蘇常熟215500)
摘要:為實(shí)現(xiàn)靈芝提取物和云芝提取物的自動(dòng)化快速鑒別,利用近紅外光譜儀對(duì)靈芝提取物和云芝提取物進(jìn)行近紅外光譜分析,根據(jù)正確率和均值離差平方和(Average of Sum of Difference Square,ASDS)確定最佳預(yù)處理方法,建立距離匹配(Distance Match,DM)判別分析模型.結(jié)果表明:在全波長(zhǎng)范圍內(nèi),采用FD和MSC+FD預(yù)處理,在建模集中,對(duì)樣品的識(shí)別率達(dá)到90.79%,模型預(yù)測(cè)效果好;在外部驗(yàn)證中,驗(yàn)證的識(shí)別率達(dá)到100%,具有很強(qiáng)的應(yīng)用性.上述結(jié)果表明:利用近紅外光譜和均值離差平方和,得出經(jīng)過(guò)一階導(dǎo)數(shù)處理的光譜,在DM模型對(duì)靈芝和云芝提取物分類(lèi)中是可行的.
關(guān)鍵詞:近紅外光譜;距離匹配判別分析;均值離差平方和;靈芝和云芝提取物
近紅外光譜(near infrared spectroscopy, NIR)技術(shù)是一項(xiàng)新的無(wú)損分析技術(shù),在分析化學(xué)領(lǐng)域得到了迅速發(fā)展,并在材料科學(xué)領(lǐng)域也陸續(xù)得到應(yīng)用.由于近紅外光譜是波長(zhǎng)在780~2 500 nm范圍的電磁波,對(duì)植物多糖十分敏感,因此,嘗試?yán)媒t外光譜技術(shù)對(duì)靈芝提取物和云芝提取物識(shí)別進(jìn)行研究[1].許春瑾等利用傅里葉變化近紅外光譜技術(shù)結(jié)合判別分析、聚類(lèi)分析等方法,建立枸杞子產(chǎn)地判別模型,結(jié)果經(jīng)MSC和SNV處理后,其正確率都達(dá)到100%,但是作者并沒(méi)有針對(duì)預(yù)處理作進(jìn)一步分析[2]. Downey等采用可見(jiàn)-近紅外光譜技術(shù),對(duì)特級(jí)初榨橄欖油中摻雜葵花籽油進(jìn)行識(shí)別研究,取得了令人滿(mǎn)意的結(jié)果[3].榮菡等在原光譜的基礎(chǔ)上,利用PLS-模式識(shí)別近紅外光譜技術(shù)快速檢測(cè)鮮乳和摻假乳,判別準(zhǔn)確率就達(dá)到100%[4].
靈芝和云芝提取物都含有多糖、萜類(lèi)等活性物質(zhì),在組分、色澤、顆粒等理化性質(zhì)上很相似,容易混淆,但其臨床應(yīng)用、功能主治等各不相同,這給消費(fèi)者購(gòu)買(mǎi)、企業(yè)日常監(jiān)測(cè)、行業(yè)部門(mén)執(zhí)法監(jiān)管都帶來(lái)了難度.目前品種鑒別方法主要有感官鑒別、顯微鑒別、物理鑒別(排水法、熱重分析法、微量升華法等)、化學(xué)鑒別(薄層、光譜、色譜等)等[4-5].但傳統(tǒng)的鑒別方法比較繁瑣,對(duì)樣品也會(huì)造成污染.
為解決近紅外檢測(cè)和鑒別模型適用性有限的問(wèn)題,本研究選擇不同產(chǎn)地靈芝和云芝的提取物,采用近紅外漫反射光譜技術(shù)結(jié)合距離判別分析,建立靈芝提取物和云芝提取物的判別模型,以期快速,準(zhǔn)確識(shí)別靈芝和云芝提取物,為食用菌提取物實(shí)際生產(chǎn)監(jiān)管、鑒別提供一種快速鑒別的方法.
2.1材料
儀器:稱(chēng)量瓶,傅里葉變換近紅外光譜儀,德國(guó)光譜儀器公司Bruke Optics,型號(hào):MPA.以?xún)x器內(nèi)置背景為參比,采集樣品的漫反射近紅外光譜.波數(shù)范圍為12 500~4 000 cm-1,波數(shù)分辨率為8 cm-1,每個(gè)樣品掃描16次,取其平均光譜作為該樣品的原始光譜.
來(lái)自不同產(chǎn)地的靈芝和云芝提取物各96個(gè)樣品.在外部的驗(yàn)證過(guò)程中,樣品近似按3:1隨機(jī)分為建模集和驗(yàn)證集,152個(gè)樣品用于建模(76個(gè)靈芝提取物,76個(gè)云芝提取物),40個(gè)樣品用于模型驗(yàn)證(20個(gè)靈芝提取物,20個(gè)云芝提取物).
2.2模型以及模型的評(píng)價(jià)
距離匹配判別法是通過(guò)計(jì)算1個(gè)未知樣本的光譜與已知類(lèi)別樣品的平均光譜的距離進(jìn)行分類(lèi)的一種方法,通過(guò)平均測(cè)量距離來(lái)確定如何用一種未知材料與兩種或兩種以上的已知材料進(jìn)行精確匹配的方法[6-9].
對(duì)于建立的識(shí)別模型,其判斷模型的好壞取決于識(shí)別率,但由于樣品數(shù)量的限制,往往出現(xiàn)幾種預(yù)處理?xiàng)l件下得到相同識(shí)別率的情況.均值離差平方和表示樣品散點(diǎn)的分散情況,可以解決樣品量少、預(yù)測(cè)識(shí)別率相同時(shí),對(duì)于預(yù)處理方法同樣能夠做出最優(yōu)的選擇.
2.3數(shù)據(jù)處理
本實(shí)驗(yàn)采用TQ Analysis 8.6軟件進(jìn)行數(shù)據(jù)分析.
3.1樣品近紅外光譜采集
通過(guò)近紅外漫反射分析儀采集靈芝和云芝提取物的全部樣品的原始光譜,分別求其平均光譜.靈芝和云芝平均光譜見(jiàn)圖1.
由圖1可見(jiàn),兩者之間具有一致的吸收峰形,但是兩者之間的差異也是比較明顯的.整體看來(lái),云芝提取物吸光度明顯高于靈芝提取物.在12 000~3 500 cm-1之間兩者近紅外的光譜差異比較大,這主要是與兩種提取物的表面顏色和發(fā)色集團(tuán)的差異有關(guān),在3 500 cm-1以后,兩者的光譜重疊嚴(yán)重.因此需要結(jié)合化學(xué)計(jì)量學(xué)的方法才能加以分析和利用.
圖1 靈芝和云芝提取物的近紅外光譜
3.2光譜數(shù)據(jù)預(yù)處理
由于近紅外光譜儀所采集的光譜除樣品的自身信息外,還包含了其他無(wú)關(guān)信息和噪聲,如電噪聲、樣品背景和雜散光等.因此在用DM識(shí)別模型時(shí),消除光譜數(shù)據(jù)無(wú)關(guān)信息,選擇噪聲的預(yù)處理方法變得十分關(guān)鍵和必要.常用的光譜預(yù)處理方法有多元散射校正(MSC)、變量標(biāo)準(zhǔn)化(SNV)、一階導(dǎo)數(shù)(FD)、二階導(dǎo)數(shù)(SD)等.不同預(yù)處理方法建立識(shí)別模型結(jié)果如表1所示.經(jīng)過(guò)預(yù)處理的光譜的識(shí)別率明顯要高于原始光譜.但是很明顯,經(jīng)過(guò)FD、MSC+FD預(yù)處理后,識(shí)別模型的正確率(CCr%)達(dá)到90.79%,高于其他的預(yù)處理方法.
兩種不同的預(yù)處理的方法,針對(duì)本實(shí)驗(yàn)樣品識(shí)別模型的正確率都達(dá)到90.79%,模型的效果比較好.所以采用FD,MSC+FD方法適合于靈芝提取物和云芝提取物判別分析模型.
表1 不同光譜預(yù)處理對(duì)校正模型識(shí)別結(jié)果的影響(主成分?jǐn)?shù)為10)
圖2 靈芝和云芝提取物的判別分析結(jié)果
3.3模型的建立
對(duì)152個(gè)建模集樣品(靈芝提取物76個(gè),云芝提取物76個(gè))在12 500~4 000 cm-1波數(shù)內(nèi)采用FD,MSC+ FD光譜預(yù)處理方法,圖2(a)為原始光譜結(jié)合FD預(yù)處理方法時(shí),靈芝提取物和云芝提取物判別分析圖,圖2(b)為原始光譜結(jié)合MSC+FD預(yù)處理方法時(shí),靈芝提取物和云芝提取物判別分析圖.由圖2可以看出,3種不同預(yù)處理方法最后的識(shí)別率是相同的.但是很明顯,兩種不同預(yù)處理方法的散點(diǎn)圖的分類(lèi)是不一樣的.
表2 靈芝和云芝提取物的判別分析的均值離差平方和
圖2(a)的散點(diǎn)分布的效果明顯優(yōu)于圖2(b)的,為了更加量化(a)與(b)的差異,引進(jìn)了均值離差平方和(ASDS). ASDS值越大,散點(diǎn)的分布就越偏離y=x,即模型針對(duì)靈芝和云芝提取物的分離效果就越好.
由表2可知,盡管經(jīng)過(guò)FD,F(xiàn)D+MSC預(yù)處理后,靈芝和云芝提取物的識(shí)別率是相同的,但是經(jīng)過(guò)FD預(yù)處理后樣品的ASDA值要明顯大于經(jīng)過(guò)FD+MSC預(yù)處理的,所以,F(xiàn)D預(yù)處理后樣品的識(shí)別效果明顯優(yōu)于FD+MSC預(yù)處理的效果.
3.4模型的驗(yàn)證
根據(jù)上述討論,40個(gè)預(yù)測(cè)樣品對(duì)DM模型進(jìn)行驗(yàn)證.由圖3可知,無(wú)論是靈芝提取物還是云芝提取物,識(shí)別率都達(dá)到100%.實(shí)驗(yàn)表明:在12 500~4 000 cm-1波數(shù)范圍內(nèi),采用FD預(yù)處理結(jié)合距離匹配判別分析法可以很好地對(duì)靈芝和云芝提取物進(jìn)行識(shí)別分類(lèi).
圖3 靈芝和云芝提取物的驗(yàn)證判別分析結(jié)果
采用近紅外光譜分析技術(shù)結(jié)合距離匹配判別分析法對(duì)靈芝和云芝提取物進(jìn)行識(shí)別分析.在建模集中,在12 500~4 000 cm-1波數(shù)范圍內(nèi),原始光譜結(jié)合FD和原始光譜結(jié)合FD+MSC預(yù)處理后,對(duì)樣品的識(shí)別率都是90.79%.再根據(jù)均值離差平方和確定原始光譜結(jié)合FD明顯優(yōu)于原始光譜結(jié)合FD+MSC預(yù)處理,模型的預(yù)測(cè)效果較好.再根據(jù)40個(gè)樣品的外部驗(yàn)證,其識(shí)別率達(dá)到100%.表明基于近紅外光譜技術(shù)結(jié)合化學(xué)計(jì)量學(xué)建立的模型可準(zhǔn)確識(shí)別靈芝和云芝提取物.該結(jié)果對(duì)其他食用菌提取物的分類(lèi)應(yīng)用具有實(shí)際意義.
在近紅外識(shí)別分析中,當(dāng)樣品量比較少時(shí),模型的識(shí)別率不能完全代表模型的優(yōu)劣,但均值離差平方和可以代表樣品散點(diǎn)的分散情況,不僅在DM模型的運(yùn)用,而且在主成分分析和馬氏距離識(shí)別分析等一些定性分析中可以得到很好的運(yùn)用.
參考文獻(xiàn):
[1]楊忠,呂斌,黃安民,等.近紅外光譜技術(shù)快速識(shí)別針葉材和闊葉材的研究[J].光譜學(xué)與光譜分析,2012,32(7):1785-1789.
[2]CHEN Y, XIE M Y, YAN Y, et al. Discrimination of Ganoderma lucidum according to geographical origin with near infrared diffuse reflectance spectroscopy and pattern recognition techniques[J]. Science Direct, 200835(2):121-130.
[3]榮菡,劉波平,鄧澤元,等.基于PLS-模式識(shí)別近紅外光譜技術(shù)快速檢測(cè)鮮乳和摻假乳[J].食品科學(xué),2008,29(8):492-495.
[4]許春瑾,張睿,于修燭,等.基于近紅外光譜的中寧枸杞子判別分析[J].食品科學(xué),2014,35(2):164-167.
[5]DOWNEY G. Food and food authentication by mid-infrared spectroscopy and chemometrics[J]. TrAC Trends in Analytical Chemistry, 1998, 17(7):418-424.
[6]陸婉珍,袁洪福,徐廣通.現(xiàn)代近紅外光譜分析技術(shù)[M].北京:中國(guó)石化出版社,2000:165.
[7]王靈靈,黃亞偉,戚淑葉,等.基于主根橫斷面近紅外光譜的西洋參和人參鑒別研究[J].光譜學(xué)與光譜分析,2012,32(4):925-929.
[8]劉心如,張利平,王建福,等.可見(jiàn)_近紅外漫反射光譜技術(shù)對(duì)羊毛和羊絨的鑒別研究[J].光譜學(xué)與光譜分析,2013,33(8)):2092-2095.
[9]張菊花,朱向榮,李高陽(yáng),等.近紅外光譜法結(jié)合化學(xué)計(jì)量學(xué)方法用于茶油真?zhèn)舞b別分析[J].分析化學(xué),2011,39(5):748-751.
Application of Average of Sum of Difference Square in Discrimination of the Extractions of Ganoderma Lucidum and Versicolor Using Near Infrared Reflectance
LU Yan1, WANG Jun2, DAI Yangjun3
(1. Fresenius Medical Products Co., Ltd. Changshu 215533, China;2. Department of Food Science and Technology, Hangzhou 310014, China;3. School of Biology and Food Engineering, Changshu Institute of Technology, Changshu 215500, China)
Abstract:To develop an automatic and quick method to discriminate between the extractions of Ganoderma lucidum and versicolor by near infrared reflectance(NIR)spectroscopy, the optimum pretreatment method was determined by the correct rate and the average of sum of different square value. And the NIR spectral data of the extractions of Ganoderma lucidum and versicolor samples were analyzed with the Distance Match model. The results showed that in the full wavelengths, with the pretreatment of FD, the total correct rate was 90.79%in the calibration set, and that in the validation set, the total correct rate was 100%,which has a good application. In conclusion, according to the pretreatment of FD, it is feasible to apply NIR to discriminate the extractions of Ganoderma lucidum and versicolor.
Key words:Near infrared reflectance(NIR);Distance Match;Average of Sum of Difference Square;the extractions of Ganoderma lucidum and versicolor
中圖分類(lèi)號(hào):O657.33
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1008-2794(2016)02-0110-04
收稿日期:2015-07-11
通信作者:盧艷,化學(xué)分析師,碩士,研究方向:藥物研發(fā)分析,E-mail:wj19890816@163.com.