石 杰, 李長濱, 吳擁軍, 黃 偉, 嚴(yán)會會, 王麗杰
(1.鄭州大學(xué) 化學(xué)系 河南 鄭州 450001; 2.鄭州大學(xué) 公共衛(wèi)生學(xué)院 河南 鄭州450001)
不同廠家冬凌草片的近紅外光譜主成分聚類分析
石 杰1, 李長濱1, 吳擁軍2, 黃 偉1, 嚴(yán)會會1, 王麗杰1
(1.鄭州大學(xué) 化學(xué)系 河南 鄭州 450001; 2.鄭州大學(xué) 公共衛(wèi)生學(xué)院 河南 鄭州450001)
利用近紅外光譜對不同廠家的冬凌草片進(jìn)行鑒別歸屬,并進(jìn)行快速分類.采集不同廠家不同批次冬凌草片樣品的近紅外漫反射光譜,通過不同計(jì)量學(xué)方法進(jìn)行處理.結(jié)合主成分聚類分析法對不同廠家冬凌草片進(jìn)行聚類判別分析,分類識別正確率達(dá)100%,從而推斷出不同廠家冬凌草片成分及生產(chǎn)工藝上的差別.結(jié)果表明,該方法準(zhǔn)確、快速、簡便,可用于不同廠家冬凌草片的分類鑒別和質(zhì)量控制.
近紅外光譜; 主成分; 聚類分析; 冬凌草片
作為一種新興的檢測手段,近紅外漫反射光譜技術(shù)可用于對樣品的直接測定,無需破壞樣品及制樣,操作簡便、快速.近紅外光譜(NIRS)技術(shù)是利用全譜或部分波段的光譜數(shù)據(jù)進(jìn)行定性或定量分析的無損檢測技術(shù),廣泛應(yīng)用于煙草[1]、食品[2]、石油化工[3]等領(lǐng)域.近年來,近紅外光譜技術(shù)已發(fā)展成為中藥定性判別和定量分析的新興方法[4-6].由于不同廠家的生產(chǎn)工藝和原輔料組成均存在差異,反映在近紅外光譜圖上使得對其進(jìn)行分類鑒別成為可能.
冬凌草為唇形科香茶屬多年生草本或亞灌木,自然分布于太行山南部.其味甘苦,性微寒,具有清熱解毒、消炎止痛、健胃活血之功效,對急慢性咽炎、扁桃體炎、口腔炎有顯著療效[7].冬凌草片由冬凌草浸膏制成,收載于衛(wèi)生部藥品標(biāo)準(zhǔn).作者采用近紅外光譜結(jié)合主成分聚類分析法,實(shí)現(xiàn)了對不同廠家冬凌草片快速、準(zhǔn)確的分類鑒別,對于冬凌草生產(chǎn)工藝的改進(jìn)和假藥的判別有一定的借鑒意義.
1.1儀器與樣品
Antaris 6700型近紅外光譜儀(美國Thermo Nicolet公司),配有銦鎵砷 (InGaSn)檢測器、積分球漫反射采樣系統(tǒng)、樣品旋轉(zhuǎn)器和石英樣品杯;石英研缽;OMNIC光譜采集軟件和TQ 8.0分析軟件;德國Bruker公司開發(fā)的OPUS 5.5分析軟件;藥典篩;BP210S型萬分之一分析天平(德國賽多利斯公司).
河南省濟(jì)源市濟(jì)世藥業(yè)有限公司生產(chǎn)的冬凌草片(糖衣片)22批和冬凌草片(復(fù)方含片)22批,河南省安陽市華安藥業(yè)有限公司生產(chǎn)的冬凌草片23批,河南省安陽市路德藥業(yè)有限公司生產(chǎn)的冬凌草片25批,河南廣宇博科生物制藥有限公司生產(chǎn)的冬凌草片6批,共計(jì)98個(gè)批次.
1.2實(shí)驗(yàn)方法
分別取不同批次的冬凌草片劑20片,磨碎并過100目藥典篩,混勻后取8 g放入測量杯,扣除背景采集其近紅外光譜.采樣方式為積分球漫反射,光譜范圍為12 000~4 000 cm-1,分辨率為8 cm-1,掃描次數(shù)為32次,溫度25~27 ℃,相對濕度45%~50%.每個(gè)樣品重復(fù)測定3次,求其平均值作為樣品的標(biāo)準(zhǔn)光譜.每次掃描前都要對樣品進(jìn)行混勻,并用同一重物壓實(shí)以保證每次的密實(shí)程度一致.預(yù)處理方法為一階導(dǎo)數(shù)+矢量歸一化,聚類方法為Ward算法.98個(gè)批次冬凌草片的近紅外原始光譜疊加圖和一階導(dǎo)數(shù)光譜疊加圖見圖1.
圖1 98個(gè)批次冬凌草片的近紅外原始光譜(A)及一階導(dǎo)數(shù)光譜(B)Fig.1 The original NIR spectrum (A) and first derivative spectrum (B) of donglingcao tablets of 98 batches
2.1建模波段的選擇
建模前對光譜波段進(jìn)行篩選,既可避免引入過多冗余信息,也可避免由于波段選擇較窄而丟掉一些有用的信息.冬凌草片的光譜曲線在高頻段噪聲較大,通過譜區(qū)比較,發(fā)現(xiàn)譜圖在7 283~4 008 cm-1范圍內(nèi)信息量豐富,各種特征信息表現(xiàn)明顯,故取此波段進(jìn)行數(shù)據(jù)處理.
2.2光譜預(yù)處理方法的選擇
高頻隨機(jī)噪聲、基線漂移、樣本不均勻、光散射等因素都會對模型的預(yù)測準(zhǔn)確性和穩(wěn)定性產(chǎn)生較大的影響,因此需要對光譜進(jìn)行預(yù)處理以消除這種影響對預(yù)測帶來的誤差.由圖1可知,對樣品的原始譜圖進(jìn)行一階導(dǎo)數(shù)處理可以有效地消除樣品由于顏色差別引起的基線漂移,使譜圖特征信息更加明顯地表達(dá)出來.通過比較樣品的近紅外原始光譜及一階導(dǎo)數(shù)光譜,發(fā)現(xiàn)一階導(dǎo)數(shù)光譜的鑒別效果優(yōu)于原始光譜.矢量歸一化用以消除光程變化或樣品顆粒大小、密實(shí)程度等變化對光譜產(chǎn)生的影響,選擇樣品的近紅外譜圖9點(diǎn)平滑一階導(dǎo)數(shù)+矢量歸一化方法進(jìn)行優(yōu)化處理.
3.1主成分分析
為了充分利用光譜信息,必須對光譜數(shù)據(jù)進(jìn)行降維處理.主成分分析是常用的有效降維方法,保留多少主成分取決于保留部分的方差和在方差總和中所占的百分比(即累積貢獻(xiàn)率) ,它標(biāo)志著前幾個(gè)主成分概括信息的多寡[8].本實(shí)驗(yàn)對一階導(dǎo)數(shù)+矢量歸一化法處理后的光譜數(shù)據(jù)進(jìn)行主成分分析,主成分?jǐn)?shù)對光譜的影響見表1,可以看出,不同主成分?jǐn)?shù)對鑒別結(jié)果起著關(guān)鍵的作用,前5個(gè)主成分的累積貢獻(xiàn)率已經(jīng)達(dá)到98.08%,主成分?jǐn)?shù)增加到6,累積貢獻(xiàn)率幾乎不變.綜合考慮選擇前5個(gè)主成分來概括表示樣品近紅外光譜的主要信息,此時(shí)可以把不同廠家的樣品區(qū)分開,分類結(jié)果與實(shí)際歸屬一致.
表1 主成分?jǐn)?shù)與累積貢獻(xiàn)率和錯(cuò)判例數(shù)的關(guān)系
3.2聚類分析
將98份樣品中的76份作為校正集用于建立判別分析模型,其余22份作為驗(yàn)證集用于檢驗(yàn)所建模型的性能.校正集樣品的原始光譜經(jīng)過一階導(dǎo)數(shù)+矢量歸一化法處理后,結(jié)合判別分析在7 283~4 008 cm-1波段內(nèi)建立判別分析模型,并對驗(yàn)證集進(jìn)行判別預(yù)測.結(jié)果表明,該模型對校正集樣品的判別和驗(yàn)證集樣品的預(yù)測鑒別都與實(shí)際分類完全一致,判別分析結(jié)果見圖2.
聚類分析是一種無管理模式識別方法,常用于目標(biāo)觀測對象的分類,即利用表征觀測對象的一組變量對目標(biāo)進(jìn)行分類[9].因此,在主成分分析的基礎(chǔ)上引入聚類分析,可排除眾多化學(xué)信息中相互重疊的部分而又不丟失原始數(shù)據(jù)信息,使聚類分析的計(jì)算簡化.本實(shí)驗(yàn)采用Ward算法對冬凌草片進(jìn)行聚類分析,結(jié)果5個(gè)廠家的冬凌草片被清晰地聚為5類.由此可見,建立的模型性能較好,能夠準(zhǔn)確、快速地判別不同廠家的冬凌草片.由樹狀圖可知,聚類分析能夠通過光譜間距離的大小,準(zhǔn)確地把同一廠家的樣品先聚為一類,然后再把與此廠家光譜性質(zhì)相近的樣品聚類,最后與其他廠家的產(chǎn)品聚類,依次進(jìn)行聚類直至把所有產(chǎn)品聚類完成.圖3中冬凌草片的聚類分析結(jié)果與實(shí)際分類結(jié)果一致.通過聚類分析,找出不同廠家樣品之間的信息特征,從而達(dá)到了鑒別的目的.
圖2 冬凌草片的判別分析圖Fig.2 Discriminate analysis diagram of donglingcao tablets
圖3 冬凌草片的聚類分析圖Fig.3 Clustering analysis diagram of donglingcao tablets
1)中藥的化學(xué)成分比較復(fù)雜,且由于絕大部分中藥輔料都含有淀粉、糊精、蔗糖等,成分相似,NIRS信息重疊嚴(yán)重,各樣品的特征信息很難從峰位、峰形、峰強(qiáng)等方面直觀鑒別,因此,必須借助于化學(xué)計(jì)量學(xué)的方法對譜圖進(jìn)行優(yōu)化處理,突出樣品之間化學(xué)成分的細(xì)小差異,從而達(dá)到鑒別的目的.不同廠家的冬凌草片由于其化合物的種類和含量、藥品采集以及制備方法存在差異,結(jié)合近紅外光譜技術(shù)和計(jì)量學(xué)處理技術(shù),使得不同廠家的樣品分類判別成為可能.
2)外界環(huán)境和外部因素對光譜的重現(xiàn)性影響比較大,因此,測樣時(shí)間要盡量集中并保持外部環(huán)境一致.作者對藥品顆粒度、裝樣量、密實(shí)程度進(jìn)行了統(tǒng)一處理,以增強(qiáng)不同廠家樣品光譜間的可比性,減少了外部因素引起的實(shí)驗(yàn)誤差.
3)NIRS聚類分析結(jié)果與實(shí)際分類完全吻合,說明NIRS分析技術(shù)具有較好的重現(xiàn)性和可靠性.實(shí)驗(yàn)通過將NIRS與主成分聚類分析法相結(jié)合,建立了鑒別不同廠家冬凌草片的新方法.結(jié)果表明,該方法準(zhǔn)確、快速、無損,可用于不同廠家冬凌草片的判別分析,同時(shí)對冬凌草片生產(chǎn)工藝的改進(jìn)和冬凌草片假藥的初步判別也有一定的借鑒意義.
[1] 張鼎方.近紅外技術(shù)應(yīng)用于成品卷煙的內(nèi)在質(zhì)量穩(wěn)定性控制[J].福建分析測試,2009,18(2):39-44.
[2] 孫通,徐惠榮,應(yīng)義斌.近紅外光譜分析技術(shù)在農(nóng)產(chǎn)品/食品品質(zhì)在線無損檢測中的應(yīng)用研究進(jìn)展[J].光譜學(xué)與光譜分析,2009,29(1):122-126.
[3] 錢平,孫國琴,張存洲.基于近紅外光譜技術(shù)的石油組分定量分析新方法[J].光譜學(xué)與光譜分析,2008,28(12):2851-2854.
[4] 李艷英,白雁,陳志紅,等.近紅外漫反射光譜法測定不同廠家一清顆粒的含量[J].藥物分析雜志,2009,29(7):1126-1129.
[5] 吳擁軍,李偉,相秉仁,等.近紅外光譜技術(shù)用于白芷類中藥的鑒定研究[J].中藥材,2001,24(1):26-28.
[6] 聶黎行,王剛力,李志猛,等.近紅外光譜法在中藥輔料質(zhì)量控制中的應(yīng)用[J].中國中藥雜志,2009,34(17):14-17.
[7] 劉俊鵬,于玲,王亞娟.冬凌草片質(zhì)量標(biāo)準(zhǔn)研究[J].藥物研究,2008,46(13):31-32.
[8] 王麗,何鷹,王顏萍,等.近紅外光譜技術(shù)結(jié)合主成分聚類分析判別海面溢油種類[J].海洋環(huán)境科學(xué),2004,23(2):58-60.
[9] 劉木清,周德成,徐新元,等.聚類算法用于中藥材的近紅外光譜分析[J].光譜學(xué)與光譜分析,2007,27(10):1985-1988.
ClusteringAnalysisforPrincipalComponentsofDonglingcaoTabletsfromDifferentManufacturersbyNearInfraredSpectroscopy
SHI Jie1, LI Chang-bin1, WU Yong-jun2, HUANG Wei1, YAN Hui-hui1, WANG Li-jie1
(1.DepartmentofChemistry,ZhengzhouUniversity,Zhengzhou450001,China;2.CollegeofPublicHealth,ZhengzhouUniversity,Zhengzhou450001,China)
Near infrared spectroscopy (NIRS) was used in the identification and rapid classification of donglingcao tablets from different manufacturers. NIRS technology was employed to collect near infrared spectra of donglingcao tablets. Different chemometrics methods and clustering analysis for principal components were used to discriminate donglingcao tablets. The correct classification rate was 100%,and it could be concluded that the composition and production process of donglingcao tablets were different. The results indicated that the method was accurate,rapid,simple,and it could be applied to classification and quality controlling of donglingcao tablets produced by different manufacturers.
near infrared spectroscopy;principal component;clustering analysis;donglingcao tablet
O 657.3
A
1671-6841(2011)04-0067-04
2011-04-29
國家自然科學(xué)基金資助項(xiàng)目,編號J0830412;河南省重大公益科研項(xiàng)目,編號081100912500.
石杰(1950- ),男,教授,主要從事食品與藥物分析研究,E-mail:shijie@zzu.edu.cn;通訊作者:李長濱(1983- ),男,碩士研究生,主要從事近紅外技術(shù)在藥物分析和新藥開發(fā)方面的研究,E-mail:lichangbin911@163.com.