孫全昌,楊 明,候華毅
光學(xué)信息與模式識別湖北省重點(diǎn)實(shí)驗(yàn)室(武漢工程大學(xué)),湖北 武漢430205
在許多中低收入國家,瘧疾仍然是一個主要的公共衛(wèi)生問題,全球有十億以上人處于瘧疾高風(fēng)險(xiǎn)中[1-2]。20世紀(jì)70年代,屠呦呦從青蒿中分離得到一種含有過氧基團(tuán)的倍半萜內(nèi)酯藥物——青蒿素,并因該重大發(fā)現(xiàn)獲得2015年諾貝爾醫(yī)學(xué)獎[3]。從此之后,青蒿素在抗擊瘧疾特別是對于腦部瘧疾和耐氯喹的瘧疾中發(fā)揮了至關(guān)重要的作用[4]。
優(yōu)質(zhì)的青蒿素才能有效地治療瘧疾[5]。不幸的是,在很多低收入和中等收入國家的市場上出現(xiàn)了各種假冒偽劣青蒿素藥物[6-8]。劣質(zhì)青蒿素不僅導(dǎo)致發(fā)病率和死亡率的增長,也導(dǎo)致了瘧疾耐藥性的增加[9-11]。因此,劣質(zhì)青蒿素的普遍存在對醫(yī)護(hù)人員來說是一個巨大的挑戰(zhàn),發(fā)展一種快速鑒別和篩選青蒿素品質(zhì)的分析技術(shù)對于提高抗瘧藥的質(zhì)量有重要的作用。目前,篩選藥物質(zhì)量有多種分析方法,包括高效液相色譜(high performance liquid chromatography,HPLC)[12-14]、毛細(xì)管電泳法和光譜法等[15-17]。其中,HPLC被視為標(biāo)準(zhǔn)分析方法。盡管HPLC靈敏度高且可以提供樣品的綜合信息,但是HPLC儀器的維護(hù)和操作以及結(jié)果的分析都需要大量的人力和技術(shù)支持。此外,樣品的制備和分析費(fèi)時又費(fèi)錢。因此,在中低收入國家/地區(qū)使用HPLC進(jìn)行青蒿素的大范圍質(zhì)量篩查不切實(shí)際。
近紅外光譜和拉曼光譜技術(shù)具有高通量、高精度、快速分析和不需要樣品制備等優(yōu)點(diǎn)[15-17],在資源匱乏的國家具有極大的優(yōu)勢和應(yīng)用潛力[18-19]。已經(jīng)證明,拉曼光譜比紅外光譜在藥物鑒定和劣質(zhì)藥物區(qū)分方面具有更大的優(yōu)勢。在本文中,我們通過拉曼光譜聯(lián)合正交偏最小二乘法判別分析(orthogonal projections to latent structuresdiscriminant analysis,OPLS-DA)進(jìn)行青蒿素鑒定和不同純度的青蒿素樣品鑒別。結(jié)果表明該方法在青蒿素鑒定方面具有較強(qiáng)的發(fā)展前景,對于實(shí)際應(yīng)用中的青蒿素質(zhì)量評估具有積極的意義。
在相同條件下研究了6種不同純度的青蒿素樣 品(A:97.87%,B:97.97%,C:98.12%,D:98.73%,E:99.29%,F(xiàn):99.60%標(biāo)準(zhǔn)參考樣品)。樣品A到E購自上海麥克林生物化學(xué)技術(shù)有限公司,樣品F購自國藥生物科技有限公司。所有樣品的純度均通過HPLC分析得到(Agilent 1260,美國;色譜柱:Eclipse Plus C18色譜柱,4.6 mm×250 mm,5μm;V(流動相)∶V(甲醇-水)(75∶25);流速:1 mL/min;柱溫:25℃;檢測波長:205 nm)。在實(shí)驗(yàn)中,將每100 mg初始樣品轉(zhuǎn)移至定制的壓片機(jī)中制成壓片樣品,用于拉曼實(shí)驗(yàn)。
青蒿素樣品的拉曼光譜是通過XperRam200光譜儀(Nanobase公司,韓國)獲得,該光譜儀連接Olympus BX41M-LED顯微鏡(50X物鏡,NA=0.55)。激光器的波長為532 nm,樣品表面的激光功率約為3 mW,光斑尺寸約為2μm。光譜采集波數(shù)范圍為100~1 950 cm-1,采集時間為20 s。通過使用Si襯底的521 cm-1聲子模式對所有光譜進(jìn)行波數(shù)校正。
使用Origin 8.5(OriginLab公司,美國)進(jìn)行原始拉曼光譜的基線校正,平滑和歸一化?;€校正的方法采用自適應(yīng)迭代懲罰最小二乘法(adaptive iteratively reweighted penalized least squares,AIR-PLS),這是一種無需任何干預(yù)和初始信息即可對拉曼光譜進(jìn)行基線校正的新穎算法。利用SIMCA軟件v.14.1(Umetrics公司,瑞典)進(jìn)行OPLS-DA分析。正交偏最小二乘法(orthogonal projections to latent structures,OPLS)是偏最小二乘法(partial least squares,PLS)的擴(kuò)展,在查找特定樣本和數(shù)據(jù)集變量的相關(guān)性方面優(yōu)勢明顯[20-21]。當(dāng)變量具有高度相關(guān)性時,OPLS優(yōu)于PLS。本文中由于青蒿素樣品彼此之間具有高度的相關(guān)性,差異主要是純度不同,因此我們選擇OPLS-DA方法。青蒿素樣品的分類直接通過OPLS-DA模型的主成分評分反映出來,其魯棒性和可靠性通過3個參數(shù)R2X(cum),R2Y(cum)和Q2(cum)進(jìn)行評估。R2X(cum)和R2Y(cum)分別表示所有提取分量所解釋的x變量和y變量的平方和的積累,Q2(cum)為提取的分量預(yù)測的所有x變量和y變量的分?jǐn)?shù)。使用SPSS 19.0軟件進(jìn)行統(tǒng)計(jì)分析,通過單因素方差分析(one-way anova)分類變量,概率值(P值)為雙側(cè),且P≤0.05值被認(rèn)為具有統(tǒng)計(jì)學(xué)意義。
圖1顯示了樣品F(標(biāo)準(zhǔn)參考樣品)的拉曼光譜圖。青蒿素(C15H22O5)是一種具有獨(dú)特化學(xué)結(jié)構(gòu)的內(nèi)過氧化物倍半萜烯內(nèi)酯。青蒿素分子具有C1對稱性,其結(jié)構(gòu)如圖1所示。它包含4個環(huán):環(huán)戊內(nèi)酯,雙環(huán)三惡烷,環(huán)己烷和甲基取代基。青蒿素分子中有5個氧原子其中2個(O1和O2)在三惡烷環(huán)中形成獨(dú)特的過氧橋鍵。研究表明,青蒿素中的過氧橋鍵在抗瘧疾活性中起著至關(guān)重要的作用[20-22]。因此,研究與過氧橋鍵相關(guān)的拉曼峰對青蒿素樣品的質(zhì)量篩選尤為重要。
具有C1對稱性的青蒿素分子的全部120個振動模式,全部為拉曼活性模式[23]。圖1中的青蒿素光譜可分為3部分:第1部分200~900 cm-1顯示強(qiáng)帶;第2部分900~1 400 cm-1包含較弱的帶;第3部分1 500~2 000 cm-1僅有3種明顯振動模式。青蒿素的振動模式分配已經(jīng)通過實(shí)驗(yàn)研究和理論計(jì)算完成[25-29]。然而,由于青蒿素分子結(jié)構(gòu)比較復(fù)雜,過氧橋鍵的拉曼振動模式?jīng)]有定論。實(shí)驗(yàn)研究表明,在724 cm-1處的振動模式與過氧橋鍵的振動直接相關(guān)[28-29]。然而理論計(jì)算表明,724 cm-1處振動模式只與過氧橋鍵間接相關(guān),與過氧橋鍵直接相關(guān)的振動模式主要在800~950 cm-1范圍內(nèi)[25-27]。因此綜合實(shí)驗(yàn)研究和理論計(jì)算與過氧橋鍵直接相關(guān)的振動模式應(yīng)在700~950 cm-1的光譜范圍內(nèi),因此本文在該光譜范圍的拉曼光譜上進(jìn)行OPLS-DA建模。在OPLS-DA建模中,共分析了120個振動模式。對于每個不同純度的樣品,測量20個隨機(jī)點(diǎn)的拉曼光譜。圖2(a)和圖2(b)分別顯示了二維和三維OPLS-DA得分圖。該模型獲得了R2X(cum)=0.952,R2Y(cum)=0.767和Q2(cum)=0.624的良好質(zhì)量參數(shù)。這三個值均大于0.6,表明該模型具有良好的擬合度和較高的預(yù)測能力。另外,使用排列測試(排列數(shù)量為200)來驗(yàn)證和評估模型的性能,結(jié)果如圖2(c)所示。原始OPLS-DA模型的R2Y(cum)和Q2(cum)值大于置換模型的所有R2Y和Q2值,這表明原始模型具有較高的預(yù)測能力。R2Y和Q2的截距分別為0.267和0.311,兩者均小于0.4,表明該模型沒有過度擬合。圖2(d)中表示的是變量投影重要度(variable importance for the projection,VIP)。振動模式的VIP值表示此模式對樣品分類的重要性。724 cm-1處的振動模式具有最大的VIP值,因此它對不同純度的青蒿素樣品的分類貢獻(xiàn)最大。
圖1 青蒿素的拉曼光譜圖(內(nèi)插圖為青蒿素的分子結(jié)構(gòu))Fig.1 Raman scattering spectrum of artemisinin(inset is molecular structure of artemisinin)
圖2 不同純度的青蒿素樣品在OPLS-DA模型下的多元統(tǒng)計(jì)分析結(jié)果:(a)二維分?jǐn)?shù)圖(橢圓表示95%置信區(qū)間),(b)三維分?jǐn)?shù)圖,(c)OPLS-DA模型的排列檢驗(yàn)分析(綠點(diǎn)代表R2,藍(lán)點(diǎn)代表Q2),(d)VIP分類圖Fig.2 Multivariate statistical analysis of artemisinin samples with different purity contents by OPLS-DA model:(a)two-dimensional score plot(ellipse represents the 95%confidence interval),(b)three-dimensional score plot,(c)permutation test analysis of OPLS-DA model(green dots represent R2 and blue dots represent Q2),(d)VIPplot of classification
為了進(jìn)一步證實(shí),在724 cm-1處的振動模式對于區(qū)分不同純度的青蒿素樣品具有最大的貢獻(xiàn),繪出了S-line圖。在S-line圖中,通過協(xié)方差和相關(guān)性系數(shù)來尋找受青蒿素純度影響最大的振動模式[30-31]。圖3給出了樣品A(97.87%)和F(99.60%)之間的S-line結(jié)果。從圖3中可以看出,724 cm-1處的振動模式的貢獻(xiàn)(協(xié)方差)值為50,相關(guān)值為0.72。這兩個值都明顯大于其他振動模式的值。因此,我們可以得出結(jié)論,在區(qū)分不同純度的青蒿素樣品時,724 cm-1處的振動模式具有最大的貢獻(xiàn)。這表明該模式將是研究青蒿素生物活性官能團(tuán)的最有代表性的模式,這與以前的結(jié)果一致,即該模式與過氧化橋直接相關(guān)。
圖3 OPLS-DA模型中S-line圖Fig.3 S-line plot of OPLS-DA model
OPLS-DA研究表明,在青蒿素的振動模式中,724 cm-1的模式受到青蒿素純度的影響更加強(qiáng)烈。在不同純度的樣品中,724 cm-1模式的強(qiáng)度將有很大的不同,而其他振動模式的強(qiáng)度不會發(fā)生太大變化。這與圖4中的強(qiáng)度分析結(jié)果一致。在圖4中,繪制了樣品A和F間的20個隨機(jī)點(diǎn)的拉曼峰強(qiáng)度分布,為了便于比較,圖4(a)繪制724 cm-1模式的強(qiáng)度分布,圖4(b)繪制了881 cm-1模式的強(qiáng)度分布。有研究者指出881 cm-1模式可能跟青蒿素過氧橋鍵相關(guān)。如圖4所示,樣品A中724 cm-1模式的平均強(qiáng)度明顯低于樣品F,而樣品A和F中881 cm-1模式的平均強(qiáng)度大致相同。另外,其它振動模式的強(qiáng)度分布行為類似于881 cm-1模式。
雖然目前還不能完全確定位于724 cm-1拉曼峰的物理根源,本研究表明該拉曼峰應(yīng)與過氧橋鍵直接或間接相關(guān),檢測到該拉曼峰可以基本確定過氧橋鍵的存在。青蒿素的振動模式很多,僅運(yùn)用一個特征拉曼峰很難達(dá)到準(zhǔn)確檢測的效果,因而有必要再找一個好的特征拉曼峰。青蒿素分子中另一特征基團(tuán)是環(huán)戊內(nèi)酯基團(tuán),找到對應(yīng)內(nèi)酯基團(tuán)的特征拉曼峰可以更準(zhǔn)確地檢測青蒿素。理論計(jì)算和實(shí)驗(yàn)結(jié)果都表明位于1 734 cm-1的拉曼峰為內(nèi)酯鍵(O11-C10=O)的振動峰[19,31]。同時該峰峰形好,周圍沒有其它峰的干擾,在實(shí)驗(yàn)上可以很好的分辨該拉曼峰。因而位于1 734 cm-1的拉曼峰可以作為拉曼光譜法檢測青蒿素的另外一個好的特征振動模式。并且,基于該特征模式的優(yōu)點(diǎn),選擇1 734 cm-1處的振動模式作為參考模式,724 cm-1處與1 734 cm-1處振動模式的相對強(qiáng)度分析更有助于快速篩查低純度含量不合格的青蒿素樣品。
圖5顯示了相對強(qiáng)度比I(724cm-1)/(1734cm-1)作為青蒿素純度含量的函數(shù)。隨著純度的增加,相對強(qiáng)度比I(724cm-1)/(1734cm-1)也隨之增加。單因素方差分析表明,6個青蒿素樣品之間存在顯著差異(F=7.392 7,P<0.01),證實(shí)了相對強(qiáng)度比I(724cm-1)/(1734cm-1)是一個區(qū)分不同純度含量的青蒿素樣品的良好指標(biāo)。這一發(fā)現(xiàn)將有助于對青蒿素產(chǎn)品的質(zhì)量特別是對于活性藥物成分不足的不合格產(chǎn)品進(jìn)行檢測和分析。
圖4 樣品A和F之間的20個隨機(jī)點(diǎn)在724 cm-1和881 cm-1模式處的拉曼強(qiáng)度分布比較:(a)724 cm-1模式,(b)881 cm-1模式Fig.4 Comparison of Raman intensity distribution of t 20 random spots between sample A and F:(a)724 cm-1 mode,(b)881 cm-1 mode
圖5 六個不同純度含量的青蒿素樣品的相對強(qiáng)度比的分布Fig.5 Distribution of relative intensity ratio for six artemisinin samples with different purity contents
通過拉曼光譜聯(lián)合OPLS-DA模型對不同純度的青蒿素樣品進(jìn)行了實(shí)驗(yàn)分析。結(jié)果表明,該方法可以清楚地區(qū)分不同純度的青蒿素樣品,青蒿素拉曼光譜中與生物活性官能團(tuán)相關(guān)的724 cm-1處的振動模式比其他振動模式對純度更敏感。此外,還證明了在不同純度的青蒿素樣品中,724和1 734 cm-1處的特征振動模式相對強(qiáng)度比在統(tǒng)計(jì)學(xué)上具有統(tǒng)計(jì)學(xué)差異(F=7.39,P<0.01),因此可以作為快速檢測低純度青蒿素的優(yōu)質(zhì)指標(biāo)。