韓斯琴高娃, 李 楠, 薛 蘭, 哈斯烏力吉
(1.內(nèi)蒙古民族大學(xué)附屬醫(yī)院,內(nèi)蒙古通遼 028043;2.東北農(nóng)業(yè)大學(xué)文理學(xué)院,黑龍江哈爾濱 150030;3.哈爾濱工業(yè)大學(xué)可調(diào)諧(氣體)激光技術(shù)國家重點實驗室,黑龍江哈爾濱 150080)
砷類礦物藥在我國用于治療疾病有著悠久的歷史,我國已發(fā)現(xiàn)的最古醫(yī)方“伍十二病方”(約公元前三世紀(jì)末)中就有雄黃治疥癬和磐石治疥癬、瘡瘍、狂犬病的記載[1]。隨著現(xiàn)代科技的發(fā)展,砷類礦物藥的一些奇特療效被進一步發(fā)掘,如劇毒礦物藥砒霜被發(fā)現(xiàn)有很好的抗癌效果,獲得了國際公認(rèn)[2]。砷類礦物藥主要有雄黃、雌黃、信石和砒霜等[3]。雄黃的主要化學(xué)成分是As2S2或As4S4[4],雌黃的主要化學(xué)成分是As2S3,信石和砒霜的主要化學(xué)成分是As2O3。已有研究報道As2O3既是雄黃的藥效活性部分,又是毒性成分[5]。因此在制定雄黃及其炮制品的質(zhì)量標(biāo)準(zhǔn)時,除了要規(guī)定主成分的含量,關(guān)鍵是要限定As2O3的含量,以保證雄黃既能充分發(fā)揮其療效,又能最大限度地控制其毒性[6]。對于雄黃和雌黃等砷類礦物藥而言,一般都含有少量的As2O3。這是因為礦物藥一般原生于自然界中,多為同族礦物、共生礦物及泥土(多為粘土)共生,因此同樣潛在含有As2O3。另外,雄黃和雌黃均是還原性物質(zhì),長期存放或與某些物質(zhì)作用,可發(fā)生氧化還原反應(yīng)生成As2O3[7]。
目前,砷及砷鹽的測定方法主要有古蔡氏法、二乙基二硫代氨基甲酸銀法、氫化物發(fā)生-原子吸收分光光度法、電感耦合等離子體質(zhì)譜法和高效液相色譜-電感耦合等離子質(zhì)譜法[8]。但上述方法的儀器設(shè)備昂貴,提取、分離等前處理過程較復(fù)雜,無法用于砷類礦物藥的快速檢測,因此研究一種快速、簡便、準(zhǔn)確、價格低廉的檢測方法具有十分重要的意義。
拉曼光譜分析方法具有信息豐富、無需樣品處理、檢測快速便捷、高特異性等優(yōu)點,它能反映出不具紅外活性分子的對稱性振動和非極性基團的振動,可用來彌補紅外光譜上不顯示的吸收峰或很弱的峰[9]。到目前為止,雖然有人用拉曼光譜技術(shù)檢測過雄黃、雌黃和信石[10 - 12],但是無人利用拉曼光譜技術(shù)對砷類礦物藥進行分類識別。本文建立了拉曼光譜技術(shù)結(jié)合主成分分析(PCA)-支持向量機(SVM)分類識別砷類礦物藥的新方法。
本實驗使用BWS415-785H型(B & W Tek,Inc.)便攜式拉曼光譜儀采集光譜數(shù)據(jù)。
雄黃、雌黃、信石和砒霜均購置于中藥材市場。
拉曼光譜儀的激發(fā)光源為785 nm的二極管激光器,光譜測量范圍為68~2 700 cm-1,光譜分辨率小于3 cm-1。使用焦距為6.8 mm的透鏡匯聚光束,聚焦后的光斑尺寸約為10 μm,測量功率為20 mW,積分時間為2 s。數(shù)據(jù)采集及光譜處理均采用光譜儀自帶軟件Bwram 1.01.20。
把固體粉末樣品放到鋁箔膠帶上,用拉曼光譜儀探頭直接檢測,然后使用Boxcar平滑方法對采集到的光譜進行平滑處理,并使用軟件自帶算法對光譜數(shù)據(jù)進行背景扣除。
四種砷類礦物藥的拉曼光譜如圖1所示。從圖可看出,雄黃的拉曼峰位于143 cm-1、183 cm-1、193 cm-1、221 cm-1、355 cm-1和413 cm-1等處[10,11]。雌黃的拉曼光譜位于180 cm-1、203 cm-1、293 cm-1、310 cm-1、354 cm-1和384 cm-1等處[12]。砒霜和信石的拉曼光譜位于85 cm-1、185 cm-1、269 cm-1、371 cm-1、471 cm-1、561 cm-1和782 cm-1等處[10,13]。砒霜和信石的主要成分均是As2O3,因此拉曼光譜基本相同。
圖1 雄黃、雌黃、信石和砒霜的拉曼光譜圖Fig.1 Raman spectra of realgar,orpiment,arsenolite and arsenic
上述四種砷類礦物藥拉曼光譜的歸屬,如表1所列。
表1 雄黃、雌黃、信石和砒霜拉曼特征峰的歸屬
主成分分析(PCA)是一種特征預(yù)處理的分析技術(shù),可以提取一些對于結(jié)果有幫助的特征,從而降低模式識別的計算量[14]。光譜數(shù)據(jù)具有高維度并且包含無效的信息,所以可以利用PCA對數(shù)據(jù)預(yù)處理。PCA通過數(shù)據(jù)協(xié)方差矩陣的特征值分解獲得正交基,并將數(shù)據(jù)轉(zhuǎn)換為域矩陣。然后對數(shù)據(jù)的方差做出更大貢獻的域被保留成為主成分(PCs),因此PCA可以減少多維數(shù)據(jù)集,并去除隨機偏差(噪聲)。支持向量機(SVM)是由統(tǒng)計學(xué)理論發(fā)展而來的一種智能學(xué)習(xí)機,其原理是在空間中尋找區(qū)分不同數(shù)據(jù)的最佳分類平面[15]。SVM的基本原理描述如下:給定一組不同類的數(shù)據(jù),構(gòu)造一個最優(yōu)的線性分類形成具有最大間隔的超平面,同時使經(jīng)驗分類誤差最小化、幾何間隔最大化。在不是線性可分的數(shù)據(jù)集的情況下,將原始數(shù)據(jù)映射到由內(nèi)核函數(shù)給出的高維特征空間。在這種特征空間構(gòu)造一個線性分類,這相當(dāng)于在原始輸入空間構(gòu)造一個非線性分類。
采用PCA-SVM算法建立拉曼光譜鑒別模型,SVM分類器采用網(wǎng)格搜索選擇最佳參數(shù),并對模型進行10次交叉驗證,PCA及SVM均使用Python中Scikit-learn庫。具體步驟如下:獲得光譜數(shù)據(jù)后,利用PCA法對其進行預(yù)處理,然后利用SVM算法將樣品分別進行分類。
對圖1所示的四種砷類礦物藥的拉曼光譜進行了PCA-SVM分類識別,如圖2所示。從圖中可以看出,PC1、PC2的累加貢獻率為85.3%,能夠進行準(zhǔn)確的分類識別。
圖2 雄黃、雌黃、信石和砒霜的拉曼光譜的PCA-SVM分類識別圖Fig.2 PCA-SVM classification and identification of realgar,orpiment,arsenolite and arsenic
分別采集了五個批次雄黃的拉曼光譜并對光譜進行了PCA-SVM分類識別,結(jié)果如圖3所示。從圖3a可看出,不同批次雄黃的主要拉曼特征峰基本相同,但是1號、3號和4號雄黃的拉曼光譜在269 cm-1處出現(xiàn)了As2O3的特征峰,表明這些雄黃中可能含有微量的As2O3[16]。另外,5號雄黃的拉曼光譜在293 cm-1和310 cm-1處出現(xiàn)了雌黃的特征峰,表明該雄黃中可能含有少量的雌黃。從圖3b還可看出,PC1、PC2的累加貢獻率為82.9%,能夠進行準(zhǔn)確的分類識別。雖然不同批次雄黃的拉曼光譜比較相似,尤其是1號和4號雄黃,用肉眼幾乎無法進行區(qū)分,但是通過智能識別算法能夠?qū)ζ溥M行準(zhǔn)確的分類識別,這表明PCA-SVM是從雄黃拉曼光譜所含有的全部信息進行分類識別,并非僅僅考慮少數(shù)幾個拉曼特征峰的峰位、峰強的差異,因此與肉眼識別相比更準(zhǔn)確、更全面、更科學(xué)[17]。
圖3 五種不同雄黃的拉曼光譜(a)及其PCA-SVM分類識別圖(b)Fig.3 Raman spectra (a) and PCA-SVM classification and identification (b) of realgar of different origin
為了驗證269 cm-1處的拉曼峰是否屬于As2O3特征峰,在269 cm-1處不出現(xiàn)特征峰的2號雄黃中加入少量的砒霜,制備了雄黃和砒霜混合物,并對其進行了拉曼光譜檢測,如圖4所示。從圖可看出,其混合物也在269 cm-1處出現(xiàn)了特征峰,且與1號雄黃和As2O3在此處的位置幾乎相同,這表明269 cm-1處的特征峰很可能就是As2O3的特征峰。從圖還可以看出,2號雄黃和砒霜的混合物的拉曼光譜在85 cm-1處出現(xiàn)了As2O3的特征峰,而1號和2號雄黃在此處的拉曼特征峰不明顯,這很可能是因為該特征峰屬于As2O3的晶格平移模式,而雄黃所含微量As2O3的晶體結(jié)構(gòu)與砒霜主成分As2O3的晶體結(jié)構(gòu)不同的緣故[18]。另外,除了上述兩個特征峰之外,砒霜的其它特征峰強度太弱或與雄黃的特征峰重疊一起,因此差異不明顯。
圖4 兩種雄黃、砒霜、雄黃和砒霜混合物的拉曼光譜Fig.4 Raman spectra of two realgar,arsenic,realgar and arsenic mixtures
本文建立了拉曼光譜技術(shù)結(jié)合PCA-SVM法分類識別砷類礦物藥的新方法。分別測定了雄黃、雌黃、信石和砒霜的拉曼光譜,并對其進行了歸屬。介紹了PCA-SVM分類識別法,并對上述四種砷類礦物藥的拉曼光譜進行了PCA-SVM分類識別,其PC1、PC2的累計貢獻率為85.3%。測定了五個批次雄黃的拉曼光譜,并對其進行了PCA-SVM分類識別,PC1、PC2的累計貢獻率為82.9%,能夠進行準(zhǔn)確的分類識別。另外,對五個批次雄黃拉曼光譜的差異進行了分析,并驗證了兩種雄黃在269 cm-1處的特征峰很可能就是As2O3的特征峰。該方法具有快速、便捷和準(zhǔn)確等優(yōu)點,對砷類礦物藥的檢測及質(zhì)量控制具有一定的應(yīng)用價值。