趙凌藝,楊 馨,魏 懿,楊瑞琴*,趙 倩,張洪文,蔡偉平
1. 中國人民公安大學偵查學院,北京 100038 2. 刑事科學技術(shù)北京市重點實驗室,北京 100038 3. 中國人民公安大學信息網(wǎng)絡(luò)安全學院,北京 100038 4. 中國科學院合肥物質(zhì)科學研究院固體物理研究所,安徽 合肥 230031
目前,毒品濫用仍是一個全球性問題,由此引發(fā)的犯罪、事故與疾病傳播給社會穩(wěn)定和公共衛(wèi)生帶來了極大的威脅。根據(jù)《2021年中國毒情形勢報告》,在我國現(xiàn)有吸毒人員中,海洛因濫用的比例占近40%,仍是主要濫用毒品之一。海洛因被攝入體內(nèi)后,會逐步代謝成為6-單乙酰嗎啡(6-MAM)和嗎啡[1]。鑒于海洛因依舊是高風險阿片類毒品,建立高效、便捷、精準的海洛因及其代謝物的檢測與識別方法對毒品管控、打擊毒品犯罪至關(guān)重要。常規(guī)的海洛因及其代謝物的鑒定技術(shù)主要有色譜法和免疫分析法[1-2]。但這些方法通常需要較為復(fù)雜耗時的樣品前處理過程、昂貴的大型儀器和專業(yè)的操作人員。表面增強拉曼光譜(SERS),能夠提供分子的特征指紋譜圖。與常規(guī)拉曼光譜相比,SERS可以通過貴金屬(Au、Ag等)納米材料的局域表面等離激元共振效應(yīng)極大地增強分析物的拉曼信號[3-4],適用于痕量物質(zhì)的分析檢測[5];同時,SERS還具有響應(yīng)快速、操作簡單、無損檢測等優(yōu)點。因此,SERS在毒品鑒定中具有很好的應(yīng)用前景。近年來,基于SERS鑒定毒品的研究工作已有一些報道[6-9]。其中,也有針對海洛因及其代謝物的研究,例如:2020年,Akcan等將經(jīng)預(yù)處理的加標唾液樣品與Ag納米粒子混合后滴加在Au納米棒陣列上,以對唾液中的海洛因及其代謝產(chǎn)物(嗎啡、嗎啡-3-β-葡萄糖醛酸、6-MAM)進行檢測[8]。該方法的主要局限在于:(1)需要兩種SERS基底的協(xié)同作用才能實現(xiàn)對海洛因及其代謝產(chǎn)物的靈敏測定;(2)樣品質(zhì)量或含量受到影響時,可能無法得到與該報道類似的結(jié)果。
此外,由Akcan等給出的光譜結(jié)果也可知,海洛因、嗎啡和6-MAM的拉曼譜圖較為相似[8]。對于相似的結(jié)果,盡管可通過特征峰信息進行區(qū)分,但人工處理大量復(fù)雜的譜圖數(shù)據(jù),不僅耗時較長,而且存在錯判的風險。尤其在現(xiàn)場檢測時,面對大量復(fù)雜的光譜數(shù)據(jù),快速獲得準確直觀的結(jié)果,是鑒定人員所期待的目標。而模式識別技術(shù),能夠?qū)崿F(xiàn)對大量樣本的自動分類識別,提高分析效率并降低人工誤判的可能性。模式識別技術(shù)主要包括主成分分析(PCA)、偏最小二乘回歸、支持向量機(SVM)、k近鄰算法等方法。通過模式識別技術(shù)處理拉曼光譜數(shù)據(jù),已成功實現(xiàn)了一些毒品(如甲基苯丙胺、可卡因、芬太尼等)的鑒定[10-14]。然而,SERS與模式識別技術(shù)結(jié)合鑒別海洛因及其代謝物尚鮮見報道。
總之,海洛因及其代謝物的高效檢測與精確分類鑒別,仍是亟待解決的需求。為此,針對溶液中痕量海洛因及其代謝物,提出了基于Au/SiO2復(fù)合納米球陣列(Au/SiO2NSA)的SERS檢測與模式識別相結(jié)合的思路,研究毒品的靈敏檢測與高效鑒別。首先,采用膠體球模板-濺射沉積的方法制備了具有良好SERS活性和結(jié)構(gòu)一致性的Au/SiO2NSA。然后,以此為SERS基底(芯片),結(jié)合便攜式拉曼光譜儀,成功實現(xiàn)了對水溶液中海洛因及其主要活性代謝物(6-MAM和嗎啡)的靈敏檢測。接下來,借助模式識別技術(shù)中的系統(tǒng)聚類分析(HCA)、PCA和SVM對得到的SERS數(shù)據(jù)進行分析處理,實現(xiàn)了海洛因、6-MAM和嗎啡的定性/定量分類識別。這項工作不僅可為基于SERS的痕量毒品檢測與精準鑒別提供一種具有實用價值的高質(zhì)量芯片,也為海洛因及其代謝物的準確分類及識別給出了可行的方案。
甲醇,乙腈和4-巰基苯硼酸(4-MPBA)購自上海阿拉丁生化科技股份有限公司。乙醇,正丁醇和十二烷基硫酸鈉(SDS)購自國藥集團化學試劑有限公司。海洛因、6-MAM和嗎啡標準溶液(1.0 mg·mL-1)購自Sigma-Aldrich。SiO2膠體球懸浮液(球徑:150 nm,含量:5%Wt)購于上海輝質(zhì)生物科技有限公司。硅片購買于浙江立晶硅材料有限公司。所有試劑均為分析純,使用前無需進一步提純。整個實驗均使用超純水(18.2 MΩ·cm)。
利用氣-液界面自組裝[15]和磁控濺射沉積的方法制備Au/SiO2NSA。首先,用移液槍沿燒杯壁緩慢向空氣-水界面注入均勻分散的SiO2膠體球-正丁醇懸浮液。隨后,注入一定量的SDS溶液,使SiO2膠體球自組裝形成密排的薄膜。接著,用鑷子夾取表面經(jīng)臭氧處理的潔凈硅片(1.5 cm×1.5 cm)撈取薄膜,從而將SiO2膠體球薄膜轉(zhuǎn)移至硅片上,得到了在硅片上的SiO2膠體球陣列。待水分完全蒸發(fā)后,將覆蓋有SiO2膠體球陣列的硅片在400 ℃馬弗爐中退火2 h以除去殘余的SDS和其他雜質(zhì)。最后,將其切割成2.5 mm×2 mm的基片,并通過磁控濺射在其表面沉積一層Au(英國Quorum Q150R ES plus鍍膜儀,電流:30 mA,時長:10 min,等效沉積厚度:約165 nm),即得到了Au/SiO2NSA。陣列的微觀形貌觀察與元素分析在配備有能量色散X射線光譜儀(EDS,英國Oxford Aztec X-Max 80)的場發(fā)射掃描電子顯微鏡(FESEM,日本Hitachi SU8020)上進行。
用相應(yīng)溶劑(海洛因、6-MAM∶乙腈;嗎啡∶甲醇)分別將1.0 mg·mL-1的海洛因、6-MAM及嗎啡的標準溶液稀釋至0.1 mg·mL-1作為儲備溶液。檢測前,將儲備溶液用水連續(xù)稀釋至特定濃度。將1.2中制得的Au/SiO2NSA(2.5 mm×2 mm)作為SERS芯片。在室溫下,將其浸泡在海洛因、6-MAM或嗎啡的水溶液中。為確保芯片對各個濃度的毒品分子均能充分吸附,浸泡時間為1 h。然后取出芯片并在室溫下干燥,再進行拉曼光譜測量。拉曼光譜測量在便攜式拉曼光譜儀(美國B&W TEK BWS415-785S)上進行。測試條件為:激發(fā)波長785 nm,激光功率80 mW,積分時間5 s,光斑尺寸約為200 μm2。每種樣品分別收集15個譜圖數(shù)據(jù),代表15個樣本。每種樣品對應(yīng)的拉曼譜圖均為15個樣本的平均結(jié)果。
進行模式識別分析時,首先,在對SERS數(shù)據(jù)進行基線校正和歸一化處理后,將數(shù)值導(dǎo)入SPSS 26.0軟件中,分別進行系統(tǒng)聚類和降維處理:系統(tǒng)聚類時樣本間距離采用平方歐氏距離,類間距離使用組間聯(lián)接[16];主成分提取通過數(shù)據(jù)樣本相關(guān)性矩陣的特征值分解完成。接下來,利用Python 3.6編寫代碼,實現(xiàn)各成分的分類識別[17]:首先,讀取先前提取到的主成分數(shù)據(jù)及標簽,并將其劃分為訓練樣本及測試樣本;然后,調(diào)用Python下的sklearn庫中集成的SVM算法,用訓練樣本對SVM分類器進行訓練;最后,將訓練樣本和測試樣本分別輸入到訓練好的SVM分類器中,計算出訓練集和測試集的分類準確率。所用編輯器和開發(fā)環(huán)境為PyCharm2019。采用5折交叉驗證評估分類模型的準確性,即將整個樣本分成5組,其中一組作為測試集,其余組作為訓練集,進行5次輪換驗證。這5次計算所得的測試集準確率的平均值即可看作是該模型的分類準確率。
通過SiO2膠體球的氣-液界面自組裝、轉(zhuǎn)移至硅片,及隨后在其上濺射沉積Au,即可獲得Au/SiO2NSA,如圖1(a)中插圖所示。表面形貌觀察[圖1(a)]表明,該陣列由密排的Au/SiO2復(fù)合納米球組成,SiO2膠體球表面覆蓋有Au納米顆粒。Au/SiO2NSA的EDS分析結(jié)果[圖1(b)]也證明了元素Au、Si和O的存在。同時,由圖1(a)可以看出,Au/SiO2NSA呈現(xiàn)出高度的結(jié)構(gòu)一致性與微/納尺度的粗糙表面,這種粗糙的表面以及三維SiO2膠體球的圓弧面,使陣列具有較大的比表面積,為良好的SERS活性奠定了基礎(chǔ)[18-19]。
圖1 (a)Au/SiO2 NSA的FESEM照片(內(nèi)插圖為Au/SiO2 NSA的光學照片);(b)Au/SiO2 NSA的EDS譜圖Fig.1 (a) The FESEM image of Au/SiO2 NSA (the inset is a photo of Au/SiO2 NSA);(b) The EDS spectrum of Au/SiO2 NSA
接下來,以4-MPBA為探針分子,用沉積在硅片上的Au納米顆粒薄膜(Au/Si,一種常用的SERS基底,等效Au沉積厚度同Au/SiO2NSA)為參考,對Au/SiO2NSA的SERS活性進行評估。圖2(a)為Au/SiO2NSA與Au/Si在10-7mol·L-14-MPBA溶液中浸泡30 min后的拉曼譜圖。
圖2 Au/SiO2 NSA的SERS性能評估(浸泡溶液:10-7 mol·L-1 4-MPBA)(a) Au/SiO2 NSA和Au/Si在4-MPBA溶液中浸泡后的拉曼譜圖;(b) 1 075 cm-1處特征峰強度與Au/SiO2 NSA的等效Au沉積厚度的關(guān)系;(c) 浸泡過4-MPBA的Au/SiO2 NSA上不同位置測得的1 075 cm-1處特征峰強度條形圖;(d) 5片等同的Au/SiO2 NSA經(jīng)4-MPBA溶液浸泡后測得的1 075 cm-1處特征峰強度條形圖Fig.2 Evaluation of SERS performance of Au/SiO2 NSA(a) Raman spectra of 10-7 mol·L-1 4-MPBA on Au/SiO2 NSA and Au/Si;(b) Relationship between the characteristic peak intensity at 1 075 cm-1 with equivalent Au deposition thickness of Au/SiO2 NSA;The histograms of the peak intensities at 1 075 cm-1 measured at (c) different positions on a 4-MPBA-soaked Au/SiO2 NSA and (d) 5 equivalent 4-MPBA-soaked Au/SiO2 NSAs
1 000和1 075 cm-1處的峰為4-MPBA的典型特征峰??梢钥闯?Au/SiO2NSA上這兩個特征峰的強度要明顯強于Au/Si,即Au/SiO2NSA對4-MPBA拉曼信號的增強能力遠高于Au/Si。這表明Au/SiO2NSA具有良好的SERS活性,且明顯優(yōu)于常用的Au納米顆粒薄膜。在SERS的增強機制中,占據(jù)主導(dǎo)地位的電磁場增強源于貴金屬納米材料的局域表面等離激元共振所引起的極強的局域電磁場(“熱點”)[3]。而Au/SiO2NSA對信號的增強效果比Au/Si更好,主要可歸因于Au/SiO2NSA的大比表面積以及大量的納米間隙與納米“尖端”,為SERS增強提供了更多的“熱點”。
進一步的研究表明,Au/SiO2NSA的Au沉積厚度對SERS活性有明顯影響,沉積厚度過薄與過厚均不利于SERS活性的提高。如圖2(b)所示,等效Au沉積厚度約為165 nm時,SERS活性最佳。當沉積開始后,隨著Au沉積的進行,越來越多的超細Au納米顆粒沉積在SiO2膠體球表面,Au沉積層不斷增厚。同時,形成了納米粗糙的表面與大量的納米間隙,從而構(gòu)成了高密度的“熱點”[18],所以表現(xiàn)為SERS活性隨Au沉積層的增厚而增強。而當沉積層過厚時,會掩蓋相鄰膠體球之間的間隙,進而減少“熱點”數(shù)量,降低SERS活性。故只有在合適的沉積厚度下,Au/SiO2NSA才會既具有足夠厚度的Au層,又保持表面的納米粗糙度與高密度納米間隙,展現(xiàn)出最佳的SERS活性。因此,選取等效Au沉積厚度為165 nm的Au/SiO2NSA[圖1(a)]作為SERS芯片,用于后續(xù)的溶液中毒品SERS檢測。
此外,該Au/SiO2NSA作為SERS芯片,也具有良好的SERS信號一致性與重現(xiàn)性。圖2(c)為Au/SiO2NSA經(jīng)10-7mol·L-14-MPBA溶液浸泡后,在表面隨機選定不同位置測得的1 075 cm-1處拉曼特征峰強度的條形圖??梢钥闯?隨機選取20個位置測得的特征峰強度的相對標準偏差(RSD)僅為4.4%,呈現(xiàn)出高度的信號一致性。同時,多個等同的Au/SiO2NSA芯片經(jīng)4-MPBA溶液浸泡后,4-MPBA分子特征峰強度的RSD僅為3.7%[如圖2(d)],表明Au/SiO2NSA具有良好的信號重現(xiàn)性。
總之,上述Au/SiO2NSA具有高的SERS活性、良好的信號一致性與重現(xiàn)性,可作為SERS檢測海洛因及其代謝物的高質(zhì)量芯片,并為拉曼譜圖的模式識別提供可靠保障。
以上述Au/SiO2NSA為芯片,對海洛因及其代謝物進行SERS檢測。圖3(a)為在10-2mg·mL-1海洛因及其代謝物溶液中浸泡后測得的拉曼譜圖。海洛因、6-MAM和嗎啡在625 cm-1處均有一強的特征峰,可歸屬為它們分子結(jié)構(gòu)中環(huán)的彎曲振動[6]。此外,海洛因在1 245 cm-1、6-MAM在705 cm-1、嗎啡在710和760 cm-1分別存在較強的特征峰[8]。這些特征峰信息可用于以上分析物拉曼譜圖的識別。
圖3 基于Au/SiO2 NSA的海洛因及其代謝物的拉曼譜圖(a)芯片在濃度為10-2 mg·mL-1的毒品溶液中浸泡后測得的拉曼譜圖;芯片在不同濃度(b)海洛因、(c)6-MAM、(d)嗎啡溶液中浸泡后測得的拉曼譜圖Fig.3 Raman spectra of heroin and its metabolites based on Au/SiO2 NSA(a) Raman spectra of the chips soaked in 10-2 mg·mL-1 drug solutions;Raman spectra of the chips soaked in different concentrations of (b) heroin,(c) 6-MAM and (d) morphine,respectively
圖3(b—d)展示了不同濃度的海洛因、6-MAM和嗎啡的拉曼譜圖。各特征峰的強度均隨濃度的降低而減弱。當濃度≥10-4mg·mL-1時,皆可觀察到明顯的特征信號。因此,可認為基于Au/SiO2NSA的SERS芯片對海洛因、6-MAM和嗎啡的檢測限優(yōu)于10-4mg·mL-1。
SERS可提供分子的指紋譜圖,原則上可根據(jù)光譜中的特征峰對分析物進行精準識別。然而,在實際應(yīng)用中,往往會面對大量復(fù)雜的譜線、甚至存在譜峰的重疊。此時,僅依靠主觀觀察和人工分析,效率低、易出錯。特別是在現(xiàn)場檢測時,更希望能夠簡化分析過程、快速獲取直觀準確的鑒定結(jié)果。因此,在SERS檢測的基礎(chǔ)上,構(gòu)建了可用于海洛因及其代謝物分類識別的算法模型。通過HCA分類、PCA降維提取特征變量、訓練SVM分類模型,逐步完成對海洛因、6-MAM和嗎啡的定性分類鑒別。
2.3.1 HCA結(jié)果
聚類分析是一種無監(jiān)督的模式識別技術(shù),可根據(jù)一批樣本的相似性或差異對該批樣本進行分類,即“物以類聚”[20]。首先利用HCA對海洛因及其代謝物的拉曼譜圖數(shù)據(jù)(每種樣品各采集15個譜圖數(shù)據(jù),共45個譜圖數(shù)據(jù),即45個樣本)進行分類,譜系圖如圖4所示。圖中,紅色代表海洛因、藍色代表為6-MAM、綠色代表為嗎啡??梢钥闯?HCA能成功地將海洛因、6-MAM和嗎啡分類。這為接下來利用PCA-SVM模型對它們進行分類識別奠定了良好的基礎(chǔ)。另外,在成功分出3大類后,6-MAM樣本與嗎啡樣本會先聚成一類,再與海洛因樣本合為一類。該現(xiàn)象說明6-MAM和嗎啡的拉曼譜圖的相似程度更大,這與圖3(a)給出的譜圖結(jié)果一致。
圖4 海洛因及其代謝物的系統(tǒng)聚類分析譜系圖Fig.4 Pedigree chart of hierarchical cluster analysis for heroin and its metabolites
2.3.2 基于PCA-SVM模型的分類
然后,利用PCA對45個樣本在620~630、700~720、755~765和1 240~1 250 cm-1范圍的拉曼譜圖數(shù)據(jù)進行降維處理。如圖5(a)所示。PCA提取到的前29個主成分的累計方差貢獻率可達到100%,表明由PCA得到的這29維特征向量可完全解釋原始數(shù)據(jù)的信息。其中,前兩個主成分的累計方差貢獻率即可達到64.2%。圖5(b)為由這兩個主成分得到的二維PCA分布圖,圖中每個點代表每個樣本的拉曼譜圖數(shù)據(jù)??梢钥闯?每種樣本類型可形成不同的簇,且簇與簇之間區(qū)分明顯,說明海洛因、6-MAM和嗎啡能夠被清晰地區(qū)分開來,也說明了PCA能夠很好地將海洛因及其代謝物分類。
圖5 對45個樣本拉曼譜圖信息的PCA處理結(jié)果(a) 主成分的方差貢獻率和累計方差貢獻率;(b) 用于海洛因及其代謝物分類的二維主成分分布圖Fig.5 PCA results of Raman spectral information of 45 samples(a) The variance contribution rate and cumulative variance contribution rate of principal components;(b) Two-dimensional principal component distribution plot for classification of heroin and its metabolites
同時,由圖5(a)可知,前5個主成分(特征值均大于1)的累計方差貢獻率已到達82.0%,應(yīng)該可以實現(xiàn)良好的分類準確率。為此,將這5個主成分輸入SVM分類模型以實現(xiàn)自動識別。利用基于4種常用核函數(shù)(徑向核函數(shù)、線性核函數(shù)、多項式核函數(shù)、S型核函數(shù))的SVM模型分別對海洛因及其代謝物進行分類識別。各核函數(shù)分類模型的識別準確率如圖6所示,基于這4種核函數(shù)的SVM模型的識別準確率均可達到100%。即選擇任一模型,都可以完全區(qū)分海洛因、6-MAM和嗎啡。這一結(jié)果表明,借助PCA-SVM,能夠出色地實現(xiàn)海洛因及其代謝物的準確定性分類識別。如將構(gòu)建的SVM算法嵌入到SERS測量的程序中,則有望實現(xiàn)在檢測的同時直接給出可視化的識別結(jié)果。
圖6 支持向量機模型對海洛因及其代謝物定性識別的準確率Fig.6 Accuracy of support vector machine model for the qualitative classification of heroin and its metabolites
除對它們進行定性鑒別外,本工作也對不同濃度的海洛因及其代謝物進行了定量分類。利用PCA對不同濃度的海洛因、6-MAM和嗎啡的SERS數(shù)據(jù)進行降維處理,圖7給出了它們的二維PCA分布圖??梢钥闯?借助PC1可完成對檢測限以上(≥10-4mg·mL-1)和檢測限以下(<10-4mg·mL-1)樣本之間的劃分;結(jié)合PC2,可進一步區(qū)分檢測限以上的3種濃度樣本(10-2、10-3和10-4mg·mL-1),但仍不能將檢測限以下的兩類樣本(10-5mg·mL-1和空白)很好地分類。10-5mg·mL-1濃度的各分析物與空白樣本之間的分類效果較差,這也與不同濃度各分析物的SERS譜圖[圖3(b—d)]顯示的結(jié)果一致。對于檢測限(10-4mg·mL-1)及檢測限以上(10-2和10-3mg·mL-1)的樣本,海洛因的分類情況較好,可明顯地區(qū)分這三個濃度的樣本[圖7(a)];6-MAM的這三類樣本可聚成不同的簇,但簇與簇之間的距離很近,尤其是10-2和10-3mg·mL-1的兩類樣本[圖7(b)];而這三個濃度的嗎啡樣本則未能得到良好的區(qū)分[圖7(c)]。如要實現(xiàn)各濃度樣本之間、以及低濃度與空白樣本之間的精準分類,則需要繼續(xù)加大樣本量,并借助其他模式識別技術(shù)如偏最小二乘法、正交偏最小二乘法等。
圖7 用于定量區(qū)分不同濃度(a)海洛因、(b)6-MAM、(c)嗎啡的二維主成分分布圖Fig.7 Two-dimensional principal component distribution plots for quantitatively distinguishing different concentrations of (a) heroin,(b) 6-MAM and (c) morphine
接下來,使用PCA-SVM對海洛因、6-MAM和嗎啡進行定量識別,可獲得各自的識別準確率,如圖8所示。對于不同濃度的海洛因,采用基于徑向核函數(shù)的SVM模型,識別準確率可達到90.1%;而對于不同濃度的6-MAM及嗎啡,選用基于線性核函數(shù)的SVM模型時的準確率較高,分別為84.8%和70.2%。
圖8 基于不同核函數(shù)的SVM模型對不同濃度海洛因、6-MAM和嗎啡定量識別的準確率Fig.8 Accuracy of SVM models based on different kernel functions for the quantitative classification of heroin,6-MAM and morphine with different concentrations
基于Au/SiO2NSA的SERS檢測與模式識別技術(shù)相結(jié)合,實現(xiàn)了對水溶液中海洛因及其代謝物的高效、靈敏檢測與精準鑒別。采用膠體球模板-濺射沉積的方法獲得了具有高SERS活性、良好信號均勻性與重現(xiàn)性的Au/SiO2NSA。以此為SERS芯片,結(jié)合便攜式拉曼光譜儀,成功實現(xiàn)了水溶液中海洛因及其代謝物的高效檢測,檢測限優(yōu)于10-4mg·mL-1。在此基礎(chǔ)上,利用模式識別技術(shù)對獲得的SERS數(shù)據(jù)進行分析處理與分類識別。結(jié)果表明,通過HCA、PCA及PCA-SVM均可實現(xiàn)對海洛因、6-MAM和嗎啡的完全分類,準確率可達100%;而使用PCA-SVM模型也可實現(xiàn)對不同濃度海洛因、6-MAM和嗎啡的定量區(qū)分,準確率分別為90.1%、84.8%和70.2%。本工作不僅為基于SERS的毒品鑒定提供了一種有實用價值的檢測芯片,也表明了通過模式識別技術(shù)實現(xiàn)海洛因及其代謝物快速定性/定量分類鑒別的可行性。如若將構(gòu)建的分類模型嵌入拉曼光譜儀配套的測量軟件中,則有望同時實現(xiàn)測量與可視化鑒別。這對實現(xiàn)毒品現(xiàn)場高效檢測與精確分類鑒別具有現(xiàn)實意義,也為相關(guān)儀器的研發(fā)提供了可行的設(shè)計思路。