, ,3, , , ,
(1.上海理工大學(xué) 上海市現(xiàn)代光學(xué)系統(tǒng)重點實驗室, 上海 200093; 2.上海理工大學(xué) 光電信息與計算機工程學(xué)院, 上海 200093; 3.公安部第三研究所, 上海 200031; 4.中國科學(xué)院 上海高等研究院, 上海 201210)
據(jù)《中國禁毒報告2017》所述,全國濫用合成毒品人員總數(shù)仍呈上升態(tài)勢。截至2016年底,全國共破獲毒品刑事案件14萬起,繳獲各類毒品82.1 t。全國現(xiàn)有吸毒人員250.5萬名,同比增長6.8%,其中,合成毒品濫用規(guī)模居首位,濫用合成毒品人員151.5萬名,占60.5%。合成毒品是相對于傳統(tǒng)的麻醉毒品(海洛因、鴉片)而言,常見的類型有冰毒(甲基苯丙胺)、麻古、搖頭丸(MDMA)、K粉(氯胺酮)等。
合成毒品主要通過對多種化學(xué)物質(zhì)進行化學(xué)合成產(chǎn)生。以甲卡西酮為例,該物質(zhì)會導(dǎo)致急性健康問題及毒品依賴,過量服用會出現(xiàn)不可逆的永久性腦部損傷甚至死亡,俗稱“長治筋”、“喪尸藥”,在國外被稱之為“浴鹽”[1]。它主要由氧化1-麻黃堿制得。其各項特性與麻黃堿比較接近,較難進行簡單的鑒別。目前常用的分析方法主要是通過氣相色譜儀及氣質(zhì)聯(lián)用儀對體外、體內(nèi)檢材進行分析,或者通過苯丙胺類尿液檢測板在吸食后檢出[2]。但氣相色譜儀及氣質(zhì)聯(lián)用儀主要應(yīng)用于實驗室環(huán)境,需要費用高,分析時間長,不能有效快速實現(xiàn)對甲卡西酮的分析。而苯丙胺類尿檢檢測板只適用于吸食后尿液檢測,對查獲的未吸食的甲卡西酮無法進行及時、快速的檢測。
指紋圖譜是指某些復(fù)雜物質(zhì),經(jīng)適當(dāng)處理后,采用一定的分析手段,得到的能夠標示其化學(xué)特征的色譜圖或光譜圖,適用于樣本成分較為復(fù)雜情況下的鑒別。目前常見的便攜式毒品快速檢驗技術(shù),如離子遷移譜法、拉曼光譜法等。離子遷移譜(ion mobility spectrometry,IMS)[3]是一種常壓質(zhì)譜,不同的毒品物質(zhì)因其物化特性不同,在遷移電場中具有不同的遷移速度。離子遷移譜工作原理如圖1所示,它的設(shè)備簡單,檢測速度快,廣泛應(yīng)用于爆炸物、毒品、?;返任镔|(zhì)檢測[4-6]。拉曼光譜(Raman spectra)是一種散射光譜,對與入射光頻率不同的散射光譜進行分析以得到分子振動、轉(zhuǎn)動方面信息,并應(yīng)用于分子結(jié)構(gòu)研究的一種分析方法[7]。但由于摻雜物的影響,單一的采用拉曼光譜毒品檢測儀鑒別毒品,或單一的使用IMS,都容易出現(xiàn)將甲卡西酮與麻黃堿之間誤報的問題。
圖1 離子遷移譜工作原理圖Fig.1 Principle of ion mobility spectrometry
綜合上述在實際使用中遇到的問題和現(xiàn)象,考慮到單一的使用其中任意一種指紋圖譜可能都無法反映樣品的全部特征,而使用幾種不同設(shè)備采集的指紋圖譜聯(lián)用可以從不同側(cè)面反映樣品的各種特征,從而可有效控制檢驗分析中常見的假陽性問題,提高分析結(jié)果的可靠性和準確性[8-10]。離子遷移譜分析方法和拉曼光譜分析方法可以從不同角度來反映物質(zhì)的特征。如果分析樣品是實驗室制備的高純度標準品,這兩種分析方法都能較好的發(fā)揮作用。但實際使用中,毒品中常常被摻雜了其他物質(zhì),以謀取暴利。這些摻雜物質(zhì)在某種程度上,加大了對單一物質(zhì)分析的難度。比如:摻雜雜質(zhì)的甲卡西酮僅使用拉曼光譜儀很難被準確識別(特征峰很微弱),同時如果摻雜物質(zhì)的遷移率與甲卡西酮等毒品接近,也會影響IMS設(shè)備識別的準確性。因此,本實驗基于離子遷移譜儀與拉曼光譜儀分別采集甲卡西酮、麻黃堿的指紋圖譜,嘗試指紋圖譜數(shù)據(jù)融合技術(shù)結(jié)合SVM算法,以此提出一種快速、便捷的鑒別甲卡西酮、麻黃堿的方法。
實驗中IMS設(shè)備使用的型號為AY05-02便攜式毒品探測儀,儀器采用偽隨機序列離子開門技術(shù)和Hadamard算法[11],有效減少了儀器的誤報率。采用的激光拉曼設(shè)備型號為SS-AY01-01Ⅱ易制毒化學(xué)品快速檢查儀,內(nèi)部采用海陽光學(xué)的QEpro光譜儀,激發(fā)波長785±0.5 nm,線寬<0.08 nm激光源,輸出功率可調(diào)范圍0~500 mW,工作溫度0~45 ℃,于大氣環(huán)境下采集,單次掃描積分時間8 ms~15 min。實際使用中毋需直接接觸樣品,即可實現(xiàn)現(xiàn)場樣品的無損、快速檢測、鑒定,激光拉曼光譜儀的光路圖如圖2所示。
圖2 激光拉曼光譜儀光路圖Fig.2 Optical path of theRaman spectroscopy
實驗使用的4種甲卡西酮從各地繳獲的毒品中獲取,4種麻黃堿通過多批次購入。其中甲卡西酮獲得樣本的形態(tài)呈現(xiàn)粉末、塊狀,顏色表現(xiàn)深淺不一,有乳白色、褐色、灰色等,其顏色差異與摻兌的其他物質(zhì)相關(guān),也與制毒方式和來源差異性相關(guān)。
考慮到激光拉曼光譜在粉末狀的情況下更容易出峰,IMS對于爆炸物和毒品只需要痕量就會出峰。所以在制備樣本時,先將甲卡西酮、麻黃堿樣品統(tǒng)一處理成粉末狀態(tài)。由于販毒團伙為了獲取更多的利潤,通常會添加一些摻雜物,所以實驗的樣本粉末選擇質(zhì)量分數(shù)成分至少10%以上,然后將粉末分別裝入透明容器中備用。實驗時取少量樣本放在載玻片上,尋找合適的位點進行拉曼光譜分析[12]。
離子遷移譜法工作在正離子模式,測試校準物選擇丁基化羥基甲苯(BHT),使用試紙沾取少許粉末,離子管工作電壓1 800 V,采集時間為30 ms,載氣流量為200 mL/min,電離區(qū)注入溫度保持在180 ℃,遷移區(qū)內(nèi)遷移溫度保持在140 ℃。由于環(huán)境濕度及儀器自身波動可能導(dǎo)致采集到的離子遷移譜圖存在差異,所以對每個樣本分別采集5次,采用其均值數(shù)據(jù)。
拉曼光譜法采集數(shù)據(jù)時探頭口功率約為350 mW,波數(shù)掃描范圍200~3 200 cm-1,分辨率1 cm-1,于暗室內(nèi)對光譜進行采集,單次掃描,積分時間約為3 s。由于每次采集的位點存在偏差,所以采樣時以有明顯出峰的譜圖數(shù)據(jù)作為有效采樣數(shù)據(jù)。
本實驗使用MATLAB R2017a對采集數(shù)據(jù)進行處理??紤]到離子遷移譜儀器設(shè)備是對微弱信號進行測量,在經(jīng)過放大器放大被測數(shù)據(jù)時,很容易受到放大器及測量電路的固有噪音、傳感器噪聲、工作環(huán)境各類干擾噪音的綜合影響,這些噪音疊加在被采集信號上,降低了被采集數(shù)據(jù)的信噪比。為了降低噪聲對波形數(shù)據(jù)的影響,利用sym6小波對IMS數(shù)據(jù)進行分解,再根據(jù)Birge-Massart策略對離子遷移譜數(shù)據(jù)進行降噪。
圖3 數(shù)據(jù)融合PCA-SVM流程圖Fig.3 Flowchart of the data fusion using PCA-SVM
數(shù)據(jù)融合流程如圖3所示,其中n為進行融合樣品的樣本數(shù),i與j分別表示樣品拉曼光譜數(shù)據(jù)和IMS數(shù)據(jù)的維度,z為兩個圖譜數(shù)據(jù)融合后提取的主成分數(shù)量。單次IMS分析過程中會產(chǎn)生一個多幀樣本數(shù)據(jù),而單次采集拉曼光譜數(shù)據(jù)只有一個單幀樣本數(shù)據(jù)。因此在濾波后的IMS多幀數(shù)據(jù)中取出峰值信號強度大于預(yù)先設(shè)定閾值的10幀數(shù)據(jù),并對它們求平均值,其平均后的譜圖則作為IMS的一個樣本數(shù)據(jù)。由于IMS和拉曼譜圖數(shù)據(jù)在幅度上存在差異,所以在數(shù)據(jù)融合之前需要先對數(shù)據(jù)進行預(yù)處理。首先,分別選取兩組數(shù)據(jù)中含有特征數(shù)據(jù)的部分,選取特征數(shù)據(jù)時盡可能保證兩者所取數(shù)據(jù)長度接近。然后,為了防止具有較大初始值域的屬性比具有較小初始值域的屬性的權(quán)重過大,使用最小-最大規(guī)范化對降噪后的數(shù)據(jù)進行歸一化處理
(1)
式中:v是原始數(shù)據(jù);minA為原始數(shù)據(jù)集的最大值;minA為原始數(shù)據(jù)集的最小值。
最后,將經(jīng)過處理后的拉曼數(shù)據(jù)直接拼接到處理后的IMS數(shù)據(jù)之后,至此完成了兩個數(shù)據(jù)融合處理,融合后的數(shù)據(jù)維度為兩個譜圖數(shù)據(jù)維度之和。
如圖4所示,甲卡西酮基于實驗設(shè)備所采集的拉曼光譜,主要出峰數(shù)據(jù)集中在400~2 000 cm-1,在2 000 cm-1以后的數(shù)據(jù)基本上沒有出現(xiàn)特征值,所以實驗中選取400~2 000 cm-1作為拉曼光譜的采集數(shù)據(jù)。甲卡西酮由異丙基和甲胺構(gòu)成的支鏈,取代了苯環(huán)上的氫原子,形成單取代苯類化合物。吸收峰主要由CH3和CH2基變形形式的倍頻或合頻、面內(nèi)C--H變形衍生的苯環(huán)的振動、內(nèi)環(huán)變形以及三角形環(huán)呼吸振動組成[16]。如圖5所示,麻黃堿吸收峰主要由面內(nèi)環(huán)變形、簡并環(huán)伸縮振動雙峰[17]。這兩個物質(zhì)在采集到的拉曼光譜數(shù)據(jù)的最強吸收峰,都集中在1 001 cm-1左右,兩者的拉曼光譜機器較為相似,較難通過肉眼分別。
圖4 甲卡西酮典型拉曼光譜圖Fig.4 Raman spectrum ofmethcathinone
圖5 麻黃堿典型拉曼光譜圖Fig.5 Raman spectrum of ephedrine
圖6 8批次甲卡西酮的拉曼光譜PCA圖Fig.6 The PCA result of the Raman spectrum of methcathinone from 8 samples
由于不同來源的甲卡西酮樣品摻兌的成分多種多樣,而采購來的麻黃堿混雜的物質(zhì)較少,這也決定了兩者的光譜曲線在其它部分有一定的區(qū)別,并具有特征性,主要體現(xiàn)在光譜吸收峰的強度變化及各個小峰的差異性。為了更好的從數(shù)據(jù)中提取有效信息,以此對樣本進行分類,對采集到的拉曼光譜波段進行了取舍。由于200~500 cm-1、1 700~2 000 cm-1波段內(nèi)出峰較少并且多為背景峰,因此數(shù)據(jù)處理時考慮采用的數(shù)據(jù)區(qū)間為500~1 700 cm-1波段內(nèi)的光譜數(shù)據(jù),以此數(shù)據(jù)為樣本矩陣進行PCA處理。由圖6可知,兩個物質(zhì)互相重疊,為實現(xiàn)快速鑒別效果,基于PCA降維結(jié)果數(shù)據(jù),提取貢獻率大于98%的6個主成分,作為SVM分類器的輸入?yún)?shù),經(jīng)過50次隨機測試,統(tǒng)計平均識別率為75.21%。PCA是將數(shù)據(jù)從原來的坐標系轉(zhuǎn)換到新的坐標系,新坐標系的選擇是由數(shù)據(jù)本身決定的。圖6中,PC1、PC2、PC3分別為貢獻度最大的三個主成分,其貢獻度累加值大于98%,PC1的選擇原始數(shù)據(jù)中方差最大的方向,也是最重要的方向。PC2為于PC1垂直或正交方向,該過程重復(fù)執(zhí)行,重復(fù)次數(shù)為原始數(shù)據(jù)中特征數(shù)目,其坐標為轉(zhuǎn)換到新空間中的數(shù)值。實驗結(jié)果表明,拉曼光譜結(jié)合PCA-SVM算法不能較好的鑒別甲卡西酮和麻黃堿。
測試樣品物質(zhì)通過載氣分子和樣品分子在離子源放射性63Ni的作用下發(fā)生一系列的電離反應(yīng)和離子-分子反應(yīng)產(chǎn)生產(chǎn)物離子,最終生成正離子[18]。正離子通過離子門柵進入遷移區(qū)進行漂移,在電場力的作用下產(chǎn)生遷移運動,最后達到電荷收集器轉(zhuǎn)化為電信號,經(jīng)過電路采樣處理后得到最后的離子遷移譜。遷移時間為
td=L/(KE)
式中:L為遷移管長度;K為遷移率;E為電場。
根據(jù)多次對甲卡西酮及麻黃堿的檢測,如圖7、圖8所示,這兩個物質(zhì)出峰位置主要集中在7.5~17.5 ms之間。
由于兩種物質(zhì)在7.5 ms之前與17.5 ms之后幾乎沒有離子信號,因此在處理數(shù)據(jù)時,只考慮產(chǎn)物出峰密集的區(qū)間,即12.5~17.5 ms之間的譜圖數(shù)據(jù)。為實現(xiàn)甲卡西酮與麻黃堿的可視化描述,以采集樣品的IMS數(shù)據(jù)為樣本,選取12.5~17.5 ms區(qū)間對應(yīng)的峰值組成新的樣本矩陣,對此數(shù)據(jù)矩陣進行PCA處理。如圖9所示,甲卡西酮和麻黃堿在圖中分布的位置很接近,但聚類效果明顯。為了實現(xiàn)對兩者的快速鑒別,基于PCA降維后的結(jié)果數(shù)據(jù),對其貢獻率大于98%的6個主成分作為SVM分類器的輸入?yún)?shù),經(jīng)過50次隨機性實驗,統(tǒng)計平均成功識別率為93.53%。
圖7 甲卡西酮典型IMS圖譜Fig.7 The IMS spectrum of methcathinone
圖8 麻黃堿典型IMS圖譜Fig.8 The IMS spectrum of ephedrine
圖9 甲卡西酮與麻黃堿的IMS-PCA圖Fig.9 IMSPCA result of methcathinone and ephedrine
由于激光拉曼光譜是基于吸收峰的歸屬來分析樣本主要成分,IMS是基于離子在特定電場的遷移率來分析樣本主要成分,所以將這兩種譜圖數(shù)據(jù)進行融合,將會更全面的反應(yīng)毒品樣本的物質(zhì)信息。如圖10所示,甲卡西酮和麻黃堿在拉曼-PCA分析圖上有較高的重疊,而在IMS-PCA分析圖上就可以較好的分別。據(jù)此推測,將兩者數(shù)據(jù)融合后,在PCA分析圖上可以提高其分辨度,同時也可以提高PCA-SVM分類器的鑒別成功率。由于變量數(shù)量不同的數(shù)據(jù)在融合后,變量數(shù)量較多的譜圖會占更大的權(quán)重,所以確保不會因數(shù)據(jù)量不同引入的權(quán)重問題,本實驗選取的IMS數(shù)據(jù)(0~30 ms)、拉曼數(shù)據(jù)(400~2 000 cm-1),分別為1 200維和1 600維,兩者數(shù)據(jù)維度接近可以直接進行融合。
融合數(shù)據(jù)與單譜數(shù)據(jù)由于取值范圍和量化單位的差異,為確保盡可能減少噪音干擾和峰值幅度不同造成的權(quán)重差異,分別先對IMS數(shù)據(jù)(0~30 ms)、拉曼數(shù)據(jù)(400~2 000 cm-1)進行小波濾波、歸一化預(yù)處理,然后將處理后的數(shù)據(jù)融合,融合后的數(shù)據(jù)維度為兩者譜圖維度總和?;谌诤虾蟮臄?shù)據(jù)進行PCA處理。如圖10所示,甲卡西酮和麻黃堿在PCA分析圖中沒有重疊,因此可以認為IMS圖譜和拉曼圖譜數(shù)據(jù)融合后可以更全面的反映這兩個物質(zhì)的特征,有助于進一步增強對毒品的檢測效果。將融合后的數(shù)據(jù)取12個貢獻度大于98%的主成分作為SVM分類器的輸入?yún)?shù),經(jīng)過50次隨機試驗,識別率平均為98.24%。如表1所示,數(shù)據(jù)融合后的識別率大于單一譜圖數(shù)據(jù)的識別率,數(shù)據(jù)融合技術(shù)可以提高鑒別結(jié)果的可靠性。
圖10 8批次甲卡西酮的數(shù)據(jù)融合后PCA圖Fig.10 PCA result of methcathinone from 8 samples
數(shù)據(jù)類型累計貢獻率大于98%的主成分數(shù)量平均識別率/%IMS693.53拉曼光譜675.21融合數(shù)據(jù)1298.24
本實驗將拉曼光譜與IMS數(shù)據(jù)融合技術(shù)結(jié)合PCA-SVM應(yīng)用于甲卡西酮與麻黃堿的鑒別。甲卡西酮、麻黃堿樣品經(jīng)粉末化處理后,再經(jīng)拉曼光譜儀和IMS儀分析建立了4種甲卡西酮樣品和4種麻黃堿樣品的拉曼光譜和IMS指紋圖譜庫,分別使用單譜數(shù)據(jù)結(jié)合PCA-SVM以及拉曼光譜-IMS數(shù)據(jù)融合結(jié)合PCA-SVM對甲卡西酮、麻黃堿樣品進行鑒別分析。拉曼光譜-IMS數(shù)據(jù)融合結(jié)合PCA-SVM建立的鑒別模型對4種甲卡西酮、麻黃堿的識別率達98.24%,相比拉曼光譜的75.21%和IMS的93.53%,有明顯提高。拉曼光譜-IMS數(shù)據(jù)融合結(jié)合PCA-SVM為鑒別甲卡西酮、麻黃堿提供了一種可靠、穩(wěn)定、快速的方法。此分析方法適用于含量相對較高的其他類別毒品分析、比對。因此,本實驗使用的拉曼光譜儀和IMS儀均為便攜式儀器,操作簡單,具有現(xiàn)場快速檢測分析的前景。
參考文獻:
[1] 趙璐,張紅波.長治市甲卡西酮毒品案件現(xiàn)狀調(diào)查[J].政府法制,2013(22):49.
[2] 常穎,高利生.甲卡西酮概述及其分析方法[J].刑事技術(shù),2011(5):35-38.
[3] EICEMAN G A,KARPAS Z.Ion mobility spectrometry[M].Florida:CRC Press,1994.
[4] EWING R G,ATKINSON D A,EICEMAN G A,et al.A critical review of ion mobility spectrometry for the detection of explosives and explosive related compounds[J].Talanta,2001,54(3):515-529,doi:10.1016/S0039-9140(00)00565-8.
[6] HARRIS G A,KWASNIK M,FERNNDEZ F M.Direct analysis in real time coupled to multiplexed drift tube ion mobility spectrometry for detecting toxic chemicals[J].Analytical Chemistry,2011,83(6):1908-1915,doi:10.1021/ac102246h.
[7] 陳珊.拉曼光譜背景扣除算法及其應(yīng)用研究[D].長沙:中南大學(xué),2011.
[8] BIANCOLILLO A,BUCCI R,MAGRA L,et al.Data-fusion for multiplatform characterization of an italian craft beer aimed at its authentication[J].Analytica Chimica Acta,2014,820:23-31,doi:10.1016/j.aca.2014.02.024.
[9] TAN J,LI R,JIANG Z T.Chemometric classification of Chinese lager beers according to manufacturer based on data fusion of fluorescence,UV and visible spectroscopies[J].Food Chemistry,2015,184:30-36,doi:10.1016/j.foodchem.2015.03.085.
[11] CLOWERS B H,SIEMS W F,HILL H H,et al.Hadamard transform ion mobility spectrometry[J].Analytical Chemistry,2006,78(1):44-51.
[12] 王繼芬,余靜,孫興龍,等.毒品及其常見添加成分的拉曼光譜快速分析[J].光散射學(xué)報,2012,24(3):312-315.
[13] GROTH D,HARTMANN S,KLIE S,et al.Principal components analysis[C]∥REISFELD B,MAYENO A N.Computational Toxicology.Totowa,NJ:Humana Press,2013:527-547,doi:10.1007/978-1-62703-059-5_22.
[14] BOSER B E,GUYON I M,VAPNIK V N.A training algorithm for optimal margin classifiers[C]∥Proceedings of the 5th Annual Workshop on Computational Learning Theory.New York,NY,USA:ACM,1992:144-152.
[15] HAN J W,KAMBER M,PEI J.數(shù)據(jù)挖掘:概念與技術(shù)[M].范明,孟小峰,譯.3版.北京:機械工業(yè)出版社,2012.
[16] 徐鵬宇,蘇婉芬,鐘愛國.甲卡西酮光譜性質(zhì)的密度泛函模擬與指認[J].當(dāng)代化工,2014,43(3):334-336.
[17] 趙金濤,彭勇,徐存英.麻黃素拉曼散射振動模式的研究[J].光散射學(xué)報,2001,13(2):114-118.
[18] 檀景輝.基于脈沖正電暈放電離子源的離子遷移譜儀研究[D].天津:天津大學(xué),2010.