李佳瑞,王繼芬,劉津彤
(中國人民公安大學(xué) 偵查學(xué)院,北京 100038)
目前我國公共安全問題突出,針對公共安全的重要組成部分食品藥品的安全問題,公安部部署全國公安機(jī)關(guān)集中開展了“昆侖2020”專項(xiàng)行動,依法對食藥環(huán)領(lǐng)域的違法犯罪活動進(jìn)行嚴(yán)厲打擊。在藥品行業(yè)快速發(fā)展的背景之下,足不出戶就可以通過互聯(lián)網(wǎng)買到世界各地的藥品,導(dǎo)致假藥銷售及管制類藥物走私情況日趨嚴(yán)峻,嚴(yán)重危害了人們的身體健康。因此迫切需要建立對藥品的準(zhǔn)確、快速檢驗(yàn)方法。
非巴比妥類鎮(zhèn)靜安眠藥為新型中樞神經(jīng)抑制藥,包括強(qiáng)安定藥和弱安定藥兩類。前者為抗精神病藥,其中吩噻嗪類為首選藥物。后者為抗焦慮性鎮(zhèn)靜藥,常用的主要為苯二氮類[1]。目前此類藥物的臨床應(yīng)用廣泛,有的甚至可在醫(yī)藥商店購買到。吩噻嗪類藥物濫用中毒多為錐體外系反應(yīng)[2];苯二氮類藥物的危害也被廣泛報道,濫用易產(chǎn)生依賴性,且會對人的認(rèn)知功能產(chǎn)生負(fù)面影響[3]。近年來,管制類藥物走私不斷出現(xiàn)新特點(diǎn),不法分子常通過郵寄渠道,如通過快件、空運(yùn)貨物渠道由拉美地區(qū)走私入境,或通過行李物品夾藏等方式從空港旅檢渠道走私進(jìn)境,且相關(guān)案件呈增長趨勢。對此類藥物的快速準(zhǔn)確檢驗(yàn)在犯罪嫌疑人的確定、案件偵破以及定罪量刑等方面都具有重要意義。因此必須完善技術(shù)打造利器,精準(zhǔn)打擊違法犯罪。
光譜技術(shù)提供了一種快速靈敏且無損的有效檢測方法,成為法庭科學(xué)領(lǐng)域的有利分析工具[4-8],適用于藥物成分的檢驗(yàn)分析。已有的相關(guān)研究主要進(jìn)行簡單的藥物定性檢測,缺乏對光譜數(shù)據(jù)的深入挖掘與分析[9-10]。在實(shí)際檢驗(yàn)中,存在多種藥物混雜的情況,而對于多種成分共存的藥物進(jìn)行檢驗(yàn)在分離和分析方法上尚存在一定的局限性。目前使用高效液相色譜、氣相色譜與質(zhì)譜聯(lián)用等技術(shù)對鎮(zhèn)靜安眠藥進(jìn)行檢測的檢材主要為生物樣品[11-12],對繳獲藥物的研究相對較少,且此類檢測方法成本較高,操作也較為復(fù)雜,無法滿足基層公安工作的需要。
紅外光譜具有特征性強(qiáng)、測定快速、不破壞樣品、試樣用量少、操作簡便等優(yōu)勢,在物質(zhì)鑒定方面得到了廣泛應(yīng)用。本研究采集了苯二氮類(艾司唑侖、阿普唑侖、地西泮、硝西泮)和吩噻嗪類(奮乃靜、氯丙嗪、異丙嗪)藥物的紅外光譜數(shù)據(jù),通過主成分分析(Principal component analysis,PCA)提取不同波段光譜數(shù)據(jù)特征后進(jìn)行降維,并借助貝葉斯判別分析(Bayes discriminant analysis,BDA)和多層感知神經(jīng)網(wǎng)絡(luò)(MLP)構(gòu)建了單一和融合模型進(jìn)行對比。結(jié)果顯示,融合模型由于在數(shù)據(jù)預(yù)處理階段將提取的光譜數(shù)據(jù)特征值重新串聯(lián),從而可獲得更豐富的譜圖信息。本實(shí)驗(yàn)借助數(shù)據(jù)模型對不同類型樣品及同一類型不同種類的樣本進(jìn)行識別與分類,以期為相關(guān)案件的檢驗(yàn)鑒定提供參考,為相關(guān)物證的檢驗(yàn)鑒定提供幫助。
Nicolet 5700 型傅里葉變換紅外光譜儀(Thermo Fisher Scientific 公司),ATR 樣品槽使用金剛石晶體,KBr分束器(Thermo Fisher Scientific 公司),使用OMNIC 光譜數(shù)據(jù)處理軟件。掃描次數(shù)為64 次,分辨率為2 cm-1,光譜采集范圍為4 000~400 cm-1(4 000~3 700 cm-1主要為設(shè)備噪聲,1 300~400 cm-1為紅外光譜指紋區(qū)),每個樣本采集4次光譜曲線,取均值作為實(shí)驗(yàn)樣本光譜數(shù)據(jù)[13-16]。
借助傅里葉變換紅外光譜儀獲取樣本譜圖,采用峰面積歸一化、自動基線校正和多元散射校正等對譜圖進(jìn)行處理[17-19],將光譜數(shù)據(jù)集標(biāo)準(zhǔn)化并進(jìn)行一階與二階求導(dǎo),經(jīng)PCA 降維后以70%的樣本作為訓(xùn)練集,30%的樣本作為測試集構(gòu)建分類模型[20]。
圖1為各樣本的紅外光譜圖,在波數(shù)3 700~3 000 cm-1和2 500~2 000 cm-1范圍內(nèi),各樣本之間的峰形有所差異。2 750~3 000 cm-1波數(shù)范圍內(nèi)有尖峰,各類樣本部分波段出峰位置相似,具有相似的振動基團(tuán),總體峰形較為混雜,難以依靠圖譜進(jìn)行直觀區(qū)分。
圖1 苯二氮類(A)和吩噻嗪類(B)樣本的紅外光譜圖Fig.1 Infrared spectra of benzodiazepine(A)and phenothiazine(B)samples
分別構(gòu)建基于全波段光譜和指紋區(qū)光譜數(shù)據(jù)集的原始、一階和二階導(dǎo)數(shù)的單一模型,比較其BDA和MLP 的分類準(zhǔn)確率。由表1可知,單一模型中BDA 訓(xùn)練集和測試集的總體分類準(zhǔn)確率較為穩(wěn)定。這是由于MLP 分類識別率使用的是各數(shù)據(jù)集重復(fù)6 次測試的平均值,且采用隨機(jī)取樣的方式對數(shù)據(jù)變量進(jìn)行分析,導(dǎo)致分類識別率在一定區(qū)間內(nèi)變化。而BDA 是按判別函數(shù)值最大或后驗(yàn)概率最大進(jìn)行判別,因此分類識別率保持相對穩(wěn)定。
表1 不同方法下的分類識別率Table 1 Classification recognition rates under different methods
圖2 為全波段和指紋區(qū)數(shù)據(jù)集原始、一階導(dǎo)數(shù)和二階導(dǎo)數(shù)模型的受試者工作特征曲線(Receiver operator characteristic curve,ROC 曲線),縱坐標(biāo)為感光度,橫坐標(biāo)為特異性,圖2A 中的紅色和藍(lán)色兩條ROC曲線相較于圖2B均較為靠近左上角。ROC曲線越靠近左上角或ROC曲線下的面積(AUC)越大,模型越理想。反復(fù)進(jìn)行多次數(shù)據(jù)分析后發(fā)現(xiàn),相較于指紋區(qū)光譜,全波段光譜的分類識別率更高。
圖2 不同單一模型的ROC曲線Fig.2 ROC curves of different single models
綜合表1、圖2 可知,借助BDA 的分類模型中,基于全波段光譜數(shù)據(jù)集的二階導(dǎo)數(shù)單一模型分類效果最優(yōu),總體分類準(zhǔn)確率達(dá)92.7%。進(jìn)一步考慮對光譜數(shù)據(jù)進(jìn)行融合,以期使用更豐富的數(shù)據(jù)信息構(gòu)建分類模型,實(shí)現(xiàn)對樣本更準(zhǔn)確的分類。
如圖3 所示,通過PCA 對全波段和指紋區(qū)數(shù)據(jù)集二階導(dǎo)數(shù)模型進(jìn)行特征變量的提取,全波段和指紋區(qū)數(shù)據(jù)集分別提取到20個和18個特征值。圖中縱坐標(biāo)代表提取的特征值,橫坐標(biāo)的特征值重要性反映了此特征值對應(yīng)的特征向量對整個數(shù)據(jù)集的代表程度。特征值重要性的百分比越大,此特征值對應(yīng)的特征向量對整個數(shù)據(jù)集的代表程度越好。由此可見,基于全波段和指紋區(qū)數(shù)據(jù)集二階導(dǎo)數(shù)模型提取的大部分特征變量對數(shù)據(jù)集有較好的代表性。
圖3 全波段光譜(A)和指紋區(qū)光譜(B)二階導(dǎo)數(shù)模型特征值的重要性Fig.3 Eigenvalue importance of the second derivative model of the full spectra(A)and the fingerprint spectra(B)
在單一模型的基礎(chǔ)上,將經(jīng)過PCA 降維后提取到的特征值串聯(lián)后建立模型,對分類準(zhǔn)確率最高的全波段和指紋區(qū)數(shù)據(jù)集二階導(dǎo)數(shù)進(jìn)行融合,得到36 個特征值。如圖4 所示,相比單一模型,特征值數(shù)量得到明顯提高,其重要性有所提升。說明融合模型特征值能更好地反映整體數(shù)據(jù)集的情況。
圖4 全波段與指紋區(qū)光譜二階導(dǎo)數(shù)融合模型特征值的重要性Fig.4 Eigenvalue importance of a fusion model of the second derivative spectrum of the full spectra and fingerprint spectra
分別使用BDA 和MLP對全波段和指紋區(qū)數(shù)據(jù)集的二階導(dǎo)數(shù)融合模型進(jìn)行分析,對比不同模型對兩類安眠藥的分類預(yù)測準(zhǔn)確率,結(jié)果如表2 所示。由表可見,融合模型的效果優(yōu)于單一模型,借助BDA的二階導(dǎo)數(shù)融合模型分類效果好且穩(wěn)定。圖5為此融合模型的ROC 曲線,ROC 曲線下面積AUC 更直觀地體現(xiàn)了模型的分類效果。融合模型結(jié)合了單一模型的優(yōu)勢,對數(shù)據(jù)特征進(jìn)行了統(tǒng)計分析,使相似成分能夠有效區(qū)分,為模型的構(gòu)建提供了更全面的信息。
表2 不同方法下二階導(dǎo)數(shù)模型的分類識別率Table 2 Classification and recognition rates of the second derivative model under different methods
圖5 融合模型的ROC曲線Fig.5 ROC curve of the fusion model
吩噻嗪類:Y2=-33.111+2.582X1+9.682X2+10.469X3-23.157X4-4.367X5+11.491X6-4.610X7-3.893X8+ 3.607X9+ 10.743X10+ 2.101X11-4.845X12-3.784X13-8.514X14+ 3.233X15+ 0.720X16+ 4.382X17+0.596X18-3.116X19+ 2.126X20+ 1.897X21+ 2.401X22-0.081X23-1.298X24+ 8.182X25+ 1.575X26+ 1.254X27+3.817X28+4.638X29-6.281X30+3.626X31+3.297X32+5.108X33-2.739X34-11.766X35-8.238X36。
運(yùn)用貝葉斯判別公式可以計算出兩類鎮(zhèn)靜安眠藥的分類識別率,結(jié)果表明兩類藥物均可實(shí)現(xiàn)100%的準(zhǔn)確區(qū)分,分類結(jié)果理想。以上實(shí)驗(yàn)表明,借助貝葉斯判別分析的基于全波段和指紋區(qū)融合數(shù)據(jù)集的二階導(dǎo)數(shù)模型為最佳分類模型。
采用借助貝葉斯判別分析的全波段和指紋區(qū)融合數(shù)據(jù)集的二階導(dǎo)數(shù)模型對4種苯二氮類和3種吩噻嗪類鎮(zhèn)靜安眠藥進(jìn)行分類識別,分別得到兩類鎮(zhèn)靜安眠藥的空間分布圖。如圖6A所示,不同種類樣品在不同判別軸上的分布差異性大,其中藍(lán)色與綠色較為集中,結(jié)合BDA1、BDA2 與BDA3 判別軸,該模型對所有苯二氮類樣品的分類正確率達(dá)96.7%。如圖6B 所示,在BDA4 判別軸上,綠色與紅色分離較好;在BDA5判別軸上,藍(lán)色與紅色分離較好,結(jié)合BDA4 與BDA5 判別軸可實(shí)現(xiàn)對所有吩噻嗪類樣品100%的準(zhǔn)確分類。結(jié)果證明該分類模型對同一類型不同種類的安眠藥同樣適用。
圖6 苯二氮類(A)和吩噻嗪類(B)藥物的空間分布圖Fig.6 The spatial classification details of benzodiazepine(A)and phenothiazine(B)samples
本文將不同波段紅外光譜數(shù)據(jù)融合,借助貝葉斯判別分析和多層感知器構(gòu)建分類模型,實(shí)現(xiàn)了不同類型鎮(zhèn)靜安眠藥的快速、無損有效區(qū)分?;诙A導(dǎo)數(shù)構(gòu)建了全波段與指紋區(qū)光譜的融合模型,并與單一模型進(jìn)行比較,發(fā)現(xiàn)融合模型對苯二氮類和吩噻嗪類兩個不同類型精神藥物的分類準(zhǔn)確率可達(dá)到100%;對苯二氮類精神藥物中艾司唑侖、阿普唑侖、地西泮和硝西泮的分類準(zhǔn)確率達(dá)到96.7%;對吩噻嗪類精神藥物中奮乃靜、氯丙嗪、異丙嗪的分類準(zhǔn)確率達(dá)到100%。不同類型藥物的光譜數(shù)據(jù)不同,可以此為依據(jù)對海關(guān)現(xiàn)場繳獲的精神藥物進(jìn)行分類鑒別,提升公安機(jī)關(guān)維護(hù)社會公共安全的能力。光譜融合技術(shù)為管制類藥物的研究提供了一種快速且無損的有效方法,有望成為法庭科學(xué)領(lǐng)域的有利分析工具。