南迪娜, 董力強(qiáng), 傅文翔, 劉衛(wèi)衛(wèi), 孔景臨
國民核生化災(zāi)害防護(hù)國家重點(diǎn)實(shí)驗(yàn)室, 北京 102205
快速準(zhǔn)確地識(shí)別化學(xué)毒劑、 有毒工業(yè)化學(xué)品等危險(xiǎn)物質(zhì)在重大活動(dòng)安保、 交通運(yùn)輸、 海關(guān)物流、 司法物證、 反化學(xué)恐怖等公共安全領(lǐng)域需求明顯。 這些化學(xué)危險(xiǎn)品如可揮發(fā)、 強(qiáng)致死的神經(jīng)性毒劑沙林、 梭曼等均為無色透明液體, 外觀與水、 乙醇等常見液體無異, 具有被人員夾帶、 謊報(bào)、 隱蔽投放到公共場所的風(fēng)險(xiǎn)。 要快速排查及準(zhǔn)確識(shí)別此類液體樣品, 一般都要開瓶采樣進(jìn)行現(xiàn)場檢測或送實(shí)驗(yàn)室分析, 這種方式增加了執(zhí)行任務(wù)人員的暴露風(fēng)險(xiǎn)且檢測操作耗時(shí)。 拉曼光譜(Raman spectroscopy)技術(shù)憑借其快速、 靈敏、 非接觸式操作、 儀器可便攜化等優(yōu)勢成為現(xiàn)場快速檢測領(lǐng)域的研究熱點(diǎn)。 目前, 美國Wiley的Bio-Rad以及國內(nèi)同方威視[1]等研究出版機(jī)構(gòu)和拉曼光譜儀供應(yīng)商等都建立了拉曼光譜數(shù)據(jù)庫, 包含多種環(huán)境污染物、 易燃易爆及強(qiáng)腐蝕性化學(xué)危險(xiǎn)品; 針對危險(xiǎn)品識(shí)別的需求, 有研究通過實(shí)測譜圖與數(shù)據(jù)庫中正反向特征峰匹配分析危險(xiǎn)液體[2], 或開發(fā)一些拉曼光譜識(shí)別方法[3]和軟件[4]; 還有研究通過硬件改進(jìn), 互補(bǔ)式使用雙波長激光器手持式拉曼系統(tǒng)實(shí)現(xiàn)危險(xiǎn)品檢測[5]。 上述拉曼光譜數(shù)據(jù)庫均不包含化學(xué)毒劑等的光譜信息, 利用市售的數(shù)據(jù)庫很難實(shí)現(xiàn)公共安全領(lǐng)域中危險(xiǎn)液體的有效識(shí)別。 本研究較為系統(tǒng)地研究了多種化學(xué)毒劑及其前體或降解產(chǎn)物、 有毒工業(yè)化學(xué)品等危險(xiǎn)液體的拉曼光譜檢測方法, 獲得了41種危險(xiǎn)液體的高信噪比拉曼光譜數(shù)據(jù)并將其錄入數(shù)據(jù)庫, 再利用多種模式識(shí)別算法開展危險(xiǎn)液體的識(shí)別研究, 通過線性判別分析(linear discriminant analysis, LDA)方法, 提出的譜圖識(shí)別模型可對上述危險(xiǎn)液體進(jìn)行準(zhǔn)確識(shí)別歸類, 并能將其與水等無害物質(zhì)快速區(qū)分。
innoRam便攜式拉曼光譜儀(美國BWTEK公司), 配備有785 nm激光器。
檢測物包括沙林、 梭曼、 塔崩、 維埃克斯、 芥子氣等化學(xué)毒劑; 磷酸三甲酯、 磷酸三乙酯、 磷酸三丁酯、 甲基膦酸二甲酯、 甲基膦酸二異丙酯等化學(xué)毒劑模擬劑; 亞磷酸二甲酯、 亞磷酸三甲酯、 亞磷酸三乙酯、 甲基膦酰氯乙酯、 甲基膦酰二氯、 甲基膦酰二氟、 氯沙林、 二乙胺基磷酰氯、 2-二乙胺基乙硫醇、 硫二甘醇、 異丙醇、 頻吶基醇、 甲基膦酸、 甲基膦酸異丙酯、 甲基膦酸頻吶基酯等化學(xué)毒劑前體、 中間產(chǎn)物、 水解產(chǎn)物; 鄰二甲苯、 間二甲苯、 苯甲醚、 氯代苯、 乙酸乙酯、 乙酸乙烯酯、 乙酸芐酯、 甲醇、 乙醇、 乙腈、 丙酮、 1,1,1-三氯乙烷、 正己烷、 正丁醇、 四氯化碳等有毒工業(yè)化學(xué)品以及汽油和水。 其中磷酸三甲酯為分析純, 購自中國醫(yī)藥集團(tuán)上?;瘜W(xué)試劑公司; 磷酸三乙酯、 乙酸乙酯為分析純, 購自天津市福晨化學(xué)試劑廠; 磷酸三丁酯為分析純, 購自天津市化學(xué)試劑; 甲基膦酸二甲酯為分析純, 購自麥克林; 鄰二甲苯、 間二甲苯、 苯甲醚、 氯代苯、 乙酸乙烯酯、 正丁醇純度大于99.0%, 購自天津市光復(fù)精細(xì)化工研究所; 乙酸芐酯純度大于99%, 購自北京百靈威科技有限公司; 甲醇、 乙腈為高效液相色譜純度, 購自Sigma。 乙醇、 丙酮、 四氯化碳純度大于99.5%, 購自北京化工廠; 1,1,1-三氯乙烷純度大于96%, 購自阿拉?。?正己烷純度大于95.0%, 購自北京世紀(jì)紅星化工有限公司; 水為市售娃哈哈純凈水。
1.2.1 建立拉曼光譜檢測方法
拉曼光譜儀開機(jī)后, 掃描空白光譜作為扣除的背景, 以消除儀器帶來的噪聲。 采集硅片的拉曼光譜并確認(rèn)出峰波數(shù)為512 cm-1。 取適量樣品至潔凈透明玻璃瓶并放到樣品池中, 設(shè)置激光功率為滿值150 mW的10%~100%、 積分時(shí)間500~7 000 ms、 累積1~5次, 采集各條件下拉曼光譜并保存數(shù)據(jù)。
1.2.2 光譜數(shù)據(jù)分析
使用Matlab R2019a完成光譜數(shù)據(jù)分析。 將采集到的619個(gè)拉曼譜圖截取200~3 000 cm-1范圍的主要波段, 以1 cm-1間隔等距線性插值采樣得到1×2 801維樣本數(shù)據(jù), 將光譜進(jìn)行離差標(biāo)準(zhǔn)化處理, 完成光譜樣本預(yù)處理。 采用主成分分析方法對光譜數(shù)據(jù)進(jìn)行降維壓縮, 選擇前7個(gè)主成分作為數(shù)據(jù)集樣本, 以覆蓋原始數(shù)據(jù)80%以上信息。 各樣品隨機(jī)分配70%譜圖為訓(xùn)練集數(shù)據(jù), 其余歸入測試集。 利用訓(xùn)練集數(shù)據(jù)訓(xùn)練線性判別分析、 二次判別分析(quadratic discriminant analysis, QDA)、 k近鄰(k-nearest neighbor, kNN)、 樸素貝葉斯(naive Bayesian, NB)模型、 分類決策樹(classification tree, CT)、 支持向量機(jī)(support vector machine, SVM)6種模式識(shí)別算法的模型, 再用訓(xùn)練好的模型對測試集數(shù)據(jù)進(jìn)行識(shí)別歸類。
1.2.3 盲樣測試
重新隨機(jī)選取10個(gè)樣品采集光譜, 用訓(xùn)練好的線性判別分析模型識(shí)別新測得的譜圖, 以驗(yàn)證本研究檢測及識(shí)別方法的可靠性。
由圖1可見拉曼光譜反映了化合物的化學(xué)鍵構(gòu)成, 是一種可用于化合物鑒別的指紋譜。 但由于分子振動(dòng)的復(fù)雜性, 不是所有譜峰都易于歸屬, 僅靠拉曼光譜提供的信息難以準(zhǔn)確判定化合物結(jié)構(gòu), 而利用化學(xué)計(jì)量學(xué), 將模式識(shí)別方法與拉曼光譜結(jié)合是提高鑒別準(zhǔn)確性的有效手段。
圖1 化學(xué)危險(xiǎn)品和水的拉曼光譜
各樣品的前3個(gè)主成分分布如圖2所示。 由圖可見, 拉曼光譜作為分子指紋譜, 具有豐富的化學(xué)鍵及其所處環(huán)境的信息, 可將不同類型的樣品加以區(qū)分。 為比較模型的識(shí)別準(zhǔn)確率, 使用線性判別分析、 二次判別分析、 k近鄰、 樸素貝葉斯模型、 分類決策樹、 支持向量機(jī)6種模式識(shí)別算法對180個(gè)測試集數(shù)據(jù)進(jìn)行識(shí)別歸類后, 識(shí)別結(jié)果列于表1。
圖2 各樣品的前3個(gè)主成分分布
由表1可見, 支持向量機(jī)、 線性判別分析模型具有100%的最高識(shí)別準(zhǔn)確率。 支持向量機(jī)是以各類樣本間隔最大為原則, 其分類判別界面取決于類別邊界的“支持向量”。 線性判別分析則是以原始樣本投影得到向量的類間距離最大、 類內(nèi)方差最小為原則, 通過Fisher判別式對樣本進(jìn)行分類的模型, 其判別界面更取決于“類心”。 當(dāng)各樣品多個(gè)訓(xùn)練集譜圖中有個(gè)別因儀器影響或外界環(huán)境改變出現(xiàn)一定偏差的譜圖時(shí), 支持向量機(jī)模型在對未知樣品識(shí)別時(shí), 會(huì)因此對結(jié)果產(chǎn)生較大影響。 因數(shù)據(jù)庫中該樣品“類心”無大偏差, 同樣情況下線性判別分析模型的識(shí)別結(jié)果波動(dòng)較小具有穩(wěn)健性, 故本研究選取線性判別分析模型進(jìn)行未知危險(xiǎn)化學(xué)品的識(shí)別。 利用線性判別分析模型重復(fù)10次識(shí)別歸類后, 其識(shí)別結(jié)果穩(wěn)定于100%的準(zhǔn)確率不變, 可見該模型具有高識(shí)別準(zhǔn)確率及穩(wěn)定性。 對重新采集的10個(gè)盲樣譜圖, 線性判別分析模型可以全部準(zhǔn)確識(shí)別。 不同化合物即使元素組成相同, 基團(tuán)或其所處環(huán)境的差異會(huì)使其具有不同的拉曼光譜特征。 拉曼光譜的分子指紋譜特點(diǎn)防止了線性判別分析模型可能過度擬合數(shù)據(jù)而導(dǎo)致分類識(shí)別結(jié)果準(zhǔn)確率降低。
表1 6種模式識(shí)別方式對測試集拉曼數(shù)據(jù)的識(shí)別準(zhǔn)確率(%)
以多種化學(xué)毒劑及其前體、 中間體、 水解產(chǎn)物、 模擬劑和有毒工業(yè)化學(xué)品等為研究對象, 建立了化學(xué)毒害物質(zhì)拉曼光譜數(shù)據(jù)庫。 在此基礎(chǔ)上, 以不同模式識(shí)別方法對上述毒害物質(zhì)以及常見液體如水、 乙醇、 汽油等進(jìn)行了快速篩查研究。 結(jié)果表明, 外觀均為無色透明液體的各類化合物散射光譜特征差異顯著, 反映出拉曼光譜的指紋譜特征; 模式識(shí)別方法與拉曼光譜結(jié)合可有效鑒別危險(xiǎn)液體, 其中線性判別分析模型的識(shí)別結(jié)果波動(dòng)較小更具穩(wěn)健性; 全部測試過程在較短時(shí)間內(nèi)即可完成且不損耗樣品, 保證了測試通量和遂行任務(wù)人員安全, 該研究可為與不明化學(xué)品篩查相關(guān)的公共安全問題提供技術(shù)支撐。