林凡琦, 姜 紅*, 王嘉庚, 滿 吉
(1.中國人民公安大學(xué)偵查學(xué)院,北京 100038;2.北京市公安局豐臺(tái)分局,北京 100071;3.北京華儀宏盛技術(shù)有限公司,北京 100123)
橡膠作為常見的鞋底制作材料,是法庭科學(xué)中的常見物證。對(duì)現(xiàn)場(chǎng)提取的橡膠鞋底微量物證進(jìn)行比對(duì)檢驗(yàn),可以為劃定偵查范圍、確定或排除嫌疑人提供依據(jù)。橡膠鞋底材料是高分子混合物,其中既含有天然橡膠成分,也含有順丁橡膠、異戊橡膠、丁苯橡膠等合成橡膠成分[1]。橡膠鞋底成分多樣,制造工藝不同導(dǎo)致其內(nèi)部成分不均勻,這對(duì)橡膠鞋底中有機(jī)成分的檢測(cè)造成困難。在生產(chǎn)過程中廠家為了適應(yīng)不同的使用需求,會(huì)在橡膠鞋底制作中加入硫化劑、促進(jìn)劑、補(bǔ)強(qiáng)劑、填充劑、防老劑等添加劑[2],這使得橡膠鞋底中含有大量金屬元素,且具有易檢測(cè)、出現(xiàn)率高、成分穩(wěn)定的特點(diǎn)。由于不同鞋種、不同品牌的橡膠鞋底所用的添加劑和其它助劑不同,所含金屬元素也就不同,這為利用無機(jī)元素檢測(cè)區(qū)分不同橡膠鞋底提供了條件。
目前法庭科學(xué)對(duì)于橡膠物證的檢驗(yàn)方法,主要有紅外光譜法[3]、拉曼光譜法[4]、裂解氣相色譜法[5,6]、X射線熒光光譜法[2]等。X射線熒光光譜法是利用高能的X射線照射樣本,根據(jù)發(fā)出的具有一定特征的X射線光譜確定元素種類的一種光學(xué)檢驗(yàn)技術(shù)。X射線熒光光譜儀能夠根據(jù)樣本中各元素能量的高低來測(cè)定各元素的量,實(shí)現(xiàn)對(duì)樣本中無機(jī)元素成分的定性與半定量,在土壤檢測(cè)[7]、材料成分辨別[8]、礦業(yè)勘探[9]等領(lǐng)域都有廣泛應(yīng)用。在公安實(shí)踐中,因?yàn)閄射線熒光光譜具備檢驗(yàn)過程無損、分析速度快、靈敏度高的特點(diǎn),被廣泛用于文件檢驗(yàn)[10]、理化分析[11]、爆炸現(xiàn)場(chǎng)勘查[12]等方面。已有研究針對(duì)X射線熒光光譜法檢驗(yàn)橡膠鞋底進(jìn)行實(shí)驗(yàn),但主要停留于定性分析層面,在公安實(shí)踐中的應(yīng)用效果有限[13,14]。本實(shí)驗(yàn)利用X射線熒光光譜法對(duì)50個(gè)不同品牌、不同鞋種的橡膠鞋底樣本進(jìn)行檢驗(yàn),并結(jié)合多元分類模型實(shí)現(xiàn)對(duì)不同鞋種樣本的有效區(qū)分,可為現(xiàn)場(chǎng)快速鑒別橡膠鞋底微量物證提供參考。
X-MET8000能量色散型熒光光譜儀(日本,日立公司)。靶極為Rh陽極靶,工作電壓為45 kV,工作電流為40 μA,檢測(cè)時(shí)間為60 s。
不同品牌、不同鞋種的橡膠鞋底樣本共50個(gè),其中包括皮鞋樣本25個(gè),休閑鞋樣本11個(gè),籃球鞋樣本5個(gè),跑鞋樣本2個(gè)、足球鞋樣本3個(gè)、拖鞋樣本4個(gè),共30個(gè)品牌。具體樣本信息如表1所示。
表1 50個(gè)橡膠鞋底樣本列表
用手術(shù)刀切取厚度在2~3 mm左右,面積約1 cm×1 cm大小的橡膠鞋底碎塊,分別進(jìn)行裝袋并編號(hào)記錄。將處理好的樣品分別放置在測(cè)試臺(tái)上,在上述的相同實(shí)驗(yàn)條件下,對(duì)樣品分別進(jìn)行3次測(cè)定后,取平均值。
多層感知器(MLP)神經(jīng)網(wǎng)絡(luò)是一種前向結(jié)構(gòu)的人工神經(jīng)網(wǎng)絡(luò),包含輸入層、輸出層及多個(gè)隱藏層。網(wǎng)絡(luò)數(shù)據(jù)由輸入層向下層傳輸,由隱藏層中帶有激活函數(shù)的神經(jīng)元對(duì)輸入數(shù)據(jù)進(jìn)行計(jì)算,同時(shí)將信息傳遞至輸出層[15]。MLP作為一種高度并行的信息處理系統(tǒng),對(duì)于系統(tǒng)的參數(shù)變化及外界干擾都有很好的魯棒性,被廣泛用于解決各種分類問題[16,17]。
二元logistic回歸是一種廣義的線性回歸分類模型,適合數(shù)值型的二值型輸出的擬合,常用于疾病診斷、經(jīng)濟(jì)預(yù)測(cè)等領(lǐng)域。其基本原理為:以Y表示二分類反應(yīng)變量,假設(shè)自變量為m個(gè),記為X1,X2,X3,…Xm。設(shè)P=(Y=1),則構(gòu)建logistic模型如下:
(1)
其中,β0為常數(shù)項(xiàng)(截距),βi為自變量Xi的回歸系數(shù)。當(dāng)e(β0+β1X1+β2X2+…+βmXm)在(-∞,+∞)之間變動(dòng)時(shí),P在0到1之間變動(dòng)??蓳?jù)此分析反應(yīng)變量和自變量之間的關(guān)系,并計(jì)算變量取特定值的概率[18]。
Fisher線性判別分析是一種常見的以統(tǒng)計(jì)模型進(jìn)行模式識(shí)別的方法。其思想為:將原來在R維空間的自變量組合投影到維度較低的D維空間上,再根據(jù)類間差異最大、類內(nèi)方差最小的原則建立線性判別方程。
皮鞋是最常見的檢材之一,故主要研究建立的模型對(duì)于皮鞋類橡膠鞋底與其他鞋種橡膠鞋底的區(qū)分。以X射線熒光光譜檢驗(yàn)所得各橡膠鞋底類樣本中穩(wěn)定出現(xiàn)的元素為自變量建立MLP模型,得到樣本重要性正態(tài)化分布圖如圖1所示。分析圖1可知,F(xiàn)e、Pb、Zn元素對(duì)于模型構(gòu)建的影響相對(duì)較大。
圖1 自變量重要性圖Fig.1 Importance of independent variables
實(shí)驗(yàn)以樣本中穩(wěn)定出現(xiàn)的元素為自變量建立二元logistic 回歸模型,對(duì)各自變量的顯著性進(jìn)行統(tǒng)計(jì)分析。結(jié)果見表2,其中1單位Exp表示每增加1個(gè)單位目標(biāo)變量,模型判定為“是”的可能性增加1倍。分析表2可知,Cu、Pb、Zn元素的顯著性均小于0.1,可以顯著影響模型分類結(jié)果。綜上所述,實(shí)驗(yàn)選擇以“是否為皮鞋類樣本”作為因變量,Pb、Fe、Zn、Cu元素為協(xié)變量構(gòu)建模型。
表2 自變量顯著性分析
分別構(gòu)建基于MLP、二元logistic回歸和Fisher判別的分類模型,得到橡膠鞋底樣本在3種模型下的識(shí)別率如表3所示。在MLP模型中,皮鞋類樣本實(shí)現(xiàn)了全部歸類,非皮鞋類樣本的識(shí)別準(zhǔn)確率為88%,總體識(shí)別準(zhǔn)確率為94%,其分類結(jié)果較理想;二元logistic回歸模型總體分類準(zhǔn)確率達(dá)86%,皮鞋類樣本歸類準(zhǔn)確率為84%,而非皮鞋類樣本的歸類準(zhǔn)確率為88%;Fisher判別分析模型對(duì)于皮鞋類樣本的歸類準(zhǔn)確率為84%,非皮鞋類樣本歸類準(zhǔn)確率僅64%,總體準(zhǔn)確率為74%,分類結(jié)果不理想。結(jié)果表明,MLP模型對(duì)于橡膠鞋底樣本種類的區(qū)分能力明顯高于另外兩種。Fisher判別分析的結(jié)果則表明,將高緯度特征進(jìn)行降維處理,按照同一類別投影盡可能靠近,不同類別投影盡可能分離的數(shù)據(jù)識(shí)別方式,難以對(duì)皮鞋類橡膠鞋底樣本與非皮鞋類橡膠鞋底樣本進(jìn)行有效區(qū)分。
表3 不同模型分類結(jié)果
3種分類模型的誤分樣本基本信息如表4所示。分析表4可知,相較于Fisher判別分析與二元logistic回歸,MLP模型對(duì)于籃球鞋樣本與皮鞋樣本都有更好的識(shí)別準(zhǔn)確率。與前者相比,后二者模型對(duì)于非皮鞋類樣本的分析判別能力較弱,判斷這與樣本的不平衡有關(guān)。非皮鞋類樣本種類各樣,相互之間存在一定不同,這為模型的識(shí)別增加了難度。MLP模型在這類因素的干擾下,顯示出更好的魯棒性。
表4 誤分樣本信息
實(shí)驗(yàn)中3種分類模型均無法正確識(shí)別26#樣本,MLP模型無法正確識(shí)別4#、37#樣本。這3個(gè)樣本中,4#與26#樣本為跑鞋,37#樣本為軍用底材質(zhì)的休閑鞋。上述誤分樣本的特征元素含量見表5。
表5 誤分樣本元素含量(μg/g)
分析表5可知,樣本4#、26#中含有的Pb元素較少,與皮鞋類樣本的Pb元素含量接近,由于Pb元素在模型中的顯著性達(dá)0.061,對(duì)于分類結(jié)果的影響大,故判斷這是導(dǎo)致分類錯(cuò)誤的主要原因。后續(xù)可相應(yīng)增加跑鞋類樣本,訓(xùn)練提高模型對(duì)此類樣本的區(qū)分能力。樣本37#與其他休閑鞋樣本相比Pb元素含量較少而Cu元素含量較高,與皮鞋類樣本接近,判斷是因?yàn)闃颖?7#為軍用底休閑鞋,其加工材質(zhì)與皮鞋類鞋底樣本相近。
本實(shí)驗(yàn)利用X射線熒光光譜技術(shù)對(duì)50個(gè)不同橡膠鞋底樣本進(jìn)行了檢驗(yàn),通過多元分類模型對(duì)樣本進(jìn)行準(zhǔn)確識(shí)別和分類,并依據(jù)自變量顯著性篩選出了影響皮鞋類橡膠鞋底樣本識(shí)別的主要特征元素。結(jié)果表明,相較于Fisher判別分析和二元logistic回歸,多層感知器神經(jīng)網(wǎng)絡(luò)對(duì)于外界與樣本自身因素干擾有更好的魯棒性,其模型總體識(shí)別準(zhǔn)確率達(dá)94%,皮鞋類樣本歸類準(zhǔn)確率達(dá)100%,實(shí)驗(yàn)結(jié)果理想。本文提出的將X射線熒光光譜與多層感知器神經(jīng)網(wǎng)絡(luò)算法相結(jié)合構(gòu)建橡膠鞋底分類模型的方法,可以實(shí)現(xiàn)對(duì)現(xiàn)場(chǎng)提取的橡膠鞋底微量物證的快速、無損檢驗(yàn),具有一定的實(shí)踐價(jià)值,能為后續(xù)的偵查提供方向。在后續(xù)實(shí)驗(yàn)中,可針對(duì)性擴(kuò)大不同鞋種橡膠鞋底樣本的容量,提高識(shí)別模型的準(zhǔn)確性。