付鈞澤,姜 紅*,李 意,滿 吉
(1.中國(guó)人民公安大學(xué) 偵查學(xué)院,北京 100038;2.北京華儀宏盛技術(shù)有限公司,北京 100024)
隨著煙民數(shù)量逐年增多,煙草消耗量越來(lái)越大,香煙的種類日益增多[1],在各類案件現(xiàn)場(chǎng)經(jīng)常能提取到香煙煙灰物證。通過(guò)對(duì)提取到的煙灰物證進(jìn)行檢驗(yàn),運(yùn)用多元統(tǒng)計(jì)方法建立分析模型,可以對(duì)香煙煙灰物證進(jìn)行快速識(shí)別[2]。香煙物證是法庭科學(xué)研究的重點(diǎn)問(wèn)題,筆者已對(duì)香煙水松紙做過(guò)系統(tǒng)地研究[3-4]。MA等人[5]利用原子吸收法測(cè)定了卷煙煙灰中金屬元素,提出了先進(jìn)行灰化再微波消解的干濕結(jié)合前處理方法。CUI等人[6]采用電感耦合等離子體質(zhì)譜法(inductively coupled plasma mass sprctrometry,ICP-MS)對(duì)香煙中的微量元素進(jìn)行了準(zhǔn)確測(cè)定。PéREZBERNAL等人[7]利用電感耦合等離子體原子發(fā)射光譜法研究了14種微量元素在不同品牌香煙煙灰中的分布情況。HAN[8]利用激光誘導(dǎo)擊穿光譜技術(shù)測(cè)量了煙草和煙灰中一些金屬元素的含量。ZHAO等人[9]利用X射線衍射法對(duì)28種國(guó)產(chǎn)香煙煙灰中礦物成分進(jìn)行了研究。GARG等人[10]采用中子活化分析法對(duì)香煙煙灰中微量元素進(jìn)行了檢驗(yàn)。WU等人[11]利用掃描電鏡/能譜法對(duì)25個(gè)不同的香煙煙灰樣品進(jìn)行了分析,結(jié)果表明同一品牌不同檔次、同一廠家不同品牌的香煙灰樣品中的元素種類和相對(duì)百分含量存在明顯差異。上述方法中,有的儀器設(shè)備價(jià)格昂貴,樣品制備復(fù)雜,最佳操作條件遴選過(guò)程周期較長(zhǎng)、靈敏度較低。而X射線熒光光譜法具有分析時(shí)間短、分析元素廣、工作曲線線性范圍寬、對(duì)檢材無(wú)損且光譜干擾少等優(yōu)點(diǎn),被廣泛應(yīng)用于冶金、化工等行業(yè)[12-16]。
本實(shí)驗(yàn)中采用手持式能量色散型X射線熒光光譜儀對(duì)收集到的83個(gè)不同品牌、同一品牌不同系列的香煙煙灰樣品進(jìn)行檢驗(yàn),結(jié)合系統(tǒng)聚類的方法對(duì)樣品準(zhǔn)確分類,并通過(guò)回歸分析及判別分析法驗(yàn)證其準(zhǔn)確性。取得了良好的實(shí)驗(yàn)效果,可為案件現(xiàn)場(chǎng)香煙煙灰物證快檢提供借鑒。
OXFORD X-MET7500型熒光光譜儀(OXFORD公司);Poly-MHP透射膜、樣品盒;Rh為陽(yáng)極靶,電壓為40kV,電流為50mA,測(cè)試時(shí)間為90s。
不同品牌、同一品牌不同系列的香煙煙灰樣本83個(gè),見(jiàn)表1。
Table 1 Sample table of cigarette ash
continue
將收集到的煙灰樣品裝入樣品盒內(nèi),用Poly-MHP透射膜將裝有煙灰的樣品盒上端封住,在上述實(shí)驗(yàn)條件下進(jìn)行檢測(cè)。借助SPSS24.0軟件,Zscore 標(biāo)準(zhǔn)化處理數(shù)據(jù)[17]。利用數(shù)理統(tǒng)計(jì)方法,對(duì)樣品進(jìn)行分析。
按照相似性將物理或抽象對(duì)象分類,各個(gè)類別由類似對(duì)象組成,這一過(guò)程稱為聚類。聚類分析是按照一定的相似性對(duì)樣品分類后,通過(guò)分析發(fā)現(xiàn)全局?jǐn)?shù)據(jù)的分布模式及樣品之間的相互關(guān)系[18]?,F(xiàn)將樣品數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,然后采用Ward法作為類間親疏程度的度量方法,平方歐氏距離作為個(gè)體間距離的計(jì)算方式。樣品經(jīng)過(guò)聚類分析后的分類結(jié)果見(jiàn)圖1。
Fig.1 Dendrogram of cluster results
如圖1所示,為了不使樣品分類類別過(guò)多,同時(shí)達(dá)到聚類分析的目的,取重新標(biāo)定距離為5,所有樣品被分為4類(見(jiàn)表2)。
Table 2 Classification results of tobacco ash samples
為了考察聚類結(jié)果的準(zhǔn)確性,借助多元線性回歸分析考察聚類結(jié)果分成的不同類別與各個(gè)元素變量之間的相互依賴的關(guān)系。回歸分析是研究變量之間相關(guān)關(guān)系的一種統(tǒng)計(jì)方法,運(yùn)用十分廣泛,這種技術(shù)通常用于預(yù)測(cè)分析[19]?;貧w模型的相關(guān)參量方差分析結(jié)果見(jiàn)表3?;貧w模型的分析結(jié)果見(jiàn)表4。殘差直方圖見(jiàn)圖2。標(biāo)準(zhǔn)化殘差預(yù)期累積概率-累積目標(biāo)概率圖見(jiàn)圖3。
Table 3 Analysis of variance results
Table 4 Model summary
由表3可知,回歸模型的顯著性水平為0.000(預(yù)測(cè)變量:常數(shù)、鉛、鐵、鈷、鉀、鈦、鋯、鋅、銅、鈣、汞、錳、鋇、銣、鍶),其顯著性概率遠(yuǎn)遠(yuǎn)小于0.01,故說(shuō)明該模型內(nèi)各個(gè)元素變量對(duì)類別變量的影響達(dá)到顯著性水平。
Fig.2 Histogram of residuals
Fig.3 Expected cumulative probability-cumulative probability of observation of standardized residual
R2代表著模型參量對(duì)因變量的解釋能力,不同模型可以直接用R2來(lái)判斷模型精確度的高低,其值越接近1,說(shuō)明回歸直線對(duì)于觀測(cè)值的擬合效果越好。由表4可知,該回歸模型的調(diào)整后R=0.793,擬合度較好(預(yù)測(cè)變量同表3)。Durbin-Watson統(tǒng)計(jì)量的值為2.010,與臨界值(d=2)十分接近,在無(wú)自相關(guān)性的值域之中,認(rèn)定殘差獨(dú)立,通過(guò)檢驗(yàn)。說(shuō)明變量之間基本沒(méi)有自相關(guān)性,各個(gè)元素變量的獨(dú)立性較好[20]。
由圖2可知,標(biāo)準(zhǔn)化殘差直方圖呈一個(gè)倒扣的鐘形,左右兩側(cè)基本對(duì)稱。由圖3可知,標(biāo)準(zhǔn)化殘差的預(yù)期累積概率-累積目標(biāo)概率圖中散點(diǎn)大部分靠近斜線,綜合而言,殘差符合正態(tài)分布。根據(jù)以上殘差獨(dú)立性檢驗(yàn)和殘差正態(tài)性檢驗(yàn)的結(jié)果,認(rèn)為數(shù)據(jù)基本滿足線性回歸要求,所建立的模型可按照擬合質(zhì)量進(jìn)行預(yù)測(cè),即通過(guò)2.1節(jié)中聚類分析得到的樣品類別與各元素之間可建立良好的擬合關(guān)系,說(shuō)明聚類結(jié)果較為準(zhǔn)確。
判別分析是一種判斷個(gè)體所屬類別的統(tǒng)計(jì)分析手段[21-22],是根據(jù)已知對(duì)象的某些觀測(cè)值和其所屬類別來(lái)判斷未知對(duì)象所屬類別,因此可將判別分析與聚類分析相結(jié)合,建立判別模型對(duì)聚類分析結(jié)果進(jìn)行檢驗(yàn)。將2.1節(jié)中聚類分析的結(jié)果作為已知類別,對(duì)樣品聚類結(jié)果進(jìn)行逐步判別分析,根據(jù)判別函數(shù)計(jì)算得出相對(duì)應(yīng)的得分, 樣品最終劃入得分最高的類中[23-24]。4個(gè)類別Wilk的Lambda檢驗(yàn)判別結(jié)果見(jiàn)表5。
Table 5 Wilks Lambda result
由表5可知,軟件在判別過(guò)程中建立了3個(gè)判別函數(shù),函數(shù)1、2、3的顯著性水平均小于0.05,說(shuō)明3個(gè)判別函數(shù)顯著成立,采用這3個(gè)函數(shù)得到的判別結(jié)果較好,判別函數(shù)的特征值見(jiàn)表6。
Table 6 Eigenvalue of discriminant function
表6中的方差百分比反映了典型函數(shù)所能解釋的方差變異程度(*表示分析中使用了前3種典型的判別函數(shù)),由函數(shù)1的方差百分比值為76.0%,函數(shù)2的方差百分比值為17.7%,函數(shù)3的方差百分比為6.3%,函數(shù)1所能解釋的信息遠(yuǎn)遠(yuǎn)比函數(shù)2及函數(shù)3多。所以選取函數(shù)1作為區(qū)分樣品的主要判別依據(jù)。函數(shù)1與函數(shù)2之間典型相關(guān)性系數(shù)分別為0.961和0.860,表示樣品在函數(shù)1和函數(shù)2這兩個(gè)維度上具有顯著差異。故選擇函數(shù)1和函數(shù)2作為函數(shù)判別軸建立聯(lián)合分布圖,結(jié)果見(jiàn)圖4。
Fig.4 Joint distribution of discriminant functions
由圖4可知,1代表第Ⅰ類樣品,2代表第Ⅱ類樣品,3代表第Ⅲ類樣品,4代表第Ⅳ類樣品。這4類樣品在函數(shù)1、函數(shù)2的判別軸上區(qū)分明顯。由于函數(shù)1是區(qū)分樣品的主要依據(jù),在函數(shù)1的維度上,4類樣本之間的差異性顯著,同一類的樣品均落在了同一區(qū)域。利用Fisher判別函數(shù)進(jìn)行回判,樣品回判正確率為100%,表明該判別模型對(duì)樣品的區(qū)分效果顯著。結(jié)果見(jiàn)表7。
Table 7 Sample back judgment output table
第Ⅰ類樣品的線性判別函數(shù)是:
Y1=-24.019-4.080X1+1.949X2+1.869X3+
4.030X4-6.936X5+1.422X6-0.246X7+
2.423X8+8.208X9-12.735X10-4.689X11-
1.304X12-6.957X13-8.006X14
(1)
第Ⅱ類樣品線性判別函數(shù)是:
Y2=-28.162+1.769X1-2.951X2-5.120X3-
5.183X4+12.992X5-1.291X6-2.038X7-
3.221X8-4.050X9+12.648X10+8.530X11+
1.592X12+1.760X13+0.106X14
(2)
第Ⅲ類樣品線性判別函數(shù)是:
Y3=-4.974+0.185X1+1.956X2+2.897X3+
0.348X4-3.235X5+0.961X6-0.348X7+
0.297X8+0.347X9-3.112X10-3.673X11-
1.666X12+0.935X13-0.415X14
(3)
第Ⅳ類樣品線性判別函數(shù)是:
Y4=-3.180+0.711X1-0.840X2-0.830X3-
0.307X4+0.927X5-0.568X6+0.588X7-
0.204X8-1.652X9+2.517X10+1.314X11+
0.785X12+1.174X13+2.344X14
(4)
(1)式~(4)式中的Y1~Y4分別為判別函數(shù)的因變量,X1~X14分別為判別函數(shù)的自變量。
表7顯示,100.0%的初始樣品被正確分類,利用判別模型預(yù)測(cè)的樣品類別與實(shí)際樣品類別完全一致,若要檢驗(yàn)其它未知樣品的分類,只需將樣品元素含量輸入各變量中,就能直接在聯(lián)合分布圖上找到與之距離最近的分組質(zhì)心,進(jìn)而完成對(duì)未知樣品的準(zhǔn)確分類。
本實(shí)驗(yàn)中利用X射線熒光光譜儀建立了一種鑒別香煙煙灰成分的方法,能夠?qū)ο銦煙熁覙悠愤M(jìn)行快速無(wú)損檢測(cè)。首先根據(jù)X射線熒光光譜數(shù)據(jù)對(duì)樣品進(jìn)行定性半定量分析初步歸類,而后利用SPSS軟件,采用Ward法對(duì)樣品進(jìn)行更為科學(xué)的聚類, 實(shí)現(xiàn)了對(duì)香煙煙灰樣品的種屬劃分。最后使用回歸分析和判別分析對(duì)聚類結(jié)果進(jìn)行評(píng)價(jià),從而發(fā)現(xiàn)各元素與聚類分析產(chǎn)生的類別具有很強(qiáng)的擬合關(guān)系,再借助判別分析確定各類樣品之間質(zhì)心完全分離開(kāi)來(lái),判別情況良好,印證了系統(tǒng)聚類結(jié)果是準(zhǔn)確可靠的。同時(shí)建立了判別函數(shù)模型,借助Fisher函數(shù)進(jìn)行回判,得出的分類結(jié)果其歸類正確率為100%。利用該方法對(duì)現(xiàn)場(chǎng)提取到的未知香煙煙灰物證,可通過(guò)該判別模型進(jìn)行快速分類,從而提高煙灰物證的檢驗(yàn)效率,為偵查提供幫助。