王 東,張建功,湯澄清
(中國刑事警察學(xué)院,遼寧 沈陽 110854)
足跡是犯罪現(xiàn)場出現(xiàn)率和提取率都比較高的痕跡物證[1],是進行人身同一認定的重要證據(jù)之一,在物證技術(shù)與偵查破案中具有不可替代的作用和意義。因此,通過選取足跡進行性別分析更具有統(tǒng)計學(xué)意義的特征,針對犯罪現(xiàn)場遺留足跡的性別進行研究是非常必要的。
在相關(guān)方面研究中,Jaydip Sen 等[2]使用足部指數(shù)(Foot Index)作為性別預(yù)測特征,提出了針對北孟加拉邦人群預(yù)測性別的方法,結(jié)合足長、足寬,使用多元回歸模型取得了最高84%的性別預(yù)測準確率。Jubilant Kwame Abledu 等[3]嘗試驗證足跡特征在加納人群中性別預(yù)測的可靠性,提出了采用足跡長度特征進行性別預(yù)測的方法,從足跡中提取7 個長度特征,包括每個腳趾前點到后跟中點長度、足跖寬度和足跟寬度,使用判別函數(shù)分析,性別預(yù)測準確率為69.8%~80.3%。姬瑞軍等[4]使用足跡長、足跡掌寬和足跡跟寬作為性別預(yù)測特征,通過Logistic 線性回歸建立左足、右足的性別預(yù)測模型,分別取得了左足88.8%和右足90.0%的預(yù)測準確率。
本文將成年人腳型性別差異應(yīng)用在足跡檢驗領(lǐng)域,選取足跡的第一跖足長、第五跖足長、內(nèi)足弓長、外足弓長、足弓輪廓內(nèi)凹最深點垂直足跟長、足跖寬以及足跟寬共7 個幾何特征,利用多元統(tǒng)計分析方法,通過SPSS 軟件建立Fisher 判別函數(shù)模型,從量化特征方面入手解決公安領(lǐng)域足跡分析性別的難題。
本實驗隨機選取中國刑事警察學(xué)院的400 名本科生,年齡在18~22 歲之間,其中男性和女性各200 名,所有參與者均無足部病史。
參與者清潔雙腳后,使用最小的壓力將足底踩在油墨墊上,然后將沾有油墨的腳轉(zhuǎn)移到平坦A4紙上,直立且雙腳稍微分開,分別收集左足、右足清晰的油墨捺印足跡。
2.1.1 選取足跡特征
洪友廉等[5]采用三維視頻解析和人工測量的方法,測量人體腳型共25 個指標,從能反映出足跡特征的長度變量上來看,結(jié)果顯示男性和女性在內(nèi)足背長、外足背長、足寬和后跟寬方面有明顯的性別差異。李育奇等[6]利用三維足型掃描儀采集足弓數(shù)據(jù),結(jié)果指出,不同性別在足弓長、足弓輪廓內(nèi)凹位置、足弓高、舟狀骨位置比例有顯著差異。根據(jù)以上腳型性別差異研究,結(jié)合足跡檢驗技術(shù),本文選取出足跡上用于分析性別的7 個幾何特征:第一跖足長FL1、第五跖足長FL2、足弓輪廓內(nèi)凹最深點垂直足跟長FL3、內(nèi)足弓長AL1、外足弓長AL2、足跖寬FB 以及足跟寬FHB。
2.1.2 測量足跡特征
結(jié)合Krishan[7]和史力民等[8]的方法,確定足跡中心線和垂直于足跡中心線的后跟切線為測量基線。采用傳統(tǒng)方法對實驗捺印的赤足油墨足跡進行測量,為了便于統(tǒng)計分析,規(guī)定左足幾何特征測量值 以LFL1、LFL2、LFL3、LAL1、LAL2、LFB、LFHB 命名,同理右足幾何特征測量值以RFL1、RFL2、RFL3、RAL1、RAL2、RFB、RFHB 命名。足跡特征測量方式見圖1。將所有數(shù)據(jù)輸入到Excel表格中,方便后期對數(shù)據(jù)進行處理。
圖1 足跡特征測量
本實驗使用SPSS 25.0 軟件進行分析。使用配對樣本T 檢驗比較左足、右足足跡特征間是否存在顯著性差異,是否需要建立左足、右足不同的性別預(yù)測函數(shù);再通過組平均值同等檢驗,考察特征對判別模型的貢獻程度;考慮Person 相關(guān)性,檢驗變量特征間是否存在多重共線性;用Fisher 判別分析建立判別函數(shù)模型,最后采用自身驗證法對樣本數(shù)據(jù)進行檢驗,考察判別函數(shù)模型的性別預(yù)測能力。
判別分析(Discriminant Analysis,DA)又稱分辨法,是在分類確定的條件下,根據(jù)某一研究對象的各種特征值判別其類型歸屬問題的一種多變量統(tǒng)計方法。在農(nóng)業(yè)、醫(yī)學(xué)以及金融問題中有著廣泛的應(yīng)用。
Fisher 判別分析是對數(shù)據(jù)降維處理的一種判別分析方法。核心思想是將N 維空間中的點投影到低維空間中,在低維空間中設(shè)法找出一個最合適的投影方向,使得在該方向上樣本的投影能盡量分開,同類樣本盡可能地緊湊,異類樣本盡可能地分散,F(xiàn)isher 判別分析原理示意見圖2。
圖2 Fisher 判別分析原理示意圖
為了比較左足、右足間變量是否存在顯著性差異,是否需要分別建立左足、右足性別判別函數(shù),需要對14 個測量值分成7 組進行配對樣本T 檢驗。表1 為配對樣本T 檢驗結(jié)果。由表1 可知,在第一跖足長FL1、內(nèi)足弓長AL1 和足跖寬FB 上,男性和女性均是左足更大;而在第五跖足長FL2 和足弓輪廓內(nèi)凹最深點垂直足跟長FL3 上,無論男性還是女性均是右足更大;但是在外足弓長AL2 上,男性的左足比右足更小,而女性的右足比左足更?。幌喾吹?,在足跟寬FHB 上,男性的左足比右足更大,而女性的右足比左足更大。在顯著性水平α=0.05的水平上,在男性中,F(xiàn)L1、FL2、AL2、FB 在左足、右足上有顯著差異,而其他測量值差異均不顯著;在女性中,F(xiàn)L2、RFHB 在左足、右足上有顯著差異,其他測量值P 值均大于0.05 并不顯著。因此,不需要分別建立用于性別預(yù)測的左足、右足的Fisher 判別函數(shù)模型,以下分析結(jié)果均以右足特征為例進行說明。
表1 配對樣品T 檢驗結(jié)果
為了實現(xiàn)對未知樣本的預(yù)測,在構(gòu)建Fisher 判別模型前,使用組平均值同等檢驗,考察變量對判別模型的貢獻程度。顯著性(Sig)和威爾克Lambda(Wilks’Lambda)是評價分組變量的標準。如果Sig 值較小(Sig<0.05),則表明組間差異較為顯著;如果Sig 值較大(Sig>0.05),則表示組間差異不顯著。組內(nèi)平方和與總平方和的比值為威爾克Lambda,其值的范圍在0~1 之間,值越小,表示組內(nèi)有很大差異;值接近1,表示沒有組內(nèi)差異。
表2 為變量間組平均值的同等檢驗。
表2 變量間組平均值的同等檢驗
從表2 中可以看出,7 個變量的威爾克Lambda值在0.33~0.75 之間,表示這些變量組內(nèi)差異很大,對判別模型影響顯著;顯著性(Sig)值均為0,也可以表明這些變量對判別模型影響的顯著性極高,通過這些變量能很好地解釋各樣本的分類。因此,使用這些變量來構(gòu)建的Fisher 判別模型能更準確地預(yù)測未知樣本的性別。
嚴格意義上來說,當相關(guān)性系數(shù)大于0.8,就表明變量間存在多重共線性,而多重共線性會對Fisher 判別分析產(chǎn)生一定的影響。
表3 為變量間的相關(guān)性。從表3 中可以看到,在變量間第一跖足長FL1 與第五跖足長FL2 和內(nèi)足弓長AL1 的相關(guān)性系數(shù)為0.934 和0.924,第五跖足長FL2 與內(nèi)足弓長AL1 和外足弓長AL2 的相關(guān)性系數(shù)為0.860 和0.866,可以認為變量FL1 與FL2和AL1 之間、FL2 與AL1 和AL2 之間均存在多重共線性。其余變量之間的相關(guān)性系數(shù)均小于0.8,因此其他變量間不存在多重共線性。
表3 變量間的相關(guān)性
本文研究目的在于通過Fisher 判別分析建立函數(shù)模型來預(yù)測未知樣本性別,最終在于判別模型的預(yù)測能力高低。雖然多重共線性導(dǎo)致系數(shù)估計方差變大,但是預(yù)測能力不會降低,且相關(guān)性系數(shù)并沒有達到完全相關(guān)(即相關(guān)性系數(shù)等于1),因此可以使用上述7 個幾何特征作為變量來構(gòu)建Fisher 判別模型。
3.4.1 典則判別函數(shù)
表4 為典則判別函數(shù)系數(shù)。
表4 變量間的相關(guān)性
從表4 的典則判別函數(shù)系數(shù)可知,典則判別函數(shù)為
表5 和表6 是典則判別函數(shù)摘要,從中可知,典則判別函數(shù)Y1的特征值為2.608,典型相關(guān)系數(shù)為0.85,特征值分析中方差百分比為100%,表明該函數(shù)能完全解釋已知樣本的性別信息。威爾克Lambda 值為0.277,顯著性(Sig)值為0 小于0.05,可以推斷出該判別函數(shù)具有統(tǒng)計學(xué)意義,可以顯著區(qū)分樣本的性別。
表5 典則判別函數(shù)特征值
表6 典則判別函數(shù)顯著性檢驗結(jié)果
表7 為男性和女性的組質(zhì)心坐標,男性的組質(zhì)心坐標為1.611,女性的組質(zhì)心坐標為-1.611。通過典則判別函數(shù)預(yù)測樣本性別時,將樣本數(shù)據(jù)輸入典則判別函數(shù)中,得到的函數(shù)坐標離男性的組質(zhì)心坐標更近,表示樣本的性別為男性;同理,離女性的組質(zhì)心坐標更近,表示樣本的性別為女性。
表7 男性和女性的組質(zhì)心坐標
3.4.2 Fisher 線性判別函數(shù)
不同于典則判別函數(shù)需要代入樣本數(shù)據(jù)求出樣本坐標后比較與兩質(zhì)心間的距離來預(yù)測性別,F(xiàn)isher 線性判別函數(shù)針對各類別都有一個函數(shù),進行判別時將樣本數(shù)據(jù)輸入到各個函數(shù)模型中,比較函數(shù)值大小,樣本的類別對應(yīng)函數(shù)值最大的判別函數(shù)。表8 為Fisher 線性判別函數(shù)系數(shù)。
表8 Fisher 線性判別函數(shù)系數(shù)
由表8 可知,男性的Fisher 線性判別函數(shù)為
女性的Fisher 線性判別函數(shù)為
將樣本數(shù)據(jù)中對應(yīng)的特征變量輸入到兩個函數(shù)模型中,比較函數(shù)值大小,如果男性的函數(shù)值更大,說明樣本的性別為男性;反之,樣本的性別就是女性。
采用自身驗證法,對Fisher 線性判別函數(shù)進行檢驗,考察其判別效果,最終的性別預(yù)測正確率為92.3%。判別分析結(jié)果見表9。
表9 判別分析結(jié)果單位:名
本研究結(jié)合了腳型性別差異相關(guān)方面的研究,從幾何特征的角度入手,選取了第一跖足長FL1、第五跖足長FL2、足弓輪廓內(nèi)凹最深點垂直足跟長FL3、內(nèi)足弓長AL1、外足弓長AL2、足跖寬FB 以及足跟寬FHB 共7 個在性別分析上具有統(tǒng)計學(xué)意義的特征。采用Fisher 判別分析,建立了一種通過函數(shù)預(yù)測性別的方法。
本實驗結(jié)果中,性別預(yù)測準確率達到90%以上,與傳統(tǒng)利用足跡進行性別分析相比較,在一定程度上提高了足跡預(yù)測性別的準確性。將其他跟足型、足跡有關(guān)的研究與足跡檢驗領(lǐng)域相結(jié)合,豐富了利用足跡進行性別預(yù)測的方法。在辦案實踐中,可以根據(jù)現(xiàn)場足跡,利用上述建立的Fisher 判別模型來預(yù)測犯罪嫌疑人的性別,為技術(shù)偵查辦案提供幫助。