王帥帥
(中國刑警學(xué)院,遼寧 沈陽 110035)
傳統(tǒng)筆跡檢驗(yàn)主要依靠專家經(jīng)驗(yàn)來完成,在證明力方面收到一定質(zhì)疑,如何提高筆跡檢驗(yàn)鑒定的客觀性和科學(xué)性也是筆跡檢驗(yàn)領(lǐng)域現(xiàn)階段亟需解決的難題。目前,DNA 鑒定技術(shù)已經(jīng)可以較好地使用概率表達(dá)其檢驗(yàn)鑒定的可信度,在筆跡量化檢驗(yàn)鑒定中,筆跡特征出現(xiàn)率的量化一直以來都是人們的關(guān)注重點(diǎn)。本文借助計(jì)算機(jī)軟件和數(shù)理統(tǒng)計(jì)學(xué)相關(guān)方法,通過小樣本實(shí)驗(yàn),在客觀精確測(cè)量獨(dú)體字筆畫搭配特征數(shù)據(jù)的基礎(chǔ)上對(duì)相關(guān)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,制定出對(duì)應(yīng)的出現(xiàn)率量化方法。
獨(dú)體字是以筆畫為直接單位構(gòu)成的漢字。獨(dú)體字的搭配位置關(guān)系主要是筆畫交接部位和相鄰筆畫間的高低、遠(yuǎn)近關(guān)系。根據(jù)漢字中筆畫之間的位置關(guān)系,將獨(dú)體字的搭配位置關(guān)系分為以下三種:離散關(guān)系,交叉關(guān)系,連接關(guān)系。
正態(tài)性檢驗(yàn)是對(duì)判斷一個(gè)總體是否符合正態(tài)分布進(jìn)行假設(shè)檢驗(yàn),是一類特殊的擬合優(yōu)度假設(shè)檢驗(yàn)。進(jìn)行正態(tài)假設(shè)檢的方法很多,一般根據(jù)檢驗(yàn)總體的分布特性和數(shù)據(jù)量來選擇最佳的檢驗(yàn)方法,本實(shí)驗(yàn)研究最佳的正態(tài)性檢驗(yàn)方法k-s檢驗(yàn),可借助SPSS軟件進(jìn)行檢驗(yàn)。當(dāng)檢驗(yàn)結(jié)果的顯著性值大于0.05時(shí),即符合正態(tài)分布。
如果將一組數(shù)據(jù)從小到大排序,并計(jì)算相應(yīng)的累計(jì)百分位,則某一百分位所對(duì)應(yīng)數(shù)據(jù)的值就稱為這一百分位的百分位數(shù)??杀硎緸椋阂唤Mn個(gè)觀測(cè)值按數(shù)值大小排列。處于p%位置的值稱為第p百分位數(shù)。在對(duì)數(shù)據(jù)進(jìn)行處理時(shí),先進(jìn)行正態(tài)性檢驗(yàn),如果符合正態(tài)分布,則使用置信區(qū)間的方式獲得特征出現(xiàn)率分布;若不符合正態(tài)分布,則使用百分位法,獲得特征出現(xiàn)率分布區(qū)間。
以常用漢字為研究對(duì)象,為保證實(shí)驗(yàn)樣本的真實(shí)性,設(shè)計(jì)50個(gè)常用漢字為實(shí)驗(yàn)樣本。組織90人為樣本收集對(duì)象在標(biāo)準(zhǔn)A4打印紙上書寫實(shí)驗(yàn)樣本,樣本的書寫一律使用中性筆坐姿書寫,并以紙張為襯墊物,正常速度書寫。
3.2.1 實(shí)驗(yàn)對(duì)象的選擇
根據(jù)獨(dú)體字的搭配特征類型,在樣本常用漢字中對(duì)每個(gè)搭配類型選取具有代表性的單字作為實(shí)驗(yàn)數(shù)據(jù)提取和出現(xiàn)率統(tǒng)計(jì)分析的對(duì)象。離散關(guān)系選擇“二”和“三”為實(shí)驗(yàn)對(duì)象,交叉關(guān)系選擇”十“字為實(shí)驗(yàn)對(duì)象,連接關(guān)系中“T”形關(guān)系以“下”為研究對(duì)象,“┣”形關(guān)系以“正”為研究對(duì)象,折線連接以“廠”為研究對(duì)象。
3.2.2 具體特征數(shù)據(jù)的提取
3.2.2.1 離散關(guān)系搭配特征數(shù)據(jù)的提取
離散關(guān)系的搭配特征主要表現(xiàn)在筆畫之間空間距離的遠(yuǎn)近。本實(shí)驗(yàn)研究中選擇“二”和“三”作為研究對(duì)象,“二”字需測(cè)量兩橫之間距離,如圖1所示;“三”字需分別測(cè)量相鄰兩橫筆之間的距離,如圖2所示。
3.2.2.2 交叉關(guān)系搭配特征數(shù)據(jù)的提取
交叉關(guān)系搭配特征,需要對(duì)筆畫中交叉點(diǎn)搭配位置進(jìn)行研究,測(cè)量交叉點(diǎn)兩側(cè)筆畫的長度,以其比值為數(shù)據(jù)。本實(shí)驗(yàn)以“十”字為研究對(duì)象,如圖3所示。
圖1 “二”字搭配特征
圖2 “二”字搭配特征
圖3 “十”字搭配特征
3.2.2.3 連接關(guān)系搭配特征數(shù)據(jù)的提取
連接關(guān)系搭配特征有“T”形連接、“┣”形連接和折線連接三種,“T”形連接和"┣"形連接特征數(shù)據(jù)的提取方式和交叉關(guān)系相似。由于折線連接在書寫時(shí)常被寫成“T”形連接或“┣”形連接,或者離散關(guān)系搭配的情況,需要對(duì)三種情況分別進(jìn)行統(tǒng)計(jì)分析。如圖4和圖5所示。
圖4 “廠”字搭配特征
圖5 “廠”字折線連接筆畫的離散特征
使用SPSS軟件對(duì)獲取的實(shí)驗(yàn)數(shù)據(jù)進(jìn)行正態(tài)性檢驗(yàn),對(duì)符合正態(tài)分布的特征通過計(jì)算置信區(qū)間來獲得出現(xiàn)率,本實(shí)驗(yàn)分別計(jì)算95%和80%置信區(qū)間;對(duì)于不符合正態(tài)分布的特征使用百分位法計(jì)算概率分布區(qū)間,本文計(jì)算80%的概率分布區(qū)間。
3.3.1 離散關(guān)系搭配特征實(shí)驗(yàn)結(jié)果
對(duì)于“二”字,以兩橫之間距離為統(tǒng)計(jì)量進(jìn)行分析;對(duì)于“三”字以第一、二橫筆間距與第二、三橫筆間距的比值為統(tǒng)計(jì)量。正態(tài)性檢驗(yàn)結(jié)果如表1和圖6、圖7。
表1 離散關(guān)系特征單樣本k-s檢驗(yàn)結(jié)果
圖7 “三”字搭配特征
通過實(shí)驗(yàn)結(jié)果可以看出,"二"字離散關(guān)系搭配特征檢驗(yàn)結(jié)果顯著性水平P=0.2>0.05,樣本總體符合均值為1.79,標(biāo)準(zhǔn)差為0.46的正態(tài)分布,兩橫間距離的95%置信區(qū)間為(0.89,2.69),80%置信區(qū)間為(1.20,2.38);“三”字離散關(guān)系搭配特征檢驗(yàn)結(jié)果顯著性水平P=0.2>0.05,樣本總體符合均值為0.89,標(biāo)準(zhǔn)差為0.22的正態(tài)分布,第一、二橫距離與第二、三橫距離比值的95%置信區(qū)間為(0.46,1.32),80%置信區(qū)間為(0.61,1.17)。
3.3.2 交叉關(guān)系搭配特征實(shí)驗(yàn)結(jié)果
“十”字交叉點(diǎn)在橫筆和豎筆上的位置形成不同的搭配關(guān)系。對(duì)橫筆來說,以交叉點(diǎn)左部與右部比值為統(tǒng)計(jì)量更具規(guī)律性;對(duì)豎筆來說以下部與上部比值為統(tǒng)計(jì)量更具規(guī)律性。分別以此為統(tǒng)計(jì)量。具體實(shí)驗(yàn)見表3和圖8、圖9。
表2 交叉關(guān)系特征單樣本k-s檢驗(yàn)結(jié)果
圖9 “十”字豎筆搭配特征
通過實(shí)驗(yàn)結(jié)果可以看出,“十”字交叉關(guān)系搭配特征顯著性水平P=0.200>0.05,總體數(shù)據(jù)分布符合均值為1.52,標(biāo)準(zhǔn)差為0.44的正態(tài)分布,搭配特征的95%置信區(qū)間為(0.66,2.38),80%置信區(qū)間為(0.96,2.08);“十”字交叉關(guān)系搭配特征顯著性水平P=0.001<0.05,樣本總體不符合正態(tài)分布,根據(jù)SPSS輸出百分位結(jié)果看出,第10百分位點(diǎn)為1.21,第90百分位數(shù)為3.96,80%概率區(qū)間為(1.21,3.96)。
3.3.3 連接關(guān)系搭配特征實(shí)驗(yàn)結(jié)果
連接關(guān)系有三種,“T”形連接以“下”字為研究對(duì)象,存在交叉點(diǎn)左部與右部比值以及右部與左部比值兩種統(tǒng)計(jì)量;“┣”形連接以“正”字為研究對(duì)象,具體內(nèi)容為“正”字第二筆與第三筆的搭配特征,存在上部與下部比值以及下部與上部比值兩種統(tǒng)計(jì)量;折線連接首先分別統(tǒng)計(jì)離散形式、規(guī)范折線連接和“T”形連接或“┣”形連接的比例,再對(duì)“T”形連接或“┣”形連接的情況進(jìn)行正態(tài)檢驗(yàn)。以“廠”字為研究對(duì)象則先分別統(tǒng)計(jì)離散形式、規(guī)范折線連接和“T”形連接的出現(xiàn)率,再單獨(dú)對(duì)“T”形連接情況進(jìn)行正態(tài)假設(shè)檢驗(yàn)。經(jīng)實(shí)驗(yàn)對(duì)比發(fā)現(xiàn),“T”形連接以左部和右部比值為統(tǒng)計(jì)量更具有規(guī)律性;“┣”形連接以上部和下部比值為統(tǒng)計(jì)量更具規(guī)律性;折線連接關(guān)系中的“T”形連接形式的右部和左部比值更具有規(guī)律性。具體實(shí)驗(yàn)結(jié)果見表3和圖10、圖11、圖12。
表3 連接關(guān)系特征單樣本k-s檢驗(yàn)結(jié)果
圖10 “下”字搭配特征
圖11 “正”字搭配特征
通過實(shí)驗(yàn)結(jié)果可以看出,"下"字搭配特征顯著性水平P=0.000<0.05,樣本總體不符合正態(tài)分布,根據(jù)SPSS輸出百分位結(jié)果看出,第10百分位點(diǎn)為1.21,第90百分位數(shù)為3.96,80%概率區(qū)間為(0.42,2.71);“正”字搭配特征顯著性水平P=0.2>0.05,樣本總體符合均值為1.32,標(biāo)準(zhǔn)差為0.47的正態(tài)分布,搭配特征的95%置信區(qū)間為(0.39,2.23),80%置信區(qū)間為(0.71,1.91)。
圖12 “廠”字搭配特征
“廠”字統(tǒng)計(jì)結(jié)果顯示:在88份總樣本中,規(guī)范連接的出現(xiàn)24次,出現(xiàn)率為27.7%;離散連接的出現(xiàn)20次,出現(xiàn)率為22.3%;“T”形連接的出現(xiàn)44次,出現(xiàn)率為50.00%;還出現(xiàn)了1次及特殊的“十”字交叉連接,出現(xiàn)率為1.14%。對(duì)“T”形連接搭配方式中,顯著性水平P=0.200P>0.05,樣本總體符合均值為2.26,標(biāo)準(zhǔn)差為1.08的正態(tài)分布,搭配特征的95%置信區(qū)間為(0.14,4.38),80%置信區(qū)間為(0.88,3.64)。
本實(shí)驗(yàn)研究中統(tǒng)計(jì)的獨(dú)體字三種搭配類型中,共產(chǎn)生7組數(shù)據(jù),其中5組數(shù)據(jù)正態(tài)性檢驗(yàn)結(jié)果符合正態(tài)分布。另外兩組數(shù)據(jù)雖然正態(tài)性檢驗(yàn)不符合正態(tài)分布,但從數(shù)據(jù)分布直方圖可以看出,數(shù)據(jù)分布都集中在較小的區(qū)間內(nèi),使用百分位法可以劃分出具有一定特殊性的搭配類型。本文在客觀測(cè)量獨(dú)體字搭配特征數(shù)據(jù)的基礎(chǔ)上,對(duì)獨(dú)體字各種類型的搭配形式實(shí)現(xiàn)了特征出現(xiàn)率的量化,區(qū)分出了每種特征類型中出現(xiàn)率較低的特征形式,在筆跡檢驗(yàn)中對(duì)特征價(jià)值的認(rèn)識(shí)具有很高的參考意義,也為筆跡量化檢驗(yàn)鑒定的發(fā)展起到了推動(dòng)作用。