孫振玉,張帆,張飛霞,羅蓉,毛遠毅,胡澤卿,顧艷
(1.四川大學華西基礎(chǔ)醫(yī)學與法醫(yī)學院,四川 成都 610041;2.成都市公安局刑警支隊,四川 成都 610000)
自1980年測謊技術(shù)引入我國以來,已經(jīng)在案件偵查、反腐、保密篩查等領(lǐng)域得到了廣泛應(yīng)用。準繩問題測試[1](Control Question Test,CQT)是根據(jù)測試中受試者在回答準繩問題和相關(guān)問題時對應(yīng)的生理指標的變化,判斷其在回答相關(guān)問題時是否說謊,以達到識別犯罪、排除無辜的法律目的。但CQT的測謊準確率一直都是學術(shù)界和法律實務(wù)部門爭論的焦點。
CQT測謊的準確率受到測試過程中許多因素的影響,既往對測試準確率的影響因素研究沒有在實際案例中得到驗證[2]。部分研究者[3]研究了民事欺詐和刑事詐騙案件中的測謊準確率,但樣本量僅有27例和41例,很難反映不同種類刑事案件中CQT測謊準確率的差異。
目前,對實際案例的測謊準確率研究存在“金標準”和“銀標準”兩種研究方法[4]?!敖饦藴省笔欠ㄔ簩τ诎讣膶徖砼袥Q結(jié)論。MANGAN等[5]以受試者口供代替判決結(jié)論作為印證測謊結(jié)果的標準進行準確率的研究,而HONTS等[6]指出由于嫌疑人的口供主觀性較強,明顯存在印證依據(jù)的缺陷。“銀標準”是以色列學者AVITAL GIONTON創(chuàng)造出的一種非標準化的測謊準確率研究策略?!般y標準”僅在對案件的案情特點和證據(jù)材料的要求上與“金標準”存在部分差異[7-8]。
本研究以真實的刑事案件為基礎(chǔ)進行回顧性研究,用辦案單位的偵查結(jié)果印證測謊結(jié)論,在極為貼近“金標準”的情況下計算CQT法的準確率,在符合“金標準”條件的真實案例中分析不同受教育程度的受試者之間、不同違法類型的受試者之間的CQT測謊準確率是否存在差異。對兩組數(shù)據(jù)進行整合,在最大程度上利用能夠利用的案例,計算出CQT在刑事案件測試中的準確率。
2006—2016年在成都市公安局心理測試中心進行心理測試的刑事案件。
納入標準:(1)經(jīng)偵查確證案情屬實。(2)受試者自愿接受測試。(3)受試者生理狀態(tài)正常且無精神疾病或高血壓、心臟病等可能影響測試指標的疾病。(4)受試者人口學資料完整。(5)現(xiàn)有證據(jù)材料能夠證明測試所涉情節(jié),確定對每個受試者測試結(jié)論的正確與否;或能夠證明案件只存在兩個在測試所涉情節(jié)的供述完全相反的嫌疑人,且其中必有一人作案。(6)涉案人員均接受了CQT,測試圖譜波形清晰穩(wěn)定、測試結(jié)論明確。
按照納入標準,共篩選出57起案件的104名受試者。對本次納入的案例按受教育程度分為受教育程度≤6年(小學及其以下)、>6~9年(小學以上,初中及其以下)、>9年(初中以上)3組。
對本次納入的案例按違法類型分為暴力違法組和非暴力違法組。暴力違法組55人,主要涉及殺人、故意傷害、強奸、搶劫等存在暴力手段的案件。非暴力違法組49人,主要涉及盜竊、詐騙、職務(wù)侵占、行賄等無暴力手段存在的案件。
按參考文獻[7]的研究方法選擇4位測試經(jīng)驗豐富的測試人員對本研究中的受試者進行測試。其中1號測試人員為男性,偵查專業(yè),從事測謊工作18年;2號測試人員為女性,偵查專業(yè),從事測謊工作11年;3號測試人員為男性,醫(yī)學專業(yè),從事測謊工作6年;4號測試人員為女性,心理學專業(yè),從事測謊工作9年。4位測試人員的評分者間信度在0.8以上。
使用DataPac_USBTM數(shù)據(jù)獲取系統(tǒng)(加拿大Limestone Technology公司)采集受試者的各項生理指標:呼吸(呼吸暫停、呼吸頻率變化、呼吸強度變化)、皮膚電(強度變化、持續(xù)時間)、血壓。所采用的編題方法為CQT。
測試過程如下:
(1)測試人員熟悉案情,根據(jù)偵查需要確定測試要點(作案手段、作案工具、作案地點等)。
(2)進行測前談話(包括了解受試者的基本信息,征得受試者的同意,向受試者介紹測試的原理),編制測試問題。
(3)在測試過程中采集皮膚電、胸式呼吸、腹式呼吸、血壓變化,得到測試圖譜。每個受試者均重復(fù)3次測試,每一次測試得到一張圖譜。
(4)對圖譜評分,得出測試結(jié)論。如果受試者在回答準繩問題時的生理指標比在回答相關(guān)問題時反應(yīng)更強烈,得正分,表示誠實;如果在回答相關(guān)問題時比準繩問題反應(yīng)更強烈,得負分,表示撒謊。如果準繩問題和相關(guān)問題之間具有非常顯著的差異,那么評分為±2;如果二者之間具有較大的差異,評分為±1;如果二者之間沒有明顯差異,評分為0[4]。根據(jù)KIRCHER等[9]評分規(guī)則,對3次測試圖譜的評分求和,總分大于+6分表示誠實,總分小于-6分表示撒謊,總分介于+6分和-6分之間表示無法得出結(jié)論。
(5)用偵查結(jié)論對測試結(jié)論進行印證,結(jié)論分為四種。真陽性:偵查結(jié)論證實嫌疑人實施違法,測試結(jié)論也表明嫌疑人實施違法,表示能夠準確識別違法;假陰性:偵查結(jié)論證實嫌疑人實施違法,測試結(jié)論表明嫌疑人未實施違法,表示未能準確識別違法;真陰性:偵查結(jié)論證實嫌疑人未實施違法,測試結(jié)論也表明嫌疑人未實施違法,表示能夠準確排除無辜;假陽性:偵查結(jié)論證實嫌疑人未實施違法,測試結(jié)論表明嫌疑人實施違法,表示未能夠準確排除無辜。
MAO等[7]的研究中,涉及148起案件的296名受試者,其案件來源、測試人員、測試方法均與本次研究中使用的“金標準”一致,僅存在案情中涉案人數(shù)與證據(jù)材料的差異。MAO等[7]的研究結(jié)果僅得到了測謊準確率,并未計算出每種測試結(jié)論所對應(yīng)的樣本數(shù)。本研究通過樣本量與準確率計算出MAO等[7]研究中每種測試結(jié)論(真陽性、假陰性、真陰性、假陽性)對應(yīng)的樣本數(shù),并與本研究中每種測試結(jié)論的樣本數(shù)相加,在兩種條件下樣本量求和的范圍中計算CQT測謊的準確率。
對受試者人口學資料中的年齡、受教育程度采用中位數(shù)、均值、標準差進行描述,對性別采用百分比進行描述。不同受教育程度的3組間受試者年齡比較采用方差分析,組間測謊準確率的比較采用χ2檢驗。不同違法類型的2組間受試者年齡比較采用獨立樣本t檢驗,組間測謊準確率的比較采用χ2檢驗。對整合后的測謊真陽性率和真陰性率的比較采用χ2檢驗。檢驗水準α=0.05。
本次納入的樣本中,男性88名(84.62%),女性16名(15.38%);年齡為16~64歲,年齡中位數(shù)為33歲,平均年齡為(33.96±11.05)歲;受教育年數(shù)為0~19年,受教育年數(shù)中位數(shù)為9年,平均受教育年數(shù)為(8.20±4.02)年。
MAO等[7]的研究中,男性257名(86.82%),女性39名(13.18%);年齡為16~65歲,年齡中位數(shù)為31歲,平均年齡為(32.10±10.52)歲;受教育年數(shù)為1~16年,受教育年數(shù)中位數(shù)為9年,平均受教育年數(shù)為(8.16±3.01)歲。
對不同受教育程度組之間、不同違法類型組之間的一般情況進行統(tǒng)計學分析,表明其性別、年齡分布及違法構(gòu)成差異無統(tǒng)計學意義。
用偵查結(jié)論印證104名涉及刑事案件的受試者的CQT測試結(jié)論,其真陽性率為97.73%,假陰性率為2.27%,真陰性率為81.66%,假陽性率為18.33%(表1)。
從表2可以看出,不同受教育程度的受試者之間CQT測謊真陽性率的差異沒有統(tǒng)計學意義(P>0.05),但真陰性率的差異存在統(tǒng)計學意義(P<0.05)。
表1 使用“金標準”作為評判標準的案例測試結(jié)果[例(%)]
表2 按受教育程度分組的CQT準確率[例(%)]
按受試者的違法類型對其識別違法的準確率和排除無辜的準確率進行χ2檢驗,P均>0.05(表3),表明不同違法類型的受試者之間CQT測謊準確率的差異無統(tǒng)計學意義。
表3 按違法類型分組的測謊準確率[例(%)]
MAO等[7]的研究中原來僅計算出了每種測試結(jié)論所對應(yīng)的樣本率,真陽性率、假陰性率、真陰性率、假陽性率分別為83.57%、16.43%、82.20%、17.80%。根據(jù)其樣本總量可以計算出真陽性、假陰性、真陰性、假陽性結(jié)論分別對應(yīng)的樣本量是124、24、122、26。
本研究納入的104名受試者與MAO等[7]的296名受試者案例在性別、年齡分布、受教育程度、違法構(gòu)成方面差異無統(tǒng)計學意義。表4顯示,分別以“金標準”和“銀標準”計算的CQT測謊的真陽性率之間的差異有統(tǒng)計學意義(P<0.05),而分別以兩種標準計算的CQT測謊的真陰性率之間的差異無統(tǒng)計學意義(P>0.05)。
將“金標準”和“銀標準”的測試數(shù)據(jù)整合后,得到CQT測謊準確率(表5):真陽性率為87.00%,假陰性率為13.00%,真陰性率為82.20%,假陽性率為17.80%。對其真陽性率和真陰性率進行χ2檢驗,真陽性率和假陰性率的差異沒有統(tǒng)計學意義(P>0.05)。
表4 “金標準”和“銀標準”CQT測謊準確率的差異[例(%)]
表5 “金標準”和“銀標準”整合后的CQT準確率[例(%)]
既往的研究[10]多未考慮測試者的因素,如果測試者的經(jīng)驗不足,極有可能在測試題目的編制、受試者心理的把握等方面給測試結(jié)論帶來不容忽視的影響。本研究中的4名測試人員具有豐富的測試經(jīng)驗,且具備現(xiàn)場勘驗、預(yù)審等多方面工作的經(jīng)驗,他們的評分者間信度在0.8以上[7],能夠最大程度上避免因測試人員經(jīng)驗不足而對測試結(jié)論帶來的偏倚,為測試結(jié)論的可信度提供了有力的保障。
本研究結(jié)果顯示,刑事案件中CQT測謊識別違法的效能可能不受受試者受教育程度的影響,但其排除無辜的效能卻可能受到受試者受教育程度的影響。在實際案件的測謊過程中,其測謊結(jié)果主要取決于受試者面對相關(guān)問題時的情緒反應(yīng)。真正涉及刑事違法的受試者由于關(guān)于違法過程的記憶深刻,心理現(xiàn)場的穩(wěn)定性高,更加關(guān)注與案件相關(guān)的情節(jié),擔心謊言被揭穿而帶來的刑事懲罰,測謊過程中其情緒反應(yīng)較為明顯[11],所以在測謊過程中更容易被識別。
從研究結(jié)果來看,受教育程度過低,不能準確地理解測前談話中的內(nèi)容,對于測試過程的配合程度不好,可能會因此出現(xiàn)緊張等情緒,導(dǎo)致被誤認為“有罪”。受教育程度過高,雖然對測前談話的內(nèi)容理解到位,且配合程度較好,但其對于測試錯誤結(jié)果的擔心程度更高,在焦慮的情緒支配下,同樣也可能被誤認為“有罪”。在無辜受試者中,文化程度的不同使其對測前談話的理解會存在細微的差異,這些差異會導(dǎo)致在回答與案件相關(guān)問題時,產(chǎn)生緊張、焦慮等情緒反應(yīng)的程度不同,儀器所采集到的生理指標變化的大小也會有差異[12-13],可能會引起測試評分的變化,導(dǎo)致假陽性結(jié)果的出現(xiàn)。
本研究結(jié)果顯示,在刑事案件中,CQT測謊識別違法和排除無辜的效能可能不受測試人員及受試者違法類型的影響。蘇彥捷等[3]以27名刑事欺詐嫌疑人為受試者研究了刑事案件中CQT測謊得出確定結(jié)論的概率為81.5%,其僅從能否得出確定結(jié)論的層面進行了討論,并且與模擬違法、民事欺騙進行比較,認為測試刺激強度越大,有效性越大,但并未對結(jié)果的準確率進行研究。從本研究所涉及案件的違法類型來講,不論是暴力違法,還是非暴力違法,其行為都已觸犯刑法,有可能被判處刑罰。雖然因為違法類型的不同,最終面對的刑罰嚴重程度也不同,但在測試過程中受試者受到相關(guān)問題的刺激均是案件真實情節(jié),并非不同案件所面臨的不同法律后果。測試人員僅依據(jù)受試者對案件情節(jié)的生理指標變化,對其是否撒謊做出定性的判斷[14],結(jié)論不會受到具體案件情節(jié)的影響。所以,我們可以認為在刑事案件中,CQT測謊的真陽性率和假陰性率不會受到受試者違法類型的影響。
以“金標準”計算的CQT測謊的真陽性率高于以“銀標準”計算的CQT測謊的真陽性率,而分別以兩種標準計算的CQT測謊的真陰性率之間則差異無統(tǒng)計學意義。筆者認為,其原因可能為:(1)本研究中以“金標準”計算CQT測謊準確率的樣本量(n=104)與MAO等[7]以“銀標準”計算CQT測謊準確率的樣本量(n=296)存在較大差距,會對準確率的計算結(jié)果造成一定的偏倚。(2)由于“銀標準”納入的案件通過證據(jù)材料即可得出判斷(同一案件的兩個受試者中,必然有一個受試者撒謊,而另一個受試者是誠實的)[15]。測試人員在熟悉案情,并對第一個受試者得出測試結(jié)論之后,容易受到“非此即彼”思維定式的影響,得出與第一次相反的測試結(jié)論。兩個方面的原因都有可能對測試結(jié)論帶來不可忽視的影響。
刑事案件中,將“金標準”和“銀標準”的測試數(shù)據(jù)整合后,計算出的CQT測謊準確率中真陽性率和真陰性率差異無統(tǒng)計學意義,即CQT測謊在刑事案件中識別違法和排除無辜的效能可能不存在明顯差異。但仍然存在較高的假陽性率和假陰性率。相對于依靠經(jīng)驗和直覺判斷謊言的準確程度而言,CQT測謊的真陽性率和真陰性率分別達到87.00%和82.20%,在偵查過程中已經(jīng)能極大地幫助偵查人員提高偵查效率。但不可否認,其仍然存在較高的假陽性率,而且曾經(jīng)確實有過因盲目相信測謊結(jié)論造成錯案的教訓(xùn)[16]。國外研究結(jié)果[17]表明,“金標準”條件下CQT測謊的真陽性率(n=123)和真陰性率(n=117)分別為91.4%和65.8%。筆者認為,出現(xiàn)差異的原因在于國外的研究也包括了一些根據(jù)圖譜評分無法得出準確結(jié)論的案例在內(nèi),而本研究所選取的測謊案例均能根據(jù)測試圖譜得出“陽性”或“陰性”的結(jié)論,而且在樣本量上也有了較大的擴充,且整合了“金標準”和“銀標準”的測試結(jié)果得出的數(shù)據(jù),應(yīng)該更為客觀,也更為準確。
在真實案件的測謊中,無辜受試者往往對案件的情況有一定的了解,或者基于對受害人的關(guān)心或?qū)Π盖榈暮闷娑鴮Π讣株P(guān)注,或者通過道聽途說、新聞媒體等方式對案情有一定了解[18]。因此,在測試過程中由于對案情的了解也有可能被誤認為是“撒謊”。由于個體之間心理素質(zhì)的差異,部分無辜受試者在測謊的過程中即便并不知曉案情,但由于對自己被誤認為是嫌疑人的結(jié)果過于擔心,產(chǎn)生了強烈的焦慮與恐懼情緒,在涉及案件相關(guān)問題時,生理指標也會產(chǎn)生較大的變化[19-21]。這也可能成為測試過程中出現(xiàn)假陽性的原因。
綜合研究結(jié)果,筆者認為,測謊鑒定意見目前僅能在偵查階段為偵查人員提供線索,而不能將測謊鑒定意見作為定案的依據(jù)。在沒有形成完整證據(jù)鏈的情況下,辦案人員不能盲目相信測謊意見,應(yīng)盡量將假陽性結(jié)論對案件的影響降到最低,發(fā)揮測謊技術(shù)能夠有效識別違法的優(yōu)勢,避免因假陽性結(jié)論造成錯案。本研究僅僅是以成都市公安局心理測試中心在測謊實踐中的案件為研究對象,只能反映該單位測試團隊的整體測試水平。以后還可以在更大地域范圍內(nèi)擴大樣本量,更準確地反映測謊技術(shù)在實際應(yīng)用中的準確率,為測謊鑒定意見合法有效地應(yīng)用于司法實踐提供盡可能客觀準確的數(shù)據(jù)支撐。