陳云林 孫力斌 鄭 晶 李英男
(1 證據(jù)科學(xué)教育部重點(diǎn)實(shí)驗(yàn)室(中國政法大學(xué)) 北京 100088;2 浙江迪安鑒定科學(xué)研究院 浙江 杭州 310007;3 天津迪安司法鑒定中心 天津 300381)
多道儀測試(Polygraph)結(jié)果分析中引入Bayes推理(Bayesian Inference)已有很長歷史[1],而且鑒于多道儀的“測謊”效能,不少心理學(xué)教材在談及“推理”部分時,習(xí)慣于將Bayes定理用于對測謊結(jié)果的解讀上,可見多道儀測試和Bayes推理具有的深厚淵源[2-3]。但縱觀教科書的解讀也好、實(shí)踐應(yīng)用也好,似乎總是停留在就數(shù)字解數(shù)字層面,當(dāng)真正需要多道儀測試結(jié)果的運(yùn)用時,有意識的Bayes推理卻似乎消失了,更多的是一些不知所云的懷疑和莫名其妙的質(zhì)問[4]。
Bayes推理成功走上法庭,要特別得益于DNA技術(shù)的出現(xiàn)。由此,Bayes推理過程才開始不讓人感到怪異,因?yàn)镈NA這樣的“鐵證”都需要Bayes定理才能合理解釋,遑論其他。正是受DNA技術(shù)的直接啟發(fā),筆者開始把多道儀測試的結(jié)果采用Bayes推理組織成符合法庭證據(jù)要求的形式,進(jìn)而實(shí)現(xiàn)了國內(nèi)首例多道儀測試結(jié)果刑事審判的證據(jù)采信,由此徹底開創(chuàng)了多道儀測試(又被稱為“心理測試”)結(jié)果的法庭證據(jù)化道路[5]。如果說,多道儀測試結(jié)果的刑事審判證據(jù)化是Bayes推理的“事實(shí)評估”結(jié)果應(yīng)用的話,那么,多道儀測試在對人員日常評估時的應(yīng)用就是“價值評估”結(jié)果。在事實(shí)評估與價值評估的關(guān)系當(dāng)中,Bayes推理無疑扮演著核心角色。而能夠?qū)⑹聦?shí)評估轉(zhuǎn)化為價值評估,亦是多道儀測試功能發(fā)生根本性改變的基礎(chǔ),否則,多道儀也僅僅只能成為一個“工具”而已[6]。
長久以來,多道儀或多或少承擔(dān)著某些部門機(jī)構(gòu)的人員評估職責(zé)。特別是在美國,第二次世界大戰(zhàn)以后,美國國防部、能源部等機(jī)構(gòu)開始了大規(guī)模的多道儀測試人員評估[4]。但是由于缺乏有力的理論邏輯體系支撐,這些評估活動始終飽受爭議,導(dǎo)致形成了使用者明知其效,卻又不知為何有效,而指責(zé)者自認(rèn)有理,卻又不知為何有理的詭異狀態(tài)。若從哲學(xué)層面考量,這是人們墜入“事實(shí)—價值”“二分”困局的必然結(jié)果。由于在犯罪調(diào)查的多道儀測試中,人們更多關(guān)注測試結(jié)果的“事實(shí)”屬性,無所謂“二分”,因此爭執(zhí)不多;而當(dāng)多道儀測試涉足人員評估時,就出現(xiàn)了事實(shí)與價值的齟齬,由此導(dǎo)致形成了“二分”困局。倘若任由事實(shí)與價值“二分”的存在,而不能實(shí)現(xiàn)“事實(shí)”向“價值”的跨越,那么上述之詭異局面必將仍然持續(xù)。
幸有陳曉平在《貝葉斯方法與科學(xué)合理性》對Bayes推理的深刻解讀[7],闡釋了它不僅僅是一個數(shù)學(xué)公式,而是將其深入理解為一種認(rèn)識方法,甚至是世界觀,這為實(shí)現(xiàn)“事實(shí)”向“價值”的跨越提供了可行途徑?;诖?,本研究探討和總結(jié)了如何利用Bayes推理對多道儀測試實(shí)驗(yàn)數(shù)據(jù)進(jìn)行相應(yīng)的處理,進(jìn)而完成了人員評估實(shí)踐中“事實(shí)”向“價值”的跨越,實(shí)現(xiàn)了價值評估的過程。
2.1.1 多道儀
多道儀型號:TH-U(北京同方神火聯(lián)合科技發(fā)展有限公司),主要由主機(jī)、傳感器、計算機(jī)和測試軟件組成。傳感器組成:測量皮膚電反應(yīng)的皮電傳感器;測量脈率的指脈傳感器;測量血壓反應(yīng)的血壓傳感器;測量呼吸反應(yīng)的胸呼傳感器、腹呼傳感器;監(jiān)測動作的動作傳感器。
2.1.2 掛壁式溫濕度計
掛壁式溫濕度計型號:得力(deli)9013(浙江寧波得力有限電子公司)。
2.2.1 受試群體一
某部官兵33名作為被測人自愿接受評估測試。其中,女性1名,年齡31歲;男性32名,平均年齡35.6歲。
所有被測人評估測試前生理狀態(tài)正常、身體狀況良好、無精神疾病或其他不適宜評估測試的疾病。
2.2.2 受試群體二
某機(jī)關(guān)單位職員27名作為被測人自愿接受評估測試,其中,女性1名,年齡25歲;男性26名,平均年齡32.6歲。
所有被測人評估測試前生理狀態(tài)正常、身體狀況良好、無精神疾病或其他不適宜評估測試的疾病。
3.1.1 評估測試結(jié)構(gòu)
采用系統(tǒng)(調(diào)查)測試(Systemic Polygraph Examination for Investigation,SPEI)[8]操作方法實(shí)施測試,評估測試結(jié)構(gòu)圍繞SPEI主題進(jìn)行構(gòu)建,由基本測試和精細(xì)測試兩部分組成。
3.1.2 數(shù)據(jù)處理
用“七分制”對多道儀圖譜數(shù)據(jù)進(jìn)行賦值而得到原始得分(x),再通過賦權(quán)處理對各生理指標(biāo)(皮膚電、呼吸、心電)和測試遍數(shù)賦予相應(yīng)權(quán)重,以此將原始得分轉(zhuǎn)換為加權(quán)得分(λ),并根據(jù)SPEI算式將其轉(zhuǎn)換為相應(yīng)的條件概率(圖譜概率)P(-/L)和P(-/T)。根據(jù)Bayes定理有:
多道儀測試數(shù)據(jù)分析,主要是利用Bayes定理將圖譜概率P(-/L)和P(-/T)轉(zhuǎn)化為P(L/-)和P(T/-)的過程,即將被測人“欺騙”(L)時“陽性”(-)的可能性轉(zhuǎn)化為被測人“陽性”(-)時的“欺騙”(L)的可能性,以及將其“誠實(shí)”(T)時“陽性”(-)的可能性轉(zhuǎn)化為其“陽性”(-)時“誠實(shí)”(T)的可能性(依照多道儀測試的習(xí)慣將“陽性”標(biāo)注為(-)號)。
對于同一名被測人的同一個問題,測試后與測試前的概率變化可通過Bayes因子來體現(xiàn),這種方式能夠較徹底地規(guī)避掉“先驗(yàn)概率”的直接影響[9]。
Bayes因子中的P(-/L)被稱為靈敏度,P(-/T)被稱為假陽性,通過這兩個參數(shù)的變化,可以直接刻畫出技術(shù)方法在已知樣本中的檢出效果。
3.2.1 題目編制
依照國家的法律法規(guī),如《國家公務(wù)員法》《中國共產(chǎn)黨廉潔自律準(zhǔn)則》《中國共產(chǎn)黨紀(jì)律處分條例》《中國共產(chǎn)黨黨內(nèi)監(jiān)督條例》等,結(jié)合各部門的紀(jì)律規(guī)定和崗位職責(zé)要求,對參評群體進(jìn)行評估測試,評估結(jié)果作為政治考核的一個參考依據(jù)予以通報。
測試題目包括無關(guān)問題、中性問題、準(zhǔn)繩問題和相關(guān)問題等,部分題目內(nèi)容如表1所示。題目以組別為單元模塊,每個測試單元模塊只包含一個評估主題。
3.2.2 語境營造
(1)測前談話。正式開始評估測試前,主試人員介紹自己的身份和資質(zhì),說明評估需求、技術(shù)方法原理及注意事項(xiàng)等,并收集被測人個人信息材料,時間為30分鐘。
表1 人員評估測試相關(guān)問題示例
在測前談話的過程中,主試向被測人詳細(xì)解釋每個相關(guān)問題的關(guān)鍵部分并確認(rèn)其正確理解,以保證模塊測試的有效性。例如,關(guān)于“你妄議過黨和國家的民族政策嗎?”這個問題,針對的關(guān)鍵點(diǎn)是不按照法定程序和渠道妄加議論和批評,即“當(dāng)面不說,背后亂說”,而不是出于破壞民族團(tuán)結(jié)的動機(jī)、目的(即便對黨和國家的民族政策有不同的意見,甚至有激烈的批評,只要通過法定程序和渠道向黨的上級組織反映,就不屬于妄議行為)。
主試與被測人探討測試題目內(nèi)容,根據(jù)被測人的理解和領(lǐng)會能力對測試題目內(nèi)容進(jìn)行調(diào)整。
(2)簽署《自愿評估測試書》?!蹲栽冈u估測試書》包含被測人基本情況、接受評估測試的原因、對評估測試的了解、對評估測試結(jié)果發(fā)布范圍的認(rèn)可、被測人本人的確認(rèn)簽字等。
3.2.3 評估環(huán)境
評估測試需要在一個整潔、安靜、光線、溫濕度適宜、通風(fēng)良好的相對封閉空間內(nèi)進(jìn)行。
3.2.4 數(shù)據(jù)采集
數(shù)據(jù)采集前主試需要對多道儀進(jìn)行靈敏度檢查和校驗(yàn)。主試為被測人按照一定的順序佩戴傳感器。待佩戴完成、確保信號傳輸穩(wěn)定正常后,開始進(jìn)行適應(yīng)性測試(刺激測試),主要監(jiān)測被測人的基本生理反應(yīng)狀況。
通過適應(yīng)性測試的被測人可進(jìn)行正式數(shù)據(jù)采集。采集過程中,主試向被測人呈現(xiàn)的言語刺激要清晰、準(zhǔn)確,保證被測人聽清聽懂,與此同時用多道儀采集記錄被測人的呼吸、皮電、指脈等生理指標(biāo)變化?!按碳ぁ磻?yīng)”數(shù)據(jù)重復(fù)采集3次,每次采集結(jié)束都要對數(shù)據(jù)進(jìn)行檢查,確保完整性和有效性。每個被測人施測時長約為1小時。
數(shù)據(jù)采集完成后,摘除傳感器,由被測人查看測試記錄并簽署在測試中未受到權(quán)利侵害的相關(guān)書面材料。待被測人離開后,主試開始數(shù)據(jù)圖譜分析。
4.1.1 得分
采用“七分制”標(biāo)準(zhǔn)打分,即比較每個通道的生理反應(yīng)相對強(qiáng)度,根據(jù)反應(yīng)強(qiáng)度的大小分別在-3~+3分之間賦值,當(dāng)相關(guān)問題反應(yīng)強(qiáng)度大于相鄰的準(zhǔn)繩問題強(qiáng)度時賦負(fù)值,與之相反時賦正值。根據(jù)SPEI算法,形成評估測試數(shù)據(jù)表,如表2所示。
條件允許時,即可以得到圖譜反應(yīng)的精細(xì)變化值時,可以采用計算相關(guān)系數(shù)(Rr)來確定分值:
其中,Ir和Ic分別代表相關(guān)問題和準(zhǔn)繩問題的反應(yīng)強(qiáng)度。
4.1.2 分布
可信度評估指數(shù)(Credibility Assessment Index,CAI)也稱為“品性評估指數(shù)”,可以用來評估個體之品性對其崗(職)位的影響程度,其定義為:
其中,L聯(lián)合是根據(jù)Bayes定理和Bayes分類器原理[10-11]獲得的聯(lián)合似然比(Likelihood Rate),其表示的是如果某次多道儀測試評估包括了k個(1:1)賦分點(diǎn)和m個(1:n)賦分點(diǎn),那么本次評估測試的聯(lián)合似然比即為:
其中,L0=1。顯然,當(dāng)CAI=1時,沒有品性證明力;CAI〉1時,具有正向品性證明力;CAI〈1時,具有反向品性證明力。且CAI與1的距離越大,證明力越強(qiáng)。在本研究中,由于每個被測人被測時相關(guān)問題個數(shù)不同,即k和m對每個人并不一致,所以需要對每一個相關(guān)問題反應(yīng)進(jìn)行比較。
表2 多道儀圖譜數(shù)據(jù)分析結(jié)果示例
根據(jù)相關(guān)問題個數(shù)和CAI值,將CAI數(shù)據(jù)取相關(guān)問題個數(shù)的幾何平均數(shù)X后,經(jīng)頻次分析可得到X的分布圖。
圖1 人員評估單題CAI分布密度函數(shù)圖
將該分布進(jìn)行曲線擬合可得一正態(tài)分布:
X~N(1.12,0.162)
其分布函數(shù)為:
4.2.1 Bayes推理的適用性
崗位人員評估具有以下特殊性:①崗位人員評估樣本不夠充分大,即不可能將單一崗位的需求拓展到所有人群,因此不適宜采用大樣本統(tǒng)計理論;②評估具有延續(xù)性。依據(jù)評估前已掌握的被測人信息,加上評估技術(shù)的基礎(chǔ)數(shù)據(jù),保證了受試群體概率分布的沿承性和一致性;③決策分類的受試群體類別是確定的;④受試群體的先驗(yàn)概率分布是已知的。綜上,Bayes推理可成功用于人員評估的多道儀測試當(dāng)中。
4.2.2 事實(shí)與價值
事實(shí)評估是指個體言語表述內(nèi)容與其外顯行為(已發(fā)生事實(shí))屬性的一致程度。例如,在犯罪調(diào)查中,對盜竊行為的確認(rèn)(非法、秘密、不屬于自己等)是為事實(shí)評估。
價值評估是指個體言語表述與其內(nèi)心價值判斷屬性的一致程度。在犯罪調(diào)查中,“盜竊罪”罪名的成立則是價值評估的結(jié)果,它是通過盜竊行為的后果和性質(zhì)(如財務(wù)損失等)價值意義而確定的。而在人員評估中,價值評估體現(xiàn)為推斷個體是否能夠勝任或達(dá)到職業(yè)能力要求。
就犯罪學(xué)意義來說,事實(shí)與價值或可對應(yīng)于犯罪的行為與動機(jī)。對于理智者的外顯行為來說,其總是與某個(些)動機(jī)相關(guān)聯(lián)的,也就是說,其事實(shí)與價值是統(tǒng)一的,同時也是不可分的,即動機(jī)與行為具有一致性和連貫性。但由于法律的介入,其懲處依據(jù)又只能以外顯的行為為基礎(chǔ),而同樣的行為其背后(內(nèi)隱)的動機(jī)往往是不相同的,因而現(xiàn)代法律的執(zhí)行總是力圖在行為的基礎(chǔ)上查明動機(jī),進(jìn)而實(shí)現(xiàn)罪罰相宜的立法目的。然而由于動機(jī)的內(nèi)隱性特點(diǎn),使得其只能以動機(jī)主體內(nèi)?。ㄗ允觯┑姆绞接枰猿尸F(xiàn)。內(nèi)省依賴于語言,因而動機(jī)的評估便成為語言的評估。
多道儀俗稱“測謊儀”,這恰好從“別稱”角度說明了它的語言評估功能。但是由于對語言評估一直缺少可操作模式(范式),所以才會出現(xiàn)本文開篇所述的“使用者明知其效,卻又不知為何有效,指責(zé)者自認(rèn)有理,卻又不知為何有理的詭異狀態(tài)?!?/p>
既然涉及價值評估,明確評估對象的價值體系才是基本。本研究采用“你說……”的方式,首先明確其價值標(biāo)準(zhǔn),隨后立即用導(dǎo)語:“是假話嗎?”等引導(dǎo)(或迫使)其采用否定方式回答,意欲通過語境控制營造出張力氛圍。顯然,當(dāng)評估對象所言(自述)與其所想(動機(jī))具有一致性和連貫性時,此時的張力是無效的,也就是說,其心理生理反應(yīng)是正常的,否則,就會出現(xiàn)異常心理生理反應(yīng)。數(shù)據(jù)表明,這種問話方式是有效的,這也再次證明SPEI在問題設(shè)置時強(qiáng)調(diào)控制被測人(評估對象)否定回答的重要性。
本研究中,事實(shí)評估與價值評估的區(qū)分是題目設(shè)置,倘若事實(shí)評估之分布與價值評估分布能夠相容,那么由Bayes定理確立的事實(shí)與價值之間的“函數(shù)”關(guān)系即可確立。盡管本研究的對象只有60例,但是涉及的評估題目卻有400多對(相關(guān)/準(zhǔn)繩),因而能夠出現(xiàn)明顯的正態(tài)分布效果。
在Bayes統(tǒng)計推斷中,不確定數(shù)量的先驗(yàn)概率分布,是在考慮一些因素之前表達(dá)對這一數(shù)量的置信程度的概率分布,再根據(jù)隨后觀察到的事實(shí)進(jìn)行動態(tài)調(diào)整,隨著調(diào)整次數(shù)的增加,結(jié)果將會越來越精確[12]。與此同時,相信隨著研究數(shù)據(jù)的增加,這個分布也將會越來越完美。
4.2.3 結(jié)果分布
(1)基本分布。人員評估是一種價值評估,評估的是個體與崗(職)位的適配度,與事實(shí)評估所不同的是,其關(guān)鍵不在于“存在與否”,而在于“適合與否”。因此,讓被測人準(zhǔn)確明白相關(guān)問題的意義和價值是重要的,即強(qiáng)調(diào)營造語境和準(zhǔn)繩問題設(shè)置的重要性和必要性。在本研究中,問題類型一是倡導(dǎo)性問題,問題類型二是禁止性問題。禁止性問題用于事實(shí)評估,例如“你組織過民族分裂活動嗎”這類問題是法律明令禁止的行為;而倡導(dǎo)性問題則用于價值評估,例如“你說‘你能夠遵守單位規(guī)定’,這是騙人的嗎”,答“否”雖不違法,但卻可以衡量出個人的品性,體現(xiàn)其價值傾向性。兩類問題的結(jié)合,實(shí)現(xiàn)了從事實(shí)評估到價值評估的轉(zhuǎn)換。
SPEI的準(zhǔn)繩與相關(guān)問題可以互為“信號”與“噪音”。對無辜的被測人來說,準(zhǔn)繩問題刺激為“信號”,而相關(guān)問題刺激為“噪音”;而對有罪被測人來說恰好相反,因而需要提取“兩個分布”,即罪犯被測人的“不通過”域分布和無辜被測人的“通過”域分布。在人員評估的測試中,其目的是遴選合格者,要求相關(guān)問題刺激不為“信號”即可,所以只需提取“一個分布”,即“誠實(shí)”被測人的“通過”域分布。本研究提取的分布用函數(shù)式為:
通過相關(guān)系數(shù)定義可簡記為:
該分布是一個基本參照,具體表現(xiàn)在:①可以準(zhǔn)確評價測試的整體準(zhǔn)確度;②為圖譜評析提供基礎(chǔ)依據(jù),為制定打分標(biāo)準(zhǔn)提供數(shù)據(jù)支持,使得打分更嚴(yán)謹(jǐn)準(zhǔn)確;③為技術(shù)改進(jìn)指出方向,準(zhǔn)確發(fā)現(xiàn)技術(shù)的局限與優(yōu)勢所在,有針對性地改進(jìn)并提高技術(shù)水平。
(2)閾值變化。根據(jù)Bayes分類器原理,當(dāng)CAI=1時,沒有證明力;CAI〉1時,具有正向品性證明力;CAI〈1時,具有反向品性證明力。且CAI與1的距離越大,證明力越強(qiáng)。本次研究中由于受試群體不同,評估題目內(nèi)容和數(shù)量也不相同,為比較方便,采用單個相關(guān)問題幾何平均評估的方式。其均值為1.12,明顯大于1。再考慮到受試群體均為首次接受這種評估,緊張與顧慮等因素會對數(shù)據(jù)產(chǎn)生影響。但是由于受試群體均為單位的中層骨干,具有較高的政治性、忠誠度,因此,CAI單題均值整體右移(均值大于1)為預(yù)料之中的結(jié)果。
4.2.4 不足與建議
本研究分析完全屬于首創(chuàng),即便在Bayes推理語境中也屬于先驗(yàn)概率需要不斷修正的一個開端。另外,研究群體選擇比較單一狹窄,如果條件允許時將針對不同職業(yè)群體進(jìn)行分類評估研究,研究結(jié)果將更具實(shí)用性。
通過對兩類崗(職)位要求不同的群體研究發(fā)現(xiàn):
(1)Bayes推理能夠適用于人員評估中的多道儀測試及測試數(shù)據(jù)分析過程;
(2)兩類群體多道儀測試的單題CAI人員分布函數(shù)表達(dá)式:可作為人員評估的基本參照;
(3)CAI的閾值標(biāo)準(zhǔn)根據(jù)評估群體不同會有所漂移。
本研究獲得的分布可視為Bayes推理的后驗(yàn)概率(分布),亦可成為后續(xù)研究的先驗(yàn)概率(分布),故本研究將成為繼續(xù)研究的新開端。