克里斯托弗·布雷特·巴克倫,格蘭特·杜威,費(fèi)伊·塔斯曼(著);趙嘉煒,賴雪金(譯)
在過去的幾十年里,RNA(風(fēng)險(xiǎn)與需求評(píng)估)在懲教系統(tǒng)中的應(yīng)用激增。事實(shí)上,美國絕大多數(shù)地方、州和聯(lián)邦懲教系統(tǒng)現(xiàn)在都在使用一些RNA工具。這些工具通常是通過校準(zhǔn)改造計(jì)劃的數(shù)量和類型來更有效地分配有限的資源,以解決評(píng)估的風(fēng)險(xiǎn)和需求。具體而言,如果一個(gè)人在收押時(shí)被評(píng)估為高風(fēng)險(xiǎn),不僅應(yīng)優(yōu)先分析他/她的動(dòng)態(tài)風(fēng)險(xiǎn)因素(犯罪的需要)以制定改造計(jì)劃,而且也會(huì)在釋放他們或把他們收監(jiān)之前讓他們接收多個(gè)評(píng)估,以確定是否有風(fēng)險(xiǎn)以及已在多大程度上減少風(fēng)險(xiǎn)。因此,RNA評(píng)估的主要目的是為那些最需要的人提供支持性和治療性的資源。同樣,這些工具可以用來確保對(duì)自由的限制(宵禁、禁止與他人接觸等)與個(gè)人所呈現(xiàn)的風(fēng)險(xiǎn)相匹配。
雖然以改造為目的的RNA工具通常適用于緩刑或監(jiān)禁,但這些工具也被用于量刑前的審前羈押決定,或者在一些情形下為量刑決定提供信息。與未定罪時(shí)使用的量刑前工具相比,量刑后的RNA工具可能遵守改造原則。量刑前評(píng)估通常用于為司法相關(guān)的決定提供信息,例如某人是否應(yīng)予審前羈押或釋放。由于在審前階段很少進(jìn)行矯治性的改造計(jì)劃,因此審前風(fēng)險(xiǎn)評(píng)估往往不側(cè)重于矯治。此外,鑒于審前評(píng)估往往只進(jìn)行一次,因此,一個(gè)人沒有機(jī)會(huì)證明其風(fēng)險(xiǎn)的變化。量刑前評(píng)估的目的不同于量刑后,很大程度上這也是量刑后評(píng)估在公平性方面受到更多審查和批評(píng)的主要原因。
RNA工具用于懲教,以前瞻性地識(shí)別那些有更大的違法風(fēng)險(xiǎn)、違反法律或監(jiān)獄規(guī)則、和/或違反社區(qū)監(jiān)督條件的人。懲教當(dāng)局使用RNA工具來指導(dǎo)一系列決策,這些決策在很大程度上旨在增強(qiáng)公共安全并更好地利用稀缺資源。盡管RNA工具可以通過多種方式來改善懲教政策和實(shí)踐,但該領(lǐng)域目前使用的RNA風(fēng)格與類型尚未實(shí)現(xiàn)這一目標(biāo),因?yàn)樗呀?jīng)過時(shí)了,且效率低下,并沒有達(dá)到應(yīng)有的效果。
為了幫助懲教領(lǐng)域認(rèn)識(shí)到RNA工具在改進(jìn)決策和減少再犯方面的潛力,我們利用我們的集體智慧和經(jīng)驗(yàn)確定了負(fù)責(zé)任且合乎道德地使用RNA至關(guān)重要的四項(xiàng)原則。每條原則內(nèi)都有一套指導(dǎo)方針,在實(shí)踐中應(yīng)用這些指導(dǎo)方針將有助于最大限度地提高RNA工具的可靠性和有效性。由于這些指南包含了新穎的、基于證據(jù)的實(shí)踐和程序,因此我們?cè)诒疚闹刑岢龅慕ㄗh也相對(duì)具有創(chuàng)新性,至少在懲教領(lǐng)域是這樣。
第一個(gè)原則是公平,我們認(rèn)為應(yīng)使用RNA工具創(chuàng)造更公平的結(jié)果。在設(shè)計(jì)評(píng)估時(shí),應(yīng)努力消除或盡量減少潛在的偏見來源,以減輕種族和民族差異。處理前、處理中和處理后的調(diào)整是設(shè)計(jì)策略,有助于將偏差最小化。從業(yè)人員使用RNAs的方式也可減少差異,例如將相應(yīng)改造計(jì)劃的資源交給最需要它的人(風(fēng)險(xiǎn)原則)??傊?,RNA工具為懲教機(jī)構(gòu)實(shí)現(xiàn)更上乘和更公平的結(jié)果提供了策略。
第二個(gè)原則是效率。RNA工具依賴的是提高可靠性、擴(kuò)大評(píng)估能力和不增加人力資源負(fù)擔(dān)的程序。絕大多數(shù)RNA仍依靠耗時(shí)又煩瑣的模擬紙和鉛筆工具的程序,也就是說,需要填寫表格,然后由工作人員手動(dòng)評(píng)分。RNA工具的效率可以通過采用自動(dòng)化和計(jì)算機(jī)輔助的評(píng)分過程來提高可靠性、有效性和評(píng)估能力。如果RNA工具必須手動(dòng)評(píng)分,則必須進(jìn)行評(píng)分者之間的可靠性評(píng)估,以確保評(píng)分人員之間的一致性。
工具不僅應(yīng)該是公平和高效的,而且還應(yīng)該是有效的,這是第三個(gè)關(guān)鍵原則。RNA工具的有效程度在很大程度上取決于它們所作預(yù)測(cè)的有效性以及該工具在機(jī)構(gòu)內(nèi)的使用方式。機(jī)器學(xué)習(xí)算法通常有助于提高預(yù)測(cè)的準(zhǔn)確性,但開發(fā)者應(yīng)該測(cè)試多種算法,以確定哪一種算法最佳。針對(duì)矯正人群定制的RNA工具將作出更好的預(yù)測(cè)。
最后,我們應(yīng)重點(diǎn)關(guān)注RNA的實(shí)施和使用,這樣個(gè)人就可以越來越多地意識(shí)到他們的風(fēng)險(xiǎn)因素。為此,第四個(gè)關(guān)鍵原則是應(yīng)用策略改善風(fēng)險(xiǎn)溝通。對(duì)使用RNA工具的懲教人員進(jìn)行培訓(xùn)是有效溝通的基礎(chǔ),尤其是在解釋需求并將其轉(zhuǎn)化為案例計(jì)劃方面。風(fēng)險(xiǎn)溝通系統(tǒng),包括案例計(jì)劃改進(jìn)、治療匹配算法、分級(jí)制裁和激勵(lì),為決策提供了一個(gè)綜合模型,幫助提高個(gè)人對(duì)自身情況和改造計(jì)劃需求的認(rèn)識(shí)。
這四個(gè)原則對(duì)于提高RNA工具的透明度,提高管理其開發(fā)和實(shí)現(xiàn)的基本指導(dǎo)方針很重要。依賴這些原則可以幫助RNA工具減少差異,獲得更好的再犯結(jié)果。
近期,RNA工具被定性為不公平或存在偏見,通常涉及種族和/或性別群體(Pretrial Justice Institute, 2020)。在此應(yīng)提出的一個(gè)重要問題是:公平,是與什么相比?RNA工具的替代方案是個(gè)人依靠自己的專業(yè)判斷來評(píng)估個(gè)人未來可能做的事情。盡管人類通常在決策時(shí)會(huì)帶入各種偏見,但我們的目標(biāo)是逐步減少無用的偏見。我們相信RNA工具可以成為強(qiáng)有力的改革工具,幫助懲教系統(tǒng)實(shí)現(xiàn)更公平的結(jié)果。只有在這些工具設(shè)計(jì)得當(dāng)并在實(shí)踐中得以使用時(shí),才能發(fā)揮其潛力。
實(shí)現(xiàn)RNA的公平性包括兩個(gè)不同的部分:設(shè)計(jì)問題與使用問題。通過設(shè)計(jì)RNA來實(shí)現(xiàn)更公平的結(jié)果應(yīng)把重點(diǎn)放在讓數(shù)據(jù)和算法在預(yù)測(cè)時(shí)不產(chǎn)生差異上。就設(shè)計(jì)這個(gè)部分,我們假設(shè)實(shí)現(xiàn)RNA公平性的責(zé)任主要落在這些工具的開發(fā)者身上。當(dāng)關(guān)注如何使用RNA時(shí),實(shí)現(xiàn)更加公平的結(jié)果的責(zé)任則更多地落在操作機(jī)構(gòu)(懲教系統(tǒng))身上,更狹義地說,是使用這些工具做出決定的從業(yè)人員身上。這種方法假設(shè)一致地應(yīng)用風(fēng)險(xiǎn)原則將有助于減少結(jié)果方面的差異。
RNA工具旨在改善司法系統(tǒng)的決策,即確保類似信息納入決策考量以確定個(gè)人對(duì)社會(huì)的風(fēng)險(xiǎn)。一線工作人員(無論是公職人員、檢察官、法官還是案件管理員)的主觀決策會(huì)加入個(gè)人的偏好和觀點(diǎn)。盡管依靠自由裁量權(quán)的決定可能有一些優(yōu)點(diǎn),但它們是主觀的,并且基于“旁觀者的眼睛”。有超過175種不同類型的認(rèn)知偏差會(huì)影響人類決策,包括錨定、確認(rèn)偏差、群體歸因錯(cuò)誤、基本歸因錯(cuò)誤、基本比率謬誤、軼事謬誤和伸縮效應(yīng)(1)Benson, B. (2016). Cognitive Bias Cheat Sheet. https://medium.com/better-humans/ cognitive-bias-cheat-sheet-55a472476b18.,而結(jié)構(gòu)化信息可以減少偏差。
精算RNA工具將重點(diǎn)放在與結(jié)果有利害關(guān)系的相關(guān)關(guān)鍵因素上(即逮捕、定罪或監(jiān)禁)來消除自由裁量權(quán)。當(dāng)工作人員使用工具進(jìn)行標(biāo)準(zhǔn)化的信息收集并提供客觀基礎(chǔ)來對(duì)個(gè)人進(jìn)行收集和分類時(shí),就有可能減少信息使用方式的差異。由此產(chǎn)生的風(fēng)險(xiǎn)評(píng)分反映了個(gè)人從事消極行為(或成功)的可能性。風(fēng)險(xiǎn)評(píng)分通常被轉(zhuǎn)換為帶有離散類別的分類機(jī)制,反映行為的嚴(yán)重程度。
從表面上看,RNA工具似乎是客觀的并由數(shù)據(jù)驅(qū)動(dòng)的。但公平通常來源于創(chuàng)建工具的方法或個(gè)人使用信息的方式(實(shí)施)。也就是說,公平的概念植根于對(duì)同等事件/特征給予平等對(duì)待并給予平等結(jié)果的原則。無論人口特征如何,統(tǒng)計(jì)預(yù)測(cè)都應(yīng)盡量減少錯(cuò)誤并在各組之間保持相似(2)Beretta, E., Santangelo, A., Lepri, B., Vetro, A., and DeMartin, J.C. (2019). The Invisible Power of Fairness. How Machine Learning Shapes Democracy. Turin, Italy: Nexa Center for Internet & Society.,統(tǒng)計(jì)學(xué)家已經(jīng)確定了幾個(gè)核心量值(3)這幾個(gè)核心量值是:(1)整體準(zhǔn)確度——在保護(hù)組內(nèi)每個(gè)類別之間的模型準(zhǔn)確性相等,但不區(qū)分誤報(bào)或漏報(bào);(2)統(tǒng)計(jì)均等——在保護(hù)組內(nèi),每個(gè)類別預(yù)測(cè)結(jié)果的邊際分布相等。例如,黑人假釋犯預(yù)測(cè)再犯的比例等于白人假釋犯預(yù)測(cè)再犯的比例;(3)條件程序準(zhǔn)確度——保護(hù)組內(nèi)每個(gè)類別之間的誤報(bào)率或漏報(bào)率相等,即根據(jù)實(shí)際結(jié)果確定的誤差相等;(4)條件使用準(zhǔn)確性——保護(hù)組內(nèi)每個(gè)類別之間的誤報(bào)和漏報(bào)的預(yù)測(cè)值相等,即預(yù)測(cè)結(jié)果的誤差相等;(5)平等對(duì)待——保護(hù)組內(nèi)每個(gè)類別之間漏報(bào)和誤報(bào)的比率相等;(6)完全公平——所有上述條件同時(shí)滿足。來檢查RNA促進(jìn)平等對(duì)待和結(jié)果的效度。這些公平性衡量量值指的是預(yù)測(cè)準(zhǔn)確性,可用于確定這一工具是否扭曲了群體差異。由于要在準(zhǔn)確性和減少偏差之間權(quán)衡,不太可能同時(shí)實(shí)現(xiàn)所有六個(gè)標(biāo)準(zhǔn)。實(shí)現(xiàn)平等存在若干挑戰(zhàn),包括不同群體之間的不同基本比率、分類機(jī)制以及不同利益相關(guān)者的不同選擇。群體之間基本比率不等通常是常態(tài),需要使用不同的統(tǒng)計(jì)方法進(jìn)行校準(zhǔn)以克服這一問題。
研究人員已經(jīng)確定了方法問題可能影響工具準(zhǔn)確性和公平性的三個(gè)階段,特別是考慮到所使用的基礎(chǔ)數(shù)據(jù)和/或變量的來源:處理前、處理中和處理后問題(4)Romei, A. and Ruggieri, S. (2014). A multidisciplinary survey on discrimination analyses. The Knowledge Engineering Review 29(5): 1—54. doi: https://doi.org/10.1017/S0269888913000039.。處理前需要評(píng)估數(shù)據(jù)的來源,數(shù)據(jù)可能因收集、存儲(chǔ)、測(cè)量和一般報(bào)告方式而可能存在各種類型的偏差。處理前工作的目標(biāo)是在開發(fā)算法或風(fēng)險(xiǎn)計(jì)算之前消除數(shù)據(jù)中的任何不公平來源。一些處理前工作可用于解決潛在的偏差領(lǐng)域:(1) 每個(gè)預(yù)測(cè)變量的強(qiáng)度;(2) 風(fēng)險(xiǎn)評(píng)分和預(yù)測(cè)因素如何在組間區(qū)分;(3)構(gòu)建預(yù)測(cè)結(jié)果的值,以確保沒有信息對(duì)任何組產(chǎn)生不利影響;(4)重新分配邊際分布,以確?;颈嚷适窍嗨苹蚩杀容^的;(5)使用不同的關(guān)聯(lián)規(guī)則(直接或間接),以確保預(yù)測(cè)器是無偏的;(6)若有可能,檢查條件概率,以確保估計(jì)是無偏的。具體而言,處理前要求仔細(xì)注意數(shù)據(jù)源、變量的構(gòu)建、數(shù)據(jù)中的偏差,以及如何預(yù)先調(diào)整變量以平衡基本比率。這是為了了解不同的數(shù)據(jù)元素為何倚重一個(gè)類別而不是另一個(gè)類別。
一個(gè)具體的例子是對(duì)逮捕歷史數(shù)據(jù)庫的審查,這些數(shù)據(jù)庫通常是許多基于精算的RNA工具的數(shù)據(jù)來源。州或聯(lián)邦機(jī)構(gòu)以不同方式獲取逮捕、定罪、監(jiān)禁和其他刑事司法數(shù)據(jù)的歷史記錄。一些州有一個(gè)中央數(shù)據(jù)源,而另一些州則要求研究人員將相應(yīng)文件整合在一起。例如,一些犯罪記錄數(shù)據(jù)庫包括任何類型的犯罪(無監(jiān)禁的交通犯罪、輕罪、傳訊、重罪等),而其他數(shù)據(jù)庫則將記錄限制為輕罪和重罪。因此,逮捕的數(shù)量(和類型)等變量將因數(shù)據(jù)來源而異。另一個(gè)常見的數(shù)據(jù)來源問題是一些司法管轄區(qū)將一些類型的逮捕和其他程序轉(zhuǎn)移出去了,以替代正式的司法系統(tǒng);有些有所記錄,有些則沒有。處理前工作將記錄犯罪記錄中包含的數(shù)據(jù)類型,隨后可能構(gòu)建變量以便檢查因不同類型的事件(不可監(jiān)禁的交通、輕罪、重罪等)發(fā)生了多少次逮捕。隨后,此過程允許人們通過評(píng)估如何最好地構(gòu)建變量來評(píng)估任何有偏差的數(shù)據(jù)來源。
處理中的工作可以進(jìn)一步幫助減少會(huì)對(duì)不同群體產(chǎn)生負(fù)面影響的不公平來源。處理中是指在算法和/或分類程序中進(jìn)行調(diào)整以解決可能發(fā)生的任何偏差,例如識(shí)別組之間出現(xiàn)統(tǒng)計(jì)差異的潛在變量,然后進(jìn)行調(diào)整以減少潛在的偏差區(qū)域。處理中工作的范圍包括調(diào)整關(guān)鍵量值的切入點(diǎn)、重新編碼某些變量以平衡保護(hù)類別之間的結(jié)果,以及調(diào)整最終算法以最大限度地提高公平性。工具開發(fā)人員可以使用一系列敏感性分析來確保變量和生成的算法在不同的群體中是公平的。
最后一個(gè)階段,處理后,涉及在創(chuàng)建算法后對(duì)算法進(jìn)行調(diào)整。這些通常包括提高工具性能的調(diào)整,這可能會(huì)降低工具的準(zhǔn)確性。后處理分析試圖通過檢查假陽性和/或假陰性率、使用解決特定風(fēng)險(xiǎn)閾值的約束優(yōu)化方法,并在審查準(zhǔn)確性量值后進(jìn)行調(diào)整以提高擬合度來確保受保護(hù)組的同等性能。為了消除影響群體偏見的代理,這些程序不會(huì)調(diào)整基礎(chǔ)變量,而是關(guān)注截止點(diǎn)、將受試者分配到不同類別以及每個(gè)組的預(yù)測(cè)準(zhǔn)確性。
如上所述,近期對(duì)RNA的公平性和偏見的關(guān)注主要集中在所使用的數(shù)據(jù)和算法上。但是,如果我們嚴(yán)格關(guān)注RNA的設(shè)計(jì)而不檢查它們的使用方式,那么我們就會(huì)限制實(shí)現(xiàn)更公平結(jié)果的可能性。有幾個(gè)限制特別強(qiáng)調(diào)了所使用的數(shù)據(jù)和算法。
首先,群體差異的存在實(shí)際上并不意味著數(shù)據(jù)不準(zhǔn)確和算法不公允。其次,正如貝克和他的同事所證明的那樣,當(dāng)預(yù)測(cè)結(jié)果的基本率變化很大時(shí),不可能同時(shí)最大化準(zhǔn)確性和公平性(5)Berk, R., Hidari, H., Jabbari, S., Kearns, M., and Roth, A. (2018). Fairness in criminal justice risk assessments: The state of the art. Sociological Methods & Research 1—42. doi: 10.1177/0049124118782533.。在許多方面,使用RNA就像是一面鏡子,反映刑事司法系統(tǒng)的政策、實(shí)踐和決定(6)Mayson, S.G. (2019). Bias in, bias out. The Yale Law Journal 128: 2218—2300.。當(dāng)鏡子向我們展示群體差異存在的程度時(shí),我們不喜歡我們所看到的,且理由充分。然而,尋找公平和準(zhǔn)確算法的圣杯就像試圖更換我們目前使用的鏡子,只想找到能向我們展示我們想要看到的東西而不是我們真正樣子的鏡子。換句話說,我們對(duì)于無差異預(yù)測(cè)的RNA的渴望就像想要“瘦身鏡”。第三,像偏愛瘦身鏡一樣,RNA的諷刺之處在于,雖然它可以通過最小化預(yù)測(cè)風(fēng)險(xiǎn)的差異來反映我們希望看到的方面,但它會(huì)掩蓋可能需要更多工作和關(guān)注的問題領(lǐng)域。
為了說明這一點(diǎn),我們假設(shè)有兩個(gè)人在監(jiān)獄里,這兩個(gè)人所有情況都一樣,他們將有類似的再犯風(fēng)險(xiǎn)。然而,鑒于一切事物很少是完全一樣的,第一個(gè)人會(huì)有更高的再犯風(fēng)險(xiǎn)(根據(jù)所使用的評(píng)估),因?yàn)樗懈L的犯罪歷史;他在一個(gè)弱勢(shì)、高犯罪率的社區(qū)長大,并受到激進(jìn)的警察執(zhí)法的影響。考慮到被釋放的人通常會(huì)回到原來的社區(qū),讓我們進(jìn)一步假設(shè)他會(huì)回到原來的社區(qū),而第二個(gè)人會(huì)被釋放到一個(gè)資源豐富并有助于停止犯罪的地方。為了成功地停止犯罪,第一個(gè)人在監(jiān)獄中可能需要比第二個(gè)人更多的資源。
然而,對(duì)于旨在消除預(yù)測(cè)風(fēng)險(xiǎn)差異的評(píng)估,第一個(gè)人的改造計(jì)劃上的優(yōu)先級(jí)不會(huì)與第二個(gè)人有任何不同,因?yàn)樗麄兊娘L(fēng)險(xiǎn)水平相似。然而,正如我們?cè)谶@個(gè)例子中也提到的,第一個(gè)人將返回一個(gè)更難停止犯罪的社區(qū),在這種情況下,利用 “瘦身鏡”RNA對(duì)這個(gè)人沒有幫助,因?yàn)閯儕Z了推動(dòng)他獲得從監(jiān)獄到社區(qū)成功過渡的資源的機(jī)會(huì)。準(zhǔn)確反映現(xiàn)實(shí)的RNA才可能是改革的有力工具,但前提是我們是在負(fù)責(zé)任地使用它來加強(qiáng)懲教決策和實(shí)踐。
懲教機(jī)構(gòu)可以減少差異,并通過專注于RNA工具的使用來實(shí)現(xiàn)更公平的結(jié)果。量刑后RNA,試圖遵循RNR模型(7)RNR模型,英文為risk-need-responsivity,即需求和反應(yīng)性模型,是循證矯正模型的一種。,并堅(jiān)持風(fēng)險(xiǎn)原則,為實(shí)現(xiàn)更好結(jié)果(包括減少差異)提供了一種方案。風(fēng)險(xiǎn)原則確定了那些將從改造計(jì)劃資源中受益的人,因?yàn)楦唢L(fēng)險(xiǎn)的人往往需要更高級(jí)別、更高強(qiáng)度的改造計(jì)劃來制止犯罪。因此,如果我們看到結(jié)果上的差異,那么如果我們堅(jiān)持風(fēng)險(xiǎn)原則,我們應(yīng)該會(huì)看到項(xiàng)目參與方面的差異。例如,我們可以假設(shè)有一個(gè)包含25%的監(jiān)獄人口但其中50%被評(píng)估為高風(fēng)險(xiǎn)的群體。我們可以進(jìn)一步假設(shè),有一個(gè)有效的、加強(qiáng)的方案,通常只針對(duì)高風(fēng)險(xiǎn)囚犯。如果我們遵循風(fēng)險(xiǎn)原則,我們應(yīng)該看到項(xiàng)目參與同差異相反,這個(gè)群體約占到所有參與者的一半(盡管他們只占所有囚犯的四分之一)。
如果得到適當(dāng)?shù)拈_發(fā)和驗(yàn)證,RNA工具將準(zhǔn)確預(yù)測(cè)誰會(huì)以及誰不會(huì)帶來更高的再犯罪風(fēng)險(xiǎn),但它不會(huì)告訴我們應(yīng)該對(duì)高風(fēng)險(xiǎn)或低風(fēng)險(xiǎn)的人做什么。這就是為什么必須區(qū)分RNA的設(shè)計(jì)和使用的原因。如果它準(zhǔn)確地預(yù)測(cè)了累犯,但它的使用加劇了現(xiàn)有的差異,那么問題出在它的使用上。因此,解決方案不是重新設(shè)計(jì)RNA,而是改變懲教政策和做法,以便負(fù)責(zé)任地使用RNA工具來降低最需要改造計(jì)劃的人的風(fēng)險(xiǎn),從而提高公共安全。
RNA工具在懲教機(jī)構(gòu)的實(shí)施可能對(duì)利用該工具提高公平?jīng)Q策產(chǎn)生影響。影響公平的做法包括限制RNA工具在收押或重新評(píng)估中的使用,將犯罪而不是犯罪需求作為項(xiàng)目安置的標(biāo)準(zhǔn),不采用質(zhì)量標(biāo)準(zhǔn),也不制定將RNA工具整合到實(shí)踐中的政策和程序。與此相關(guān)的問題涉及培訓(xùn)員工了解RNA工具的每個(gè)元素背后的含義,以及如何在案例規(guī)劃、法規(guī)遵循管理和項(xiàng)目安排中使用RNA信息。為了避免“瘦身鏡”,應(yīng)注意RNA工具在常規(guī)決策中的使用,并與支持性的政策和程序一起,提升平等待遇。
RNA工具通常依賴于算法,即將預(yù)測(cè)項(xiàng)目的值——如犯罪歷史、人口特征、動(dòng)態(tài)風(fēng)險(xiǎn)因素和/或項(xiàng)目參與——轉(zhuǎn)換為風(fēng)險(xiǎn)評(píng)分。RNA工具上填寫項(xiàng)目的值的過程被稱為評(píng)分方法(8)Duwe, G. and Rocque, M. (2017). The effects of automating recidivism risk assessment on reliability, predictive validity, and return on investment (ROI). Criminology & Public Policy 16: 235—269.。項(xiàng)目的值可以手動(dòng)輸入,通常由懲教機(jī)構(gòu)人員輸入,也可以自動(dòng)化填寫。使用不同類型的評(píng)分方法對(duì)RNA的可靠性、有效性和效率具有重要影響(9)Duwe, G. and Rocque, M. (2019). The predictive performance of risk assessment in real life: An external validation of the MnSTARR. Corrections: Policy, Practice and Research. doi.org/ 10.1080/23774657.2019.1682952.。無論使用哪種評(píng)分方法,RNA中包含的項(xiàng)目都應(yīng)該響應(yīng),并促進(jìn)對(duì)推動(dòng)風(fēng)險(xiǎn)評(píng)分的因素的理解。
當(dāng)使用手工評(píng)分方法時(shí),由于項(xiàng)目的主觀性、培訓(xùn)不足、工作人員工作量、完成評(píng)估所需的時(shí)間以及數(shù)據(jù)輸入錯(cuò)誤,會(huì)導(dǎo)致工作人員對(duì)RNA工具的評(píng)分存在差異。更廣泛地說,評(píng)分者間的可靠性(IRR)關(guān)注的是評(píng)分者之間在評(píng)分工具上的一致程度。IRR被認(rèn)為是RNA的一個(gè)重要組成部分,主要是因?yàn)樗赡軙?huì)影響工具對(duì)結(jié)果的預(yù)測(cè)。畢竟,為了讓人工評(píng)分的工具在預(yù)測(cè)結(jié)果時(shí)表現(xiàn)良好,必須確保評(píng)分者一致使用。
通過標(biāo)準(zhǔn)化項(xiàng)目的評(píng)分過程,自動(dòng)評(píng)分方法消除了評(píng)分者之間的差異。這并不意味著自動(dòng)化RNA不受缺陷數(shù)據(jù)相關(guān)問題的影響。例如,如果自動(dòng)化流程從錯(cuò)誤輸入的數(shù)據(jù)庫中以電子方式提取信息,則該錯(cuò)誤將反映在自動(dòng)化評(píng)估中。但是這種類型的數(shù)據(jù)輸入錯(cuò)誤也很可能存在于人工評(píng)分的RNA中。通過使用標(biāo)準(zhǔn)化的評(píng)分流程,自動(dòng)化程序消除了風(fēng)險(xiǎn)評(píng)估中的潛在錯(cuò)誤。如此,自動(dòng)評(píng)分過程有助于提高可靠性,從而提高RNA決策的預(yù)測(cè)有效性。
雖然很少有研究檢驗(yàn)評(píng)分方法對(duì)RNA工具的影響,但從已經(jīng)完成的少數(shù)現(xiàn)有研究中可以得出幾個(gè)寬泛的結(jié)論。首先,即使評(píng)分者之間存在相對(duì)適度的分歧,也會(huì)對(duì)預(yù)測(cè)產(chǎn)生重大影響。在明尼蘇達(dá)州累犯風(fēng)險(xiǎn)評(píng)估篩查工具(MnSTARR)的研究中,明尼蘇達(dá)州懲教部門(MnDOC)于2013年開發(fā)并開始使用手動(dòng)評(píng)分工具(10)Duwe, G. (2014). The development, validity, and reliability of the Minnesota Screening Tool Assessing Recidivism Risk (MnSTARR). Criminal Justice Policy Review 25: 579—613.,杜維和洛克在2017年報(bào)告中比較了手動(dòng)評(píng)分方法與全自動(dòng)程序的可靠性,使用多個(gè)性能指標(biāo)評(píng)估了這兩種評(píng)分方法(手動(dòng)和自動(dòng))對(duì)男性和女性罪犯再犯的四種預(yù)測(cè)性能。結(jié)果顯示明尼蘇達(dá)州懲教部工作人員對(duì)MnSTARR評(píng)分具有較高的一致性。
實(shí)際上,組類相關(guān)系數(shù)(ICC)值在0.81到0.94之間,屬于“優(yōu)秀”(11)Hallgren, K.A. (2012). Computing inter-rater reliability for observational data: An overview and tutorial. Tutorials in Quantitative Methods for Psychology 8: 23—34.。杜維和洛克在2017年的報(bào)告中稱,自動(dòng)評(píng)估在預(yù)測(cè)再犯方面顯著優(yōu)于手工評(píng)分。他們發(fā)現(xiàn),隨著評(píng)分者之間分歧的增加(即ICC值的降低),預(yù)測(cè)性能顯著下降。通過確保每個(gè)人都以相同的方式評(píng)分,自動(dòng)評(píng)分方法消除了在手工評(píng)分評(píng)估中內(nèi)在的評(píng)分者之間的分歧。在此過程中,自動(dòng)評(píng)分過程有助于提高RNA工具的可靠性,進(jìn)而提高預(yù)測(cè)性能。
其次,自動(dòng)評(píng)分方法增加的一致性也有助于減少在預(yù)測(cè)風(fēng)險(xiǎn)或風(fēng)險(xiǎn)級(jí)別中經(jīng)常觀察到的差異。在杜維和洛克的最近一項(xiàng)研究中,以2014年明尼蘇達(dá)州監(jiān)獄釋放的3985名囚犯為樣本,從外部驗(yàn)證MnSTARR。盡管手工評(píng)分的MnSTARR達(dá)到了足夠的預(yù)測(cè)有效性,但如果采用自動(dòng)評(píng)分流程,其性能會(huì)更好。同樣重要的是,杜維和洛克在2019年的報(bào)告中稱,盡管MnSTARR對(duì)白人的表現(xiàn)優(yōu)于非白人(黑人、美國印第安人和亞洲人),但使用自動(dòng)評(píng)分可以將這種差異的程度降至最低。
再次,2014年明尼蘇達(dá)州監(jiān)獄釋放的7,657人中,只有52%的人通過MnSTARR對(duì)其再犯風(fēng)險(xiǎn)進(jìn)行了人工評(píng)估,大多數(shù)人只被評(píng)估了一次。2016年,該組織實(shí)施了完全自動(dòng)化的區(qū)分性別的MnSTARR2.0,評(píng)估多種類型的再犯風(fēng)險(xiǎn)。具體而言,MnSTARR2.0從該州的犯罪歷史存儲(chǔ)庫提取數(shù)據(jù)來填寫犯罪歷史條目,從明尼蘇達(dá)州懲教部門的管理信息系統(tǒng)提取數(shù)據(jù)來填寫人口特征(例如,性別、年齡和婚姻狀況)、制度行為(例如,遵守紀(jì)律,加入幫派),參與改造(例如,在監(jiān)獄里獲得大專學(xué)歷,完成化學(xué)依賴治療,完成認(rèn)知行為治療)。雖然最初的MnSTARR手工評(píng)分平均需要35分鐘,但MnSTARR2.0評(píng)分不需要增加任何額外的工作時(shí)間。由于采用了更有效的評(píng)分程序,自2016年以來,明尼蘇達(dá)州監(jiān)獄釋放的每一個(gè)人在釋放前都至少進(jìn)行了一次評(píng)估,且在大多數(shù)情況下,在釋放前都進(jìn)行了多次評(píng)估。僅在第一年,就總共完成了41253次MnSTARR2.0評(píng)估。如果使用手工評(píng)分的MnSTARR,要對(duì)這么多評(píng)估進(jìn)行評(píng)分,需要超過2.4萬小時(shí)的工作時(shí)間(幾乎相當(dāng)于12名全職員工的時(shí)間)。通過節(jié)省大量工作時(shí)間,MnSTARR2.0的自動(dòng)化在其第一年的成本效益估計(jì)為955990美元,投資回報(bào)為8.08美元(12)Duwe, G. and Rocque, M. (2019). The predictive performance of risk assessment in real life: An external validation of the MnSTARR. Corrections: Policy, Practice and Research. doi.org/ 10.1080/23774657.2019.1682952.。
現(xiàn)有的證據(jù)表明,提高RNA工具的效率有幾個(gè)重要影響。首先,考慮到與自動(dòng)化相關(guān)的優(yōu)勢(shì),懲教系統(tǒng)應(yīng)該投入更多的資源讓評(píng)分過程自動(dòng)化。自動(dòng)化可以顯著提高RNA程序的效率,因?yàn)樗梢允∪ケO(jiān)獄工作人員在手動(dòng)評(píng)分評(píng)估上花費(fèi)的時(shí)間,并讓那些使用工具的人接受必要的培訓(xùn)。盡管自動(dòng)化RNA程序需要監(jiān)獄系統(tǒng)的成本,但由于效率的顯著提高,它仍然提供了非常有利的投資回報(bào)。
如果自動(dòng)評(píng)分不可行,則應(yīng)考慮使用技術(shù),例如計(jì)算機(jī)輔助調(diào)查軟件。有些評(píng)估,特別是那些需求評(píng)估,可能需要通過調(diào)查或與緩刑犯、罪犯或假釋犯面談來收集輸入數(shù)據(jù)。使用電腦輔助調(diào)查軟件可大大提高評(píng)分程序的效率。與其依靠工作人員通過面對(duì)面的談話來進(jìn)行評(píng)估,被拘留或被監(jiān)管的人應(yīng)該通過平板電腦或自助服務(wù)亭等設(shè)備自己完成評(píng)估。
最后,如果一個(gè)工具必須手動(dòng)評(píng)分,那么就有必要證明其評(píng)分具有一致性。如資料必須由懲教人員手動(dòng)輸入,則應(yīng)完成評(píng)分者間的可靠性(IRR)的內(nèi)部評(píng)估,以確定評(píng)分人員之間的意見分歧程度。杜維和洛克在2017年提出了以下在人工評(píng)分的RNA工具中評(píng)估評(píng)分者間的可靠性(IRR)的類內(nèi)相關(guān)系數(shù)(ICC)閾值:0.95及以上為極好,0.85至0.94為良好,0.75至0.84為及格,低于0.75為差。
任何好的RNA工具的一個(gè)主要目標(biāo)都應(yīng)該是最大限度地提高預(yù)測(cè)準(zhǔn)確性。我們把這一目標(biāo)稱為有效性原則。本節(jié)描述了RNA工具效率最大化領(lǐng)域的最新發(fā)展和最佳實(shí)踐。如前所述,精算的風(fēng)險(xiǎn)預(yù)測(cè)方法在預(yù)測(cè)準(zhǔn)確性方面優(yōu)于不用工具的人類或臨床判斷(13)Meehl, P.E. (1954). Clinical Versus Statistical Prediction. Minneapolis, MN: University of Minnesota Press.。這一發(fā)現(xiàn)在對(duì)136項(xiàng)直接比較精算預(yù)測(cè)與非結(jié)構(gòu)化臨床預(yù)測(cè)的研究(14)Grove, W.M., Zald, D.H., Lebow, B.S., Snitz, B.E., and Nelson, C. (2000). Clinical versus mechanical prediction: A meta-analysis. Psychological Assessment 12: 19—30.的系統(tǒng)回顧以及最近的研究中得到證實(shí)(15)Lin, Z., Jung, J., Goel, S., and Skeem, J. (2020). The limits of human predictions of recidivism. Science Advances 6(7). Brennan, T., Dieterich, W., and Ehret, B. (2009). Evaluating the predictive validity of the COMPAS risk and needs assessment system. Criminal Justice and Behavior 36: 21—40.。
然而,并非所有精算方法都是一樣的。統(tǒng)計(jì)、數(shù)據(jù)科學(xué)和預(yù)測(cè)分析領(lǐng)域的重大進(jìn)步是引入了一系列精算選項(xiàng),這些選項(xiàng)通常在預(yù)測(cè)準(zhǔn)確性方面更為出色。開發(fā)RNA工具的一個(gè)重要的實(shí)踐是充分利用一系列先進(jìn)的算法方法,目的是為了并排測(cè)試多種方法。沒有一種通用的精算方法可以在所有情況下都發(fā)揮最佳效果。一些精算方法通常比其他方法效度更高,但是測(cè)試多種方法并允許預(yù)測(cè)準(zhǔn)確性量值來歸納確定最佳方法是最明智的指引(16)Duwe, G. (2014). The development, validity, and reliability of the Minnesota Screening Tool Assessing Recidivism Risk (MnSTARR). Criminal Justice Policy Review 25: 579—613.Ridgeway, G. (2013). “The Pitfalls of Prediction.” NIJ Journal 271, February 2013.。
自早期采用以來,刑事司法環(huán)境中RNA的精算(或算法)已經(jīng)推進(jìn)了三波。精算RNA工具的第一波使用了一種簡單的累加評(píng)分方法,通常稱為伯吉斯再犯預(yù)測(cè)法(17)Burgess, E.W. (1928). “Factors Determining Success or Failure on Parole,” in The Workings of the Indeterminate Sentence Law and the Parole System in Illinois, ed. A.A. Bruce, E.W. Burgess, J. Landesco, and A.J. Harno. Springfield, IL: Illinois State Board of Parole, 221—234.。在這種方法下,工具上的所有項(xiàng)目通常都被賦予相等的價(jià)值,并且通過簡單地將每個(gè)單獨(dú)項(xiàng)目的數(shù)值相加來生成風(fēng)險(xiǎn)評(píng)分。
第二波使用參數(shù)統(tǒng)計(jì)建模技術(shù)(例如邏輯回歸)來確定要包含在工具中的項(xiàng)目,并根據(jù)它們對(duì)結(jié)果的影響來計(jì)算項(xiàng)目的權(quán)重。這種統(tǒng)計(jì)方法代表了伯吉斯再犯預(yù)測(cè)法的普遍進(jìn)步,因?yàn)樗峁┝烁陀^的標(biāo)準(zhǔn)來確定應(yīng)納入工具的項(xiàng)目從而最大限度地提高預(yù)測(cè)準(zhǔn)確性,并且還提供了關(guān)于如何組合和加權(quán)這些項(xiàng)目以產(chǎn)生更有價(jià)值的信息風(fēng)險(xiǎn)總計(jì)評(píng)分。
第三波是新近才開始的,即依靠機(jī)器學(xué)習(xí)算法來開發(fā)精算RNA工具。機(jī)器學(xué)習(xí)是人工智能的一個(gè)子集,其中模型通過訓(xùn)練過程自適應(yīng)地在數(shù)據(jù)中進(jìn)行。機(jī)器學(xué)習(xí)方法不同于早期的統(tǒng)計(jì)方法,因?yàn)樗鼈儾皇腔陬A(yù)先強(qiáng)加在數(shù)據(jù)上的參數(shù)模型。相反,數(shù)據(jù)本身可以歸納決定風(fēng)險(xiǎn)模型的結(jié)構(gòu)。機(jī)器學(xué)習(xí)是一個(gè)廣泛的領(lǐng)域,包括一系列不同的算法和子方法,如分類和回歸樹、k-means聚類方法、貝葉斯網(wǎng)絡(luò)、人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)以及隨機(jī)森林和隨機(jī)梯度提升等集成方法。
機(jī)器學(xué)習(xí)方法已經(jīng)迅速廣泛地應(yīng)用于私營部門的許多類型的預(yù)測(cè)分析應(yīng)用中,如谷歌、微軟和亞馬孫等組織。對(duì)許多不同數(shù)據(jù)集的正式證明、模擬和比較普遍表明,機(jī)器學(xué)習(xí)方法提高了預(yù)測(cè)精度,超過了早期的參數(shù)統(tǒng)計(jì)方法,如邏輯回歸(18)Breiman, L. (1996). Bagging predictors. Machine Learning 26: 123—140.。然而,最近的研究發(fā)現(xiàn),機(jī)器學(xué)習(xí)算法在刑事司法中的表現(xiàn)并不比舊方法和簡單統(tǒng)計(jì)方法更好(19)Liu, Y.Y., Yang, M., Ramsey, M., Li, X., and Coid, J.W. (2011). A comparison of logistic regression, classification and regression tree, and neural network models in predicting violent re-offending. Journal of Quantitative Criminology 27: 547—573.。不過,證據(jù)的權(quán)重表明,預(yù)測(cè)的準(zhǔn)確性將取決于預(yù)測(cè)情況的復(fù)雜性(如“決策邊界”的復(fù)雜性)。當(dāng)單個(gè)項(xiàng)目以復(fù)雜的方式協(xié)同工作來預(yù)測(cè)風(fēng)險(xiǎn)時(shí),當(dāng)預(yù)測(cè)的風(fēng)險(xiǎn)是針對(duì)相對(duì)罕見的事件時(shí),如暴力累犯(20)Berk, R. and Bleich, J. (2013). Statistical procedures for forecasting criminal behavior: A comparative assessment. Criminology & Public Policy 12(3): 513—544.或性犯罪累犯(21)Duwe, G. (2017). Better practices in the development and validation of recidivism risk assessments: The Minnesota Sex Offender Screening Tool-4. Criminal Justice Policy Review. https://doi.org/10.1177%2F0887403417718608.,機(jī)器學(xué)習(xí)算法會(huì)更勝一籌。
描述機(jī)器學(xué)習(xí)的這種優(yōu)勢(shì)的一種方式是它從風(fēng)險(xiǎn)因素中“榨取更多水分”以獲得風(fēng)險(xiǎn)評(píng)分。在開發(fā)RNA工具時(shí),各種機(jī)器學(xué)習(xí)算法應(yīng)該與傳統(tǒng)的統(tǒng)計(jì)方法一起進(jìn)行測(cè)試,以確定哪種方法在特定應(yīng)用中效果最好。完全依賴舊的(如基于回歸的)統(tǒng)計(jì)方法的局限性太大,并且可能會(huì)產(chǎn)生在許多刑事司法應(yīng)用中所能達(dá)到的最低的預(yù)測(cè)準(zhǔn)確度。
為了說明機(jī)器學(xué)習(xí)如何在RNA工具上產(chǎn)生優(yōu)越的性能,決策邊界的概念是很重要的。決策邊界的目標(biāo)是區(qū)分兩個(gè)或更多的風(fēng)險(xiǎn)組。例如,決策邊界可能是區(qū)分慣犯和非慣犯。圖1和圖2顯示了一個(gè)決策邊界,其中評(píng)估工具只包括兩個(gè)項(xiàng)目(年齡和以前的犯罪記錄)。散點(diǎn)圖在Y軸上顯示了這個(gè)人之前被捕的次數(shù),在X軸上顯示了這個(gè)人現(xiàn)在的年齡。紅點(diǎn)代表慣犯,藍(lán)點(diǎn)代表非慣犯。開發(fā)一個(gè)好的RNA模型的目標(biāo)是在兩個(gè)二維數(shù)據(jù)之間畫一條線,這條線可以把慣犯(紅點(diǎn))和非慣犯(藍(lán)點(diǎn))最好地分開。在圖1中,用一條直線很容易做到這一點(diǎn)(請(qǐng)參閱從圖的左下角向上到右上方的直線)。圖2表示了一個(gè)更復(fù)雜的關(guān)系。通過圖2中的數(shù)據(jù)畫一條直線來區(qū)分慣犯和非慣犯則是次優(yōu)的。這條波浪線更能區(qū)分慣犯和非慣犯?,F(xiàn)在想象RNA工具有20個(gè)條目,而不是兩個(gè),這20個(gè)條目以一種復(fù)雜的(非線性的)方式相互關(guān)聯(lián)。這正是機(jī)器學(xué)習(xí)具有優(yōu)勢(shì)的原因。機(jī)器學(xué)習(xí)更適合于復(fù)雜的決策邊界問題?,F(xiàn)實(shí)生活中的預(yù)測(cè)問題往往面臨機(jī)器學(xué)習(xí)非常適合解決的那種復(fù)雜性。
圖1 簡單的決策邊界
圖2 復(fù)雜的決策邊界
有幾種統(tǒng)計(jì)方法可用于建立預(yù)測(cè)準(zhǔn)確性。表格1總結(jié)了一些常見的預(yù)測(cè)準(zhǔn)確度統(tǒng)計(jì)數(shù)據(jù)。
本節(jié)只討論表格1中兩個(gè)最常用的預(yù)測(cè)準(zhǔn)確性量值,因?yàn)槠渌恐挡惶S?。最常用的測(cè)量方法是曲線下的受試者工作特征區(qū)域,簡稱AUC。AUC通過表示在不同風(fēng)險(xiǎn)評(píng)分閾值下誤報(bào)和漏報(bào)之間的權(quán)衡在技術(shù)上量化了RNA工具的鑒別準(zhǔn)確性。第二個(gè)最常用的量值是基本準(zhǔn)確率統(tǒng)計(jì)(ACC)。ACC可以很容易地從分類表中生成。然而,與ACC相比,AUC的一個(gè)優(yōu)點(diǎn)是,它不是用于區(qū)分預(yù)測(cè)慣犯與非慣犯的預(yù)定分?jǐn)?shù)分界點(diǎn)的函數(shù)。AUC獨(dú)立于基本比率和選擇比率,因此通常是首選的預(yù)測(cè)準(zhǔn)確性量值。
AUC值的范圍從0到1,可能的最差分?jǐn)?shù)為0.5,可能的最佳分?jǐn)?shù)為1或0。解釋 AUC分?jǐn)?shù)的一種實(shí)用方法是在RNA工具上,慣犯得分高于非慣犯的時(shí)間百分比(得分越高意味著再犯的可能性越高)。AUC分?jǐn)?shù)為0.5意味著我們?cè)?0%的時(shí)間內(nèi)比較隨機(jī)的慣犯和非慣犯,慣犯的分?jǐn)?shù)高于非慣犯。這并不比拋硬幣好。另一方面,AUC得分為1意味著100%的情況下我們比較隨機(jī)的累犯和非累犯,累犯的得分高于非累犯。這將是完美的預(yù)測(cè)準(zhǔn)確性。
RNA工具可接受的AUC分?jǐn)?shù)的標(biāo)準(zhǔn)正在發(fā)生變化,部分原因是機(jī)器學(xué)習(xí)算法等新方法能夠更好地實(shí)現(xiàn)更高的預(yù)測(cè)準(zhǔn)確性(即更高的AUC分?jǐn)?shù))。經(jīng)常被引用的RNA工具的一個(gè)共識(shí)是,介于0.64和0.71之間的AUC評(píng)分是中度預(yù)測(cè),而高于0.71的AUC評(píng)分是高度預(yù)測(cè)(22)Rice, M.E. and Harris, G.T. (2005). Comparing effect sizes in follow-up studies: ROC area, Cohen’s d, and r. Law and Human Behavior 29(5): 615—620.。
最近對(duì)幾種常用RNA工具的預(yù)測(cè)有效性的總結(jié)表明,這些工具的平均AUC得分為0.68(23)U.S. Department of Justice, Office of the Attorney General. (2019). First Step Act of 2018: Risk and Needs Assessment. Washington, DC: U.S. Department of Justice, Office of the Attorney General.。然而,最新的、改進(jìn)后的工具持續(xù)產(chǎn)生的AUC得分遠(yuǎn)高于0.7。分?jǐn)?shù)在0.65到0.7之間的工具曾經(jīng)還是為人所接受的,但隨著這些新的標(biāo)準(zhǔn)在未來被采用,這一分?jǐn)?shù)可能不再為人所接受。此外,在創(chuàng)建RNA工具時(shí),還有其他需要平衡的目標(biāo),比如透明性、簡潔性(或節(jié)儉性)和公平性。從純有效性的角度來看,為了構(gòu)建一種使用AUC等常用度量來最大化實(shí)現(xiàn)預(yù)測(cè)有效性的工具,應(yīng)該考慮所有現(xiàn)代算法。
表1 預(yù)測(cè)準(zhǔn)確率的值
另一個(gè)有效性原則,也是RNA工具開發(fā)的最佳實(shí)踐和新指南的一部分,是創(chuàng)建本地化和定制化的工具。在懲教背景下使用RNA工具的歷史中,大部分都是使用現(xiàn)成的RNA工具。許多現(xiàn)成的工具都是專有的,而且仍在廣泛使用,例如修訂后的服務(wù)水平清單 (the Level of Service Inventory-Revised, LSI-R)、替代性制裁的懲教罪犯管理概況(Correctional Offender Management Profiling for Alternative Sanctions)以及俄亥俄州風(fēng)險(xiǎn)評(píng)估系統(tǒng)(Ohio Risk Assessment System)。不同司法管轄區(qū)的獨(dú)特方面及其所服務(wù)的人群會(huì)影響預(yù)測(cè)能力。
盡管現(xiàn)成的工具可能有一些優(yōu)點(diǎn),但也有許多缺點(diǎn)。RNA工具用來預(yù)測(cè)一些結(jié)果(通常是累犯),但也可以設(shè)計(jì)工具來預(yù)測(cè)審前釋放、假釋決定、監(jiān)室分類決定等。人們普遍認(rèn)為,多功能RNA工具可以用于許多刑事司法判決,無論它們是如何開發(fā)的。司法系統(tǒng)中的每個(gè)決策都不存在通用的RNA工具,用戶應(yīng)該確保工具潛在的應(yīng)用與工具的設(shè)計(jì)一致。
由于現(xiàn)成工具的局限性,司法管轄區(qū)可能會(huì)發(fā)現(xiàn)在本地創(chuàng)建、驗(yàn)證和重新驗(yàn)證RNA工具作為提高有效性的途徑會(huì)更好。該領(lǐng)域開始意識(shí)到現(xiàn)成的工具并非在所有背景或應(yīng)用中都一樣有效。例如,2003年以前,賓州懲教部一直使用修訂后的服務(wù)水平清單(LSI-R)作為其主要的RNA工具。
除了賓州懲教部門之外,美國的其他司法管轄區(qū)也設(shè)計(jì)并實(shí)施了本土的評(píng)估工具。在一項(xiàng)將現(xiàn)成的RNA工具(Static-99R)與本地開發(fā)的用于評(píng)估明尼蘇達(dá)州性犯罪者風(fēng)險(xiǎn)的本土RNA工具(MnSOST-3)進(jìn)行比較的研究中,作者發(fā)現(xiàn)本土的MnSOST-3在性犯罪累犯的兩種衡量標(biāo)準(zhǔn)上都優(yōu)于現(xiàn)成的Static-99R(Duwe and Rocque, 2018)。用體育類比,本土工具往往具有“主場(chǎng)優(yōu)勢(shì)”,這導(dǎo)致它們通常比現(xiàn)成的工具表現(xiàn)更好。
主場(chǎng)優(yōu)勢(shì)原則的另一個(gè)例子來自聯(lián)邦監(jiān)獄管理局(BOP)。根據(jù)《第一步法》(the First Step Act),聯(lián)邦監(jiān)獄管理局應(yīng)采用一種對(duì)其監(jiān)管人群有效的RNA工具。為了符合這一強(qiáng)制要求,他們創(chuàng)造了PATTERN的RNA工具。報(bào)告的作者明確說明了為什么不建議聯(lián)邦監(jiān)獄管理局簡單地采用來自另一個(gè)司法管轄區(qū)的現(xiàn)成RNA工具(24)U.S. Department of Justice, Office of the Attorney General. (2019). First Step Act of 2018: Risk and Needs Assessment. Washington, DC: U.S. Department of Justice, Office of the Attorney General.,因?yàn)樵S多現(xiàn)成的RNA工具都是以各州監(jiān)獄人口或懲教部門人口為基礎(chǔ)創(chuàng)建或驗(yàn)證的。州監(jiān)獄的在押罪犯通常比聯(lián)邦監(jiān)獄的在押罪犯有更多的犯罪歷史,包括更為普遍的暴力犯罪歷史。由于犯罪歷史的性質(zhì)和頻率幾乎總是RNA工具中的一個(gè)重要預(yù)測(cè)因素,如果聯(lián)邦監(jiān)獄管理局只是簡單采用主要在州監(jiān)獄的在押罪犯身上驗(yàn)證過的工具,那么州和聯(lián)邦在押罪犯之間的這種差異可能會(huì)對(duì)RNA工具的預(yù)測(cè)準(zhǔn)確性產(chǎn)生重要影響。
提高RNA驗(yàn)證有效性的另一個(gè)考慮是使用大數(shù)據(jù)。隨著計(jì)算能力的進(jìn)步,在構(gòu)建RNA工具時(shí)應(yīng)該考慮盡可能多的可用數(shù)據(jù)。開發(fā)一種具有高度預(yù)測(cè)能力的RNA工具的過程在很大程度上是一個(gè)理論練習(xí)。例如,如果鞋碼是累犯的一個(gè)重要預(yù)測(cè)指標(biāo),即使我們不能想出一個(gè)好的理論來解釋為什么,也要把鞋碼納入到工具中。RNA發(fā)展的科學(xué)是一個(gè)精算的過程,并不關(guān)心因果關(guān)系。正如效率原則中所討論的,我們不僅應(yīng)該考慮盡可能多的可行和可用的數(shù)據(jù),而且還應(yīng)該特別關(guān)注現(xiàn)有行政數(shù)據(jù)庫中的自動(dòng)化數(shù)據(jù)的應(yīng)用。
許多機(jī)構(gòu)在其行政數(shù)據(jù)庫中包含大量數(shù)據(jù)元素,從表面上看,這些數(shù)據(jù)可能與RNA相關(guān),也可能不相關(guān)?,F(xiàn)代計(jì)算和機(jī)器學(xué)習(xí)算法非常適合處理大量數(shù)據(jù)元素和大容量樣本。一個(gè)司法管轄區(qū)可能會(huì)考慮將來自其他機(jī)構(gòu)的數(shù)據(jù)進(jìn)行交叉鏈接并引入RNA工具。這在數(shù)據(jù)共享協(xié)議和信息技術(shù)基礎(chǔ)設(shè)施方面可能有難度,但這也可能顯著增強(qiáng)RNA工具的預(yù)測(cè)能力??鐧C(jī)構(gòu)數(shù)據(jù)共享正在成為公共部門多種用途的常見最佳實(shí)踐,公共衛(wèi)生就是一個(gè)很好的例子(25)U.S. Department of Health and Human Services, National Institutes of Health, National Institute on Aging. (2011). Harmonization Strategies for Behavioral, Social Science, and Genetic Research: Workshop Summary. Bethesda, MD: U.S. Department of Health and Human Services. https://www.nia.nih.gov/sites/default/files/d7/nia_bssg_harmonization_ summary_version_2-5-20122.pdf.。
RNA工具的設(shè)計(jì)目的不僅是明確一個(gè)人的需求領(lǐng)域,還可以評(píng)估他們的風(fēng)險(xiǎn)。RNA工具通??梢杂脭?shù)值表示。得到數(shù)值(風(fēng)險(xiǎn)評(píng)分)并完成配套需求評(píng)估后,就會(huì)得到對(duì)應(yīng)的結(jié)果。管理者將酌情考慮如何告知個(gè)人風(fēng)險(xiǎn)評(píng)分(以及需求領(lǐng)域)。讓工作人員與人們分享風(fēng)險(xiǎn)與需求信息是提高透明度的最高表現(xiàn)形式,這有助于提高公平、提高人們對(duì)風(fēng)險(xiǎn)因素的認(rèn)識(shí)和增強(qiáng)應(yīng)對(duì)風(fēng)險(xiǎn)的承諾。
該領(lǐng)域是一項(xiàng)創(chuàng)新,將風(fēng)險(xiǎn)溝通戰(zhàn)略作為手段使被評(píng)估人在應(yīng)對(duì)影響其參與犯罪的風(fēng)險(xiǎn)和需求時(shí)加以賦能。作為日常事務(wù)的一部分,懲教機(jī)構(gòu)的期望應(yīng)該是在每次會(huì)議上與他們分享RNA結(jié)果。然而,目前情況并非如此。首先,工作人員往往忽略監(jiān)督計(jì)劃或案例計(jì)劃中RNA工具的結(jié)果(26)Miller, J. and Maloney, C. (2013). Practitioner compliance with risk/needs assessment tools: A theoretical and empirical assessment. Criminal Justice and Behavior 40: 716—736. Viglione, J. and Taxman, F.S. (2018). Low risk offenders under probation supervision: Risk management and the risk-needs-responsivity (RNR) framework. Criminal Justice and Behavior 45(12): 1809—1831. https://doi.org/10.1177/0093854818790299.,原因在于工作人員對(duì)RNA結(jié)果的意義或如何向人們解釋RNA結(jié)果知之甚少(27)Magnuson, S., Kras, K., Aleandro, H., Rudes, D., and Taxman, F.S. (2019). Using plan- do-study-act and participatory action research to improve use of risk needs assessments. Corrections: Policy, Practice and Research 5(1): 44—63. doi: 10.1080/23774657.2018.1555442.。工作人員在分享風(fēng)險(xiǎn)信息時(shí)也可能會(huì)猶豫不決,因?yàn)樗麄儞?dān)心根據(jù)案件量將每個(gè)人分類到不同風(fēng)險(xiǎn)等級(jí)需要承擔(dān)相關(guān)的責(zé)任,或者他們對(duì)分?jǐn)?shù)進(jìn)行解釋時(shí)感覺到不適(28)Viglione, J., Rudes, D.S., and Taxman, F.S. (2015). Misalignment in supervision: Implementing risk/needs assessment instruments in probation. Criminal Justice and Behavior 42(3): 263—285.。例如,在緩刑辦公室進(jìn)行的一項(xiàng)研究中表明,公職人員沒有使用RNA工具是因?yàn)樗麄儾辉敢馀c被評(píng)估人討論RNA結(jié)果,特別是當(dāng)他們不了解某些分量表(29)Magnuson, S., Kras, K., Aleandro, H., Rudes, D., and Taxman, F.S. (2019). Using plan- do-study-act and participatory action research to improve use of risk needs assessments. Corrections: Policy, Practice and Research 5(1): 44—63. doi: 10.1080/23774657.2018.1555442.的時(shí)候。未能與被評(píng)估人溝通RNA信息是具體實(shí)施中的重大問題,因?yàn)樗麄儧]有與懲教機(jī)構(gòu)共享相同的信息。當(dāng)工作人員對(duì)被評(píng)估人風(fēng)險(xiǎn)行為的感知與每個(gè)人對(duì)自身風(fēng)險(xiǎn)的感知之間存在差異時(shí),就可能出現(xiàn)缺乏信息共享后的權(quán)力失衡。
分享信息應(yīng)該有助于被評(píng)估人應(yīng)對(duì)他們自己的行為,并在工作人員和他們之間就個(gè)人成功需要關(guān)注哪些行為和/或行動(dòng)建立一個(gè)平衡。實(shí)施風(fēng)險(xiǎn)溝通系統(tǒng)需要培訓(xùn)工作人員,并在懲教監(jiān)督的不同方面就使用RNA信息的問題制定機(jī)構(gòu)目標(biāo)。
司法系統(tǒng)尚未采納在醫(yī)學(xué)和其他領(lǐng)域中廣泛使用的風(fēng)險(xiǎn)溝通原則,該原則促進(jìn)涉及司法問題的人在知情的情況下作出決定。風(fēng)險(xiǎn)溝通可概括如下(30)World Health Organization. (2021). Risk Communication. https://www.who.int/ risk-communication/background/en/.:
風(fēng)險(xiǎn)溝通是指專家與面臨健康、經(jīng)濟(jì)或社會(huì)福祉威脅的人們之間交換實(shí)時(shí)信息、建議和意見。風(fēng)險(xiǎn)溝通的最終目的是讓處于風(fēng)險(xiǎn)中的人為保護(hù)自己和親人,能夠作出明智的決定。風(fēng)險(xiǎn)溝通需要多種溝通技巧,它需要對(duì)被評(píng)估人的看法、關(guān)注點(diǎn)、信念、知識(shí)以及實(shí)踐有充分的了解。它還需要盡早識(shí)別和管理謠言、錯(cuò)誤信息和其他挑戰(zhàn)。
風(fēng)險(xiǎn)溝通是以直接、不加評(píng)判的方式與被評(píng)估人共享敏感信息的過程。這種類型的溝通可以提高認(rèn)識(shí),鼓勵(lì)保護(hù)行為,建立他們對(duì)危害和風(fēng)險(xiǎn)的認(rèn)識(shí),幫助他們接受風(fēng)險(xiǎn)因素并實(shí)施變革,指導(dǎo)他們?nèi)绾螒?yīng)對(duì)風(fēng)險(xiǎn),并確保他們認(rèn)識(shí)到要對(duì)自己的行為負(fù)責(zé)(31)Walters, S.W., Ondersma, S.J., Ingersoll, K.S., Rodriguez, M., Lerch, J., and Taxman, F.S. (2014). MAPIT: Development of a web-based intervention targeting substance abuse treatment in the criminal justice system. Journal of Substance Abuse Treatment 46(1): 60—65.。共享困難的信息可以減少不確定性,并改善被評(píng)估人與工作人員之間的工作關(guān)系和信任程度。
健康和意識(shí)領(lǐng)域已經(jīng)確定了可適用于司法環(huán)境風(fēng)險(xiǎn)溝通的組成部分——因?yàn)樗痉ōh(huán)境承認(rèn)威懾是一個(gè)目標(biāo),這意味著某些行為是可取的和規(guī)范的,而另一些則不是。風(fēng)險(xiǎn)溝通實(shí)踐包括強(qiáng)調(diào)要傳達(dá)什么信息、如何傳達(dá)以及由誰傳達(dá)信息。信息發(fā)送者(懲教機(jī)構(gòu))設(shè)計(jì)信息的內(nèi)容,通過這些信息向被評(píng)估人傳達(dá)機(jī)構(gòu)傾向?qū)嵤┠男┬袨椤?/p>
溝通說服模型是支持風(fēng)險(xiǎn)溝通的經(jīng)典模型,它著眼于溝通的要素(來源是什么、信息是什么、使用什么技術(shù)來傳達(dá)信息、信息的去向)以及它如何影響參與態(tài)度和/或行為的改變(32)Glik, D.C. (2007). Risk communication for public health emergencies. Annual Review of Public Health 28(1): 33—54.。研究發(fā)現(xiàn),風(fēng)險(xiǎn)溝通在以下情況下更有效:(1) 信息來源被認(rèn)為是可信的;(2) 信息清晰具體,結(jié)果明確;(3) 信息能引起接收者的共鳴。高質(zhì)量的信息傳遞要求工作人員和案件中的當(dāng)事人了解風(fēng)險(xiǎn)評(píng)分是如何得出的,并且關(guān)于風(fēng)險(xiǎn)類別的信息對(duì)于信息被廣泛接受至關(guān)重要。從風(fēng)險(xiǎn)溝通的角度來看,我們有義務(wù)更加重視和關(guān)注影響工具質(zhì)量的方法和實(shí)施因素。
制作有關(guān)RNA工具的信息也可以參考健康信念模型。一個(gè)人越是意識(shí)到與他們的行為和態(tài)度相關(guān)的風(fēng)險(xiǎn),就越有可能采取行動(dòng)。當(dāng)被評(píng)估人相信風(fēng)險(xiǎn)是真實(shí)存在的,并且他們的行動(dòng)將導(dǎo)致更積極的行為時(shí),他們更可能采取積極的行動(dòng)。該模型還承認(rèn),行為改變的好處必須被成本(障礙)所抵消。因此,司法行動(dòng)(33)Sunshine, J. and Tyler, T.R. (2003). The role of procedural justice and legitimacy in shaping public support for policing. Law & Society Review 37: 513—548. doi: 10.1111/1540-5893.3703002.和決定的合法性會(huì)影響收益成本計(jì)算。被評(píng)估人普遍擔(dān)心,司法系統(tǒng)對(duì)“鎖定他們”的做法比行為改變更感興趣,這使得情況更加復(fù)雜。
保護(hù)動(dòng)機(jī)理論提供了一種計(jì)算方法,即在塑造被評(píng)估人的自我保護(hù)期望時(shí),威脅和應(yīng)對(duì)評(píng)估是很重要的(34)Glik, D.C. (2007). Risk communication for public health emergencies. Annual Review of Public Health 28(1): 33—54.。就司法系統(tǒng)而言,當(dāng)被評(píng)估人確定司法系統(tǒng)的意圖是積極的時(shí)候,應(yīng)激反應(yīng)可以被減輕。他們可以通過模仿他人來預(yù)判,特別是當(dāng)這個(gè)人具備技能以及自我效能時(shí),評(píng)估結(jié)果往往是積極的。
變化階段(思考前、思考中、行動(dòng)、維持等)(35)Prochaska, J.O., DiClemente, C.C., and Norcross, J.C. (1992). In search of how people change: Applications to addictive behaviors. American Psychologist 47(9): 1102—1114.可用于評(píng)估人們對(duì)結(jié)果預(yù)期處于什么階段。變化階段模型不僅表明每個(gè)階段需要不同的信息,而且還表明人們采取的行動(dòng)會(huì)各有不同。司法系統(tǒng)需要認(rèn)識(shí)處于不同階段反應(yīng)類型的變化,并意識(shí)到這些反應(yīng)是合法的。因此,當(dāng)被評(píng)估人處于預(yù)模板階段時(shí),可能沒有準(zhǔn)備好接受其風(fēng)險(xiǎn)水平,但可能準(zhǔn)備好去了解更多影響該風(fēng)險(xiǎn)水平的因素,而處于行動(dòng)階段的人們可能正在努力應(yīng)對(duì)風(fēng)險(xiǎn)因素。認(rèn)識(shí)到被評(píng)估人都在經(jīng)歷不同的階段是非常重要的,這些階段直接影響他們的反應(yīng)——從參與,到尋求知識(shí),到服從,再到積極行動(dòng)。在認(rèn)識(shí)到每一階段的同時(shí),傳達(dá)對(duì)個(gè)人行為的接受對(duì)于增強(qiáng)消息來源的可信度非常重要。
將消息定向到不同的受眾可以提高消息的利用率。有針對(duì)性受眾的消息應(yīng)該被設(shè)計(jì)、測(cè)試和使用。響應(yīng)度因素(性別、心理健康需求、種族和文化構(gòu)成等)應(yīng)根據(jù)不同類型的受眾加以考慮。我們知道年輕人就關(guān)于心理和生理上成熟問題的特定信息相較于其他信息有著不同的反應(yīng)。這表明為了提高信息的可信度而對(duì)風(fēng)險(xiǎn)類別的討論需要采取不同的方式。
因此,風(fēng)險(xiǎn)溝通文獻(xiàn)解釋說,僅僅向一個(gè)人提供風(fēng)險(xiǎn)分?jǐn)?shù)不足以幫助他們理解分?jǐn)?shù)的含義,如何使用分?jǐn)?shù)來改變態(tài)度或行為,或者幫助他們學(xué)習(xí)如何作出這樣的改變才是真正有意義的。鑒于工作人員和被評(píng)估人之間存在權(quán)力差異,一種共享的決策模式是非常有必要的。在這種模式下,人們具有發(fā)言權(quán)且他們的發(fā)言權(quán)對(duì)案例計(jì)劃的設(shè)計(jì)很重要。這種模式與說服方法的工作原理是一致的(36)Matejkowski, J., Lee, S., and Severson, M. (2018). Validation of a tool to measure attitudes among community corrections officers toward shared decision making with formerly incarcerated persons with mental illness. Criminal Justice and Behavior 45: 612—627.。
共享決策模式要求公職人員共享RNA信息,然后讓人們參與到有關(guān)監(jiān)督/案例/治療計(jì)劃的討論中并有權(quán)作出決定。
傳遞信息是風(fēng)險(xiǎn)溝通的關(guān)鍵。通過信息共享將問題可視化逐步取代通過文字來描述問題的傳統(tǒng)方法。網(wǎng)絡(luò)療法、手機(jī)和應(yīng)用程序的激增提高了人們對(duì)視覺信息和多媒體信息的熱情。使用圖形或技術(shù)傳達(dá)風(fēng)險(xiǎn)評(píng)分的含義將大大加強(qiáng)溝通。在最近的一項(xiàng)通過網(wǎng)絡(luò)干預(yù)來分享動(dòng)機(jī)的研究中(37)Walters, S.W., Ondersma, S.J., Ingersoll, K.S., Rodriguez, M., Lerch, J., and Taxman,F.S. (2014). MAPIT: Development of a web-based intervention targeting substance abuse treatment in the criminal justice system. Journal of Substance Abuse Treatment 46(1): 60—65.,為了鼓勵(lì)人們了解自己的風(fēng)險(xiǎn)行為,各種圖形被用來傳達(dá)復(fù)雜的信息。該研究發(fā)現(xiàn),當(dāng)通過RNA收集信息的攝入過程時(shí),視覺信息對(duì)人們?cè)谥委煏r(shí)的超額攝入產(chǎn)生了影響(38)Lerch, J.L., Tang, L., Walters, S., and Taxman, F.S. (2017). Effectiveness of a computerized motivational intervention on treatment initiation and substance use: Results from a randomized trial. Journal of Substance Abuse Treatment 80: 59—66.。網(wǎng)絡(luò)工具提高了治療參與度,識(shí)別了促使被評(píng)估人作出改變的關(guān)鍵因素,并且是具有成本效益的(39)Cowell, A., Zarkin, G., Wedehase, B.J., Lerch, J.A., Walters, S., and Taxman, F.S. (2018). Cost and cost-effectiveness of computerized vs. in-person motivational interventions in the criminal justice system. Journal of Substance Abuse Treatment 87(2): 42—49. Spohr, S., Walters, S., and Taxman, F.S. (2017). People’s reasons for wanting to complete probation: Use and predictive validity in an e-health intervention. Evaluation & Program Planning 61: 144—149.。
一個(gè)全面的風(fēng)險(xiǎn)溝通系統(tǒng)整合了來自RNA的信息,并部分關(guān)聯(lián)了懲戒控制過程。也就是說,除了依靠工作人員從RNA傳輸信息之外,應(yīng)該將RNA信息構(gòu)建到懲戒控制過程的各個(gè)步驟中。良好的溝通系統(tǒng)有助于指導(dǎo)被評(píng)估人完成文書工作,并且可以:(1)為罪犯量身定制反饋;(2)提出意見、信息和建議;(3) 將他們的反應(yīng)聯(lián)系起來,幫助他們作出與受懲戒控制相一致的各種選擇的決定。它可以提供反饋循環(huán),幫助被評(píng)估人將他們的反應(yīng)與某些風(fēng)險(xiǎn)和需求因素聯(lián)系起來。這減輕了被評(píng)估人整合和評(píng)估眾多預(yù)測(cè)因素的負(fù)擔(dān),并允許他們根據(jù)自身的再犯風(fēng)險(xiǎn)和犯罪需求來考慮個(gè)人目標(biāo)。
與單純的工具相比,風(fēng)險(xiǎn)溝通系統(tǒng)的優(yōu)勢(shì)在于它提供了一個(gè)綜合模型來支持決策。以下示例說明了如何將信息傳輸并集成到不同類型的監(jiān)督或糾正控制過程中。目前,我們不清楚是否有任何美國懲教機(jī)構(gòu)使用風(fēng)險(xiǎn)溝通系統(tǒng),然而,這樣的系統(tǒng)將有助于推進(jìn)RNA的實(shí)施和使用——這是該領(lǐng)域需要的一項(xiàng)創(chuàng)新。風(fēng)險(xiǎn)溝通將注意力集中在為促進(jìn)行為改變而傳達(dá)的信息上,而目前的做法更側(cè)重于使用工具。能夠納入風(fēng)險(xiǎn)溝通系統(tǒng)的示例包括:
1.案例計(jì)劃改進(jìn)。德克斯曼和考蒂(Taxman and Caudy,)說明了一些罪犯模式的類型(40)Taxman, F.S. and Caudy, M. (2015). Risk tells us who, but not what or how: Empirical assessment of the complexity of criminogenic needs to inform correctional programming. Criminology & Public Policy 14(1): 71—103.,這些類型適用于矯正計(jì)劃、監(jiān)督協(xié)議或?qū)嵺`指南。通過RNA系統(tǒng)使用各種統(tǒng)計(jì)方法,這些類型可以被生成。如表2所示,算法可用于定義類型并幫助創(chuàng)建原型監(jiān)督或案例管理計(jì)劃。
表2 可能的類型示例
2.治療匹配算法。RNA信息和類型可以通過算法得到支持,這些算法根據(jù)程序的關(guān)鍵特征將人們與適當(dāng)?shù)某绦蛳嗥ヅ洹_@將允許人們查看最合適的治療類別。計(jì)算機(jī)生成的治療匹配列表可能有助于人們參與這些服務(wù)(41)Taxman, F.S. and Pattavina, A. (2013). Simulation Strategies to Reduce Recidivism: Risk Need Responsivity (RNR) Modeling in the Criminal Justice System. New York: Springer.。
3.案例計(jì)劃部分。案例管理可以幫助人們概述其短期和長期目標(biāo),通過具體的行動(dòng)步驟減少再犯。案例規(guī)劃工具從需求開始,例如藥物測(cè)試和面對(duì)面接觸的頻率,再關(guān)注風(fēng)險(xiǎn)和需求因素。
4.提供持續(xù)計(jì)劃程序。案例計(jì)劃的連續(xù)過程使人們?cè)诔C治期間以減少再犯為目標(biāo)。這一程序建立在一個(gè)擴(kuò)展模型中,一個(gè)人在下一次任命之前完成進(jìn)度報(bào)告,這些進(jìn)度報(bào)告是監(jiān)督會(huì)議的討論焦點(diǎn)。
5.分級(jí)制裁/激勵(lì)措施。研究表明,在引導(dǎo)行為改變方面,激勵(lì)比制裁更有效(42)Sloas, L., Wooditch, A., Murphy, A., and Taxman, F.S. (2019). Assessing the use and impact of points and rewards across four federal probation districts: A contingency management approach. Victims & Offenders 14(7): 811—831. Mowen, T.J., Wodahl, E., and Garland, B. (2018). The role of sanctions and incentives in promoting successful reentry: Evidence from the SVORI data. Criminal Justice and Behavior 45(8): 1288—1307.,整合過程應(yīng)建立在確認(rèn)進(jìn)展和進(jìn)步的警戒中。此外,當(dāng)個(gè)人不遵守系統(tǒng)時(shí),系統(tǒng)可以突出顯示。
對(duì)公平、效率、有效性和溝通這四項(xiàng)原則的回顧不僅說明了RNA工具在設(shè)計(jì)和使用方面的復(fù)雜性,還說明了關(guān)注設(shè)計(jì)和實(shí)施的重要性。這四項(xiàng)原則對(duì)于提高RNA工具的透明度和提供管理其開發(fā)和實(shí)施的基本準(zhǔn)則非常重要。對(duì)這些原則的依賴可以幫助RNA工具減少差異,實(shí)現(xiàn)更好的降低再犯結(jié)果。以下是四項(xiàng)原則的主要組成部分的簡述:
1.RNA工具可以在設(shè)計(jì)和使用中促進(jìn)決策的公平性。
處理前、處理中和處理后調(diào)整是有助于最小化偏差的設(shè)計(jì)策略。
向最需要改造計(jì)劃的高風(fēng)險(xiǎn)人群提供更多的支持和矯治資源——應(yīng)用風(fēng)險(xiǎn)原則并針對(duì)特定的犯罪需求——可以幫助實(shí)現(xiàn)更公平的結(jié)果。
2.RNA工具的效率可以通過采用自動(dòng)化和計(jì)算機(jī)輔助評(píng)分過程來提高可靠性、有效性和評(píng)估能力。
如果必須手動(dòng)對(duì)RNA工具進(jìn)行評(píng)分,則必須進(jìn)行評(píng)分員間可靠性評(píng)估以確保工作人員之間評(píng)分的充分一致性。
3.當(dāng)使用更先進(jìn)的算法時(shí),RNA工具可以實(shí)現(xiàn)更好的預(yù)測(cè)性能。
盡管開發(fā)人員應(yīng)該測(cè)試多種算法以確定哪種算法性能最好,機(jī)器學(xué)習(xí)算法通常有助于提高預(yù)測(cè)精度。
針對(duì)矯正人群定制的RNA工具將提供更好的預(yù)測(cè)性能。
4.RNA工具可以通過使用風(fēng)險(xiǎn)溝通策略,將RNA信息與人們的行動(dòng)步驟聯(lián)系起來,從而實(shí)現(xiàn)公平相關(guān)的目標(biāo)與更大福祉。
培訓(xùn)使用RNA工具的懲教人員對(duì)于有效溝通至關(guān)重要,尤其是關(guān)于如何解釋RNA并將其轉(zhuǎn)化為案例計(jì)劃。
風(fēng)險(xiǎn)溝通系統(tǒng)為決策提供了一個(gè)綜合模型。
該系統(tǒng)包括監(jiān)管計(jì)劃改進(jìn)、治療匹配算法以及分級(jí)制裁和激勵(lì)。
綜合模型有助于提高人們對(duì)自身環(huán)境與改造計(jì)劃需求的認(rèn)識(shí)。
本文確定的原則和指南代表了一種在設(shè)計(jì)和使用RNA工具進(jìn)行矯正中相對(duì)創(chuàng)新的方法。我們不清楚美國是否有司法管轄區(qū)完全適用了四項(xiàng)原則中包含的所有準(zhǔn)則。然而,如果這些指南得到充分實(shí)施,我們預(yù)計(jì)RNA工具將更加可靠、高效和有效,特別是在提高預(yù)測(cè)性能方面。我們認(rèn)為,全面實(shí)施不僅會(huì)使RNA工具的使用更負(fù)責(zé)任、更合乎道德,而且會(huì)為矯正人群和系統(tǒng)帶來更好、更公平的結(jié)果。
雖然我們的論文主要集中在風(fēng)險(xiǎn)評(píng)估上,但我們認(rèn)為類似的審查對(duì)于需求評(píng)估也是必要的。最近,由于預(yù)處理和處理中的方法不佳,人們對(duì)RNA工具中的需求評(píng)估類別領(lǐng)域提出了許多擔(dān)憂(43)Ward, T. and Fortune, C.-A. (2016). The role of dynamic risk factors in the explanation of offending. Aggression and Violent Behavior 29: 79—88. https://doi.org/10.1016/ j.avb.2016.06.007.。如果需求評(píng)估提升到了與最近應(yīng)用于風(fēng)險(xiǎn)評(píng)估相同的審查水平,我們預(yù)計(jì)它將進(jìn)一步改進(jìn)RNA工具的設(shè)計(jì)和實(shí)施,并改進(jìn)所做的決策。