一、引言
近年來(lái),我國(guó)電信網(wǎng)絡(luò)詐騙犯罪呈現(xiàn)高發(fā)多發(fā)態(tài)勢(shì),尤其是不法分子利用老年群體在信息甄別、風(fēng)險(xiǎn)識(shí)別及防范能力上的弱勢(shì),將詐騙偽裝成養(yǎng)老服務(wù)、保健品銷售或理財(cái)投資等形式,使老年群體逐步成為詐騙犯罪的主要目標(biāo)。針對(duì)這一日益嚴(yán)峻的社會(huì)問(wèn)題,國(guó)家加大了法律與政策層面的治理力度,《中華人民共和國(guó)反電信網(wǎng)絡(luò)詐騙法》(以下簡(jiǎn)稱《反電詐法》)于2022年正式實(shí)施,標(biāo)志著我國(guó)電信網(wǎng)絡(luò)詐騙犯罪治理策略由事后懲治向前端預(yù)防與控制轉(zhuǎn)型。1]《反電詐法》的出臺(tái)不僅加大了電信網(wǎng)絡(luò)詐騙犯罪的打擊與治理力度,也明確了對(duì)包括老年群體在內(nèi)的高風(fēng)險(xiǎn)群體的特殊保護(hù)原則?!斗措娫p法》第8條明確規(guī)定,有關(guān)部門應(yīng)當(dāng)“結(jié)合電信網(wǎng)絡(luò)詐騙受害群體的分布等特征,加強(qiáng)對(duì)老年人、青少年等群體的宣傳教育,增強(qiáng)反電信網(wǎng)絡(luò)詐騙宣傳教育的針對(duì)性、精準(zhǔn)性”。這一條款不僅凸顯了老年群體在詐騙犯罪防范體系中的特殊地位,也表明法律層面已認(rèn)識(shí)到不同群體被害風(fēng)險(xiǎn)的差異性,需要采取有針對(duì)性的干預(yù)措施。因此,深入探討老年群體的詐騙被害風(fēng)險(xiǎn)因素,不僅有助于揭示老年群體被害的具體機(jī)制,也能為精準(zhǔn)制定防范策略提供實(shí)證支持,使《反電詐法》的相關(guān)規(guī)定更具實(shí)效性和可操作性。
關(guān)于老年群體詐騙被害風(fēng)險(xiǎn),已有研究主要從人口學(xué)、經(jīng)濟(jì)學(xué)、老年學(xué)、社會(huì)學(xué)和犯罪學(xué)等多個(gè)學(xué)科展開(kāi)討論,重點(diǎn)考察個(gè)體特征、財(cái)務(wù)狀況、認(rèn)知能力、日常活動(dòng)模式及重復(fù)被害機(jī)制等因素的作用。盡管這些研究為理解老年群體詐騙被害的成因提供了有益的視角,但仍然存在一些局限性。首先,絕大多數(shù)實(shí)證研究基于“理論先行—數(shù)據(jù)驗(yàn)證”的定量研究框架,采用假設(shè)演繹邏輯和相關(guān)或回歸模型等量化方法來(lái)分析某些風(fēng)險(xiǎn)因素與老年群體詐騙被害之間的相關(guān)性。然而,較少有研究深人探討這些風(fēng)險(xiǎn)因素的“預(yù)測(cè)力”或效應(yīng)大小。盡管這些研究能夠發(fā)現(xiàn)風(fēng)險(xiǎn)因素與詐騙被害之間存在顯著相關(guān)性,但對(duì)其實(shí)際影響力或預(yù)測(cè)能力的評(píng)估相對(duì)不足。其次,受限于學(xué)科背景,現(xiàn)有研究多集中于某一特定領(lǐng)域的變量對(duì)老年群體詐騙被害的影響,或基于某一領(lǐng)域的理論提出相應(yīng)的假設(shè),并通過(guò)數(shù)據(jù)驗(yàn)證這些假設(shè)。然而,較少有研究橫向比較不同領(lǐng)域風(fēng)險(xiǎn)因素的貢獻(xiàn)大小,進(jìn)而識(shí)別出對(duì)老年群體詐騙被害影響最為關(guān)鍵的因素。最后,大多數(shù)研究假設(shè)風(fēng)險(xiǎn)因素與詐騙被害之間存在線性關(guān)系,然而這種假設(shè)可能無(wú)法充分反映風(fēng)險(xiǎn)因素與詐騙被害之間的復(fù)雜作用機(jī)制。
基于此,本研究利用2018年“中國(guó)健康與養(yǎng)老追蹤調(diào)查”(China Healthand RetirementLongitudinal Study,CHARLS)數(shù)據(jù),[2]綜合考察各領(lǐng)域的風(fēng)險(xiǎn)因素,重點(diǎn)探討其預(yù)測(cè)能力。本研究采用數(shù)據(jù)驅(qū)動(dòng)的“計(jì)算扎根”方法,[3]構(gòu)建全面的詐騙被害預(yù)測(cè)模型,量化各個(gè)風(fēng)險(xiǎn)因素與詐騙被害之間的關(guān)系。本研究橫向比較不同領(lǐng)域風(fēng)險(xiǎn)因素的相對(duì)影響力,旨在識(shí)別出最關(guān)鍵的因素,為未來(lái)詐騙被害的精準(zhǔn)預(yù)測(cè)提供依據(jù)。此外,本研究通過(guò)沙普利值(Shapley Additive Explanations,以下簡(jiǎn)稱“SHAP值”)解釋方法,深入分析各風(fēng)險(xiǎn)因素與老年群體詐騙被害之間的具體作用機(jī)制。
二、文獻(xiàn)綜述
(一)老年群體詐騙被害的風(fēng)險(xiǎn)因素
近年來(lái),學(xué)界圍繞老年群體的詐騙被害風(fēng)險(xiǎn)展開(kāi)了多學(xué)科研究,涉及人口學(xué)、經(jīng)濟(jì)學(xué)、老年學(xué)、社會(huì)學(xué)及犯罪學(xué)等領(lǐng)域。研究主要探討個(gè)體特征、財(cái)務(wù)狀況、心理認(rèn)知能力、日?;顒?dòng)模式及重復(fù)被害機(jī)制對(duì)詐騙風(fēng)險(xiǎn)的影響,并逐步形成了系統(tǒng)的理論框架和實(shí)證基礎(chǔ)。
其一,人口特征在詐騙被害風(fēng)險(xiǎn)中有著重要影響。研究表明,年齡、性別及受教育程度均與詐騙風(fēng)險(xiǎn)密切相關(guān)。一般而言,低齡和中齡老年人由于身體狀況較好,參與社會(huì)經(jīng)濟(jì)活動(dòng)的頻率較高,因此暴露于詐騙環(huán)境的可能性更大,而高齡老年人因行動(dòng)受限,相對(duì)較少接觸詐騙信息,受害風(fēng)險(xiǎn)較低。4]此外,性別也對(duì)詐騙受害風(fēng)險(xiǎn)產(chǎn)生影響,老年女性更容易成為詐騙、盜竊等犯罪的目標(biāo)。與此同時(shí),受教育程度也影響老年人的詐騙易感性。5]受教育程度較低的老年人因認(rèn)知水平較低、迷信觀念較重、維權(quán)意識(shí)薄弱,更容易受到詐騙分子的誘騙。
其二,財(cái)務(wù)狀況和資產(chǎn)結(jié)構(gòu)等經(jīng)濟(jì)因素也對(duì)詐騙風(fēng)險(xiǎn)具有顯著影響。研究發(fā)現(xiàn),具有較高財(cái)產(chǎn)積累或養(yǎng)老金支持的老年人更容易成為金融詐騙的目標(biāo),尤其是在養(yǎng)老投資、保健品銷售等領(lǐng)域。此外,關(guān)于收人水平與詐騙風(fēng)險(xiǎn)的關(guān)系,James等人的研究表明,詐騙易感性與收人水平呈負(fù)相關(guān),即收入越高的個(gè)體對(duì)詐騙的防范能力更強(qiáng)。7」但Reyns的研究則發(fā)現(xiàn),高收入者的詐騙損失概率更高,可能是因?yàn)槠溆懈嗫晒┰p騙分子獲取的資金。8]
其三,老年學(xué)與社會(huì)學(xué)研究強(qiáng)調(diào)心理認(rèn)知能力及社會(huì)支持網(wǎng)絡(luò)在詐騙被害中的作用。研究發(fā)現(xiàn),心理健康狀況不佳的老年人受騙風(fēng)險(xiǎn)顯著增加,抑郁、焦慮等負(fù)面情緒會(huì)削弱個(gè)體的風(fēng)險(xiǎn)防范意識(shí)。9]Lichtenberg等人的研究指出,抑郁程度較高、社會(huì)需求未被滿足的老年人,其受騙風(fēng)險(xiǎn)是其他群體的3倍[10]相反,積極的情緒管理和穩(wěn)定的社會(huì)支持有助于降低受騙可能性。認(rèn)知能力的下降也是老年人詐騙被害的重要預(yù)測(cè)因素。即便沒(méi)有明顯的神經(jīng)或精神疾病,老年人的信息識(shí)別能力、邏輯推理能力及問(wèn)題解決能力仍會(huì)隨著年齡增長(zhǎng)而下降,]從而影響其對(duì)詐騙信息的判斷。此外,身體健康狀況亦與詐騙風(fēng)險(xiǎn)密切相關(guān)。DeLiema的研究表明,身體狀況較差的老年人由于反應(yīng)能力下降、家庭成員關(guān)注度較低,更容易被詐騙分子鎖定。特別是在家庭支持和社會(huì)網(wǎng)絡(luò)較為薄弱的情況下,詐騙分子更易對(duì)其實(shí)施金融剝削。12]
其四,犯罪學(xué)研究主要采用日?;顒?dòng)理論(routine activity theory)和生活方式暴露理論(lifestyle exposure theory)等被害人學(xué)理論來(lái)解釋老年群體詐騙被害。研究發(fā)現(xiàn),老年人的日常活動(dòng)直接影響其受騙風(fēng)險(xiǎn)。一方面,積極的社交和信息獲取行為有助于增強(qiáng)老年人的防騙意識(shí)。例如,使用互聯(lián)網(wǎng)等新興媒介可以提高信息甄別能力,降低受騙風(fēng)險(xiǎn)。但另一方面,特定活動(dòng)也可能增加了詐騙暴露的可能性[13]此外,犯罪學(xué)研究也關(guān)注詐騙的重復(fù)被害現(xiàn)象。研究發(fā)現(xiàn),先前的詐騙被害經(jīng)歷顯著增加了個(gè)體未來(lái)再次遭遇詐騙的可能性。14]
(二)計(jì)算扎根方法在養(yǎng)老詐騙研究中的適用性
1.計(jì)算扎根方法的理論背景
在過(guò)去40年的社會(huì)科學(xué)研究中,定量研究主要采用理論驅(qū)動(dòng)的范式,即基于理論構(gòu)建經(jīng)驗(yàn)假設(shè),并利用相關(guān)分析或回歸模型檢驗(yàn)變量之間的關(guān)系[15]這種“理論先行—數(shù)據(jù)驗(yàn)證”的方法在完善現(xiàn)有理論、提高解釋力方面具有重要作用,但也存在一定局限性。研究者在既有理論框架的影響下,可能難以識(shí)別新的變量或提出創(chuàng)新性的解釋路徑,從而限制了其對(duì)復(fù)雜社會(huì)現(xiàn)象的深層理解。數(shù)據(jù)驅(qū)動(dòng)的方法則強(qiáng)調(diào)從數(shù)據(jù)中發(fā)現(xiàn)模式,而非依賴預(yù)設(shè)假設(shè)進(jìn)行驗(yàn)證。這一思路早在涂爾干的自殺研究中便已有所體現(xiàn),但由于數(shù)據(jù)資源和計(jì)算技術(shù)的限制,長(zhǎng)期以來(lái)未能得到廣泛應(yīng)用。[16]然而,隨著計(jì)算機(jī)技術(shù)、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的快速發(fā)展,數(shù)據(jù)驅(qū)動(dòng)方法的應(yīng)用潛力逐漸顯現(xiàn),成為社會(huì)科學(xué)研究的重要工具。
Hofman等人基于可解釋性與預(yù)測(cè)性,將計(jì)算社會(huì)科學(xué)研究方法劃分為4個(gè)象限,其中數(shù)據(jù)驅(qū)動(dòng)的描述性統(tǒng)計(jì)與預(yù)測(cè)模型主要用于探索性研究,而理論驅(qū)動(dòng)的因果分析結(jié)合數(shù)據(jù)驅(qū)動(dòng)的預(yù)測(cè)能力則形成了驗(yàn)證性研究。17]此外,胡安寧等人提出,機(jī)器學(xué)習(xí)算法在處理效應(yīng)異質(zhì)性方面具有顯著優(yōu)勢(shì),并通過(guò)中國(guó)精英大學(xué)教育回報(bào)的異質(zhì)性研究進(jìn)行了實(shí)證驗(yàn)證[18]羅家德等結(jié)合科學(xué)理論、調(diào)查方法與大數(shù)據(jù)挖掘,構(gòu)建并修正了中國(guó)人脈圈的分類模型。19]周濤等則利用數(shù)據(jù)驅(qū)動(dòng)方法研究了影響團(tuán)隊(duì)創(chuàng)新的關(guān)鍵因素[20]在此背景下,陳茁和陳云松提出了“計(jì)算扎根”的概念,即一種基于機(jī)器學(xué)習(xí)和大數(shù)據(jù)的量化理論生產(chǎn)方法,旨在結(jié)合數(shù)據(jù)驅(qū)動(dòng)的探索能力與理論驗(yàn)證的嚴(yán)謹(jǐn)性。[21]
計(jì)算扎根方法的核心優(yōu)勢(shì)在于發(fā)現(xiàn)和歸納數(shù)據(jù)中的潛在模式,特別適用于研究變量關(guān)系復(fù)雜、理論框架尚不完備的社會(huì)科學(xué)問(wèn)題。老年群體的詐騙被害風(fēng)險(xiǎn)因素涉及人口特征、經(jīng)濟(jì)狀況、認(rèn)知能力、社會(huì)活動(dòng)模式及行為特征等多維變量,單一理論框架難以充分揭示其復(fù)雜性和異質(zhì)性。因此,計(jì)算扎根方法能夠借助大數(shù)據(jù)與機(jī)器學(xué)習(xí)挖掘新的潛在風(fēng)險(xiǎn)因素,并量化各因素的影響力,從而拓展養(yǎng)老詐騙研究的理論視角。
2.計(jì)算扎根方法的研究路徑
計(jì)算扎根方法基于扎根理論的歸納邏輯和因果關(guān)系的預(yù)測(cè)邏輯,主要通過(guò)兩個(gè)步驟來(lái)實(shí)現(xiàn):一是通過(guò)監(jiān)督學(xué)習(xí)的算法模型進(jìn)行社會(huì)預(yù)測(cè),二是通過(guò)解釋黑箱模型的歸因算法來(lái)比較各個(gè)特征的預(yù)測(cè)力。
首先,由算法模型擬合得到社會(huì)預(yù)測(cè)。相較于傳統(tǒng)的計(jì)量模型(如線性回歸模型),機(jī)器學(xué)習(xí)算法不依賴于數(shù)據(jù)的內(nèi)在分布或預(yù)設(shè)關(guān)系,而是通過(guò)優(yōu)化算法,使特征變量( X )能夠準(zhǔn)確預(yù)測(cè)被解釋變量(Y)。這一特點(diǎn)使其尤其適用于處理高維度、非線性及復(fù)雜交互作用的數(shù)據(jù)結(jié)構(gòu)。近年來(lái),機(jī)器學(xué)習(xí)方法已廣泛應(yīng)用于分類、回歸、聚類及預(yù)測(cè)等社會(huì)科學(xué)研究任務(wù)。22]常見(jiàn)的機(jī)器學(xué)習(xí)方法包括監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、半監(jiān)督學(xué)習(xí)等不同類別。23]本研究采用隨機(jī)森林分類算法進(jìn)行養(yǎng)老詐騙被害風(fēng)險(xiǎn)的預(yù)測(cè)。隨機(jī)森林作為一種監(jiān)督學(xué)習(xí)方法,通過(guò)集成多個(gè)決策樹(shù)來(lái)優(yōu)化模型性能,從而提高預(yù)測(cè)的準(zhǔn)確性和穩(wěn)健性。相較于其他監(jiān)督學(xué)習(xí)算法,隨機(jī)森林展現(xiàn)出多個(gè)優(yōu)勢(shì)。第一,與支持向量機(jī)相比,隨機(jī)森林通過(guò)集成學(xué)習(xí)有效降低了過(guò)擬合風(fēng)險(xiǎn),尤其在大規(guī)模數(shù)據(jù)處理時(shí)具有較強(qiáng)的適應(yīng)性。24]第二,與神經(jīng)網(wǎng)絡(luò)相比,隨機(jī)森林的計(jì)算結(jié)構(gòu)更為簡(jiǎn)潔,計(jì)算成本較低,無(wú)須依賴大量的先驗(yàn)知識(shí)即可直接進(jìn)行數(shù)據(jù)分類和特征學(xué)習(xí)。25」第三,隨機(jī)森林對(duì)噪聲和異常值具有較強(qiáng)的穩(wěn)健性,相較于對(duì)噪聲敏感的梯度提升算法,其抗噪能力更強(qiáng)。[26]
其次,本研究通過(guò)解釋模型的歸因算法分析影響機(jī)制。傳統(tǒng)的機(jī)器學(xué)習(xí)模型雖然在提高預(yù)測(cè)準(zhǔn)確性方面表現(xiàn)優(yōu)越,但“黑箱”特性使其難以直觀理解各特征變量對(duì)預(yù)測(cè)結(jié)果的具體影響。因此,近年來(lái),研究者提出了一系列可解釋性方法,如 SHAP值、置換特征重要性、部分依賴圖等,用于分析機(jī)器學(xué)習(xí)模型中的特征貢獻(xiàn)度。27]
最后,本研究采用SHAP值解釋方法對(duì)模型進(jìn)行拆解,以解釋特征對(duì)預(yù)測(cè)結(jié)果的貢獻(xiàn)度。SHAP值主要用于衡量各特征對(duì)模型預(yù)測(cè)結(jié)果的邊際貢獻(xiàn)。其基本原理是通過(guò)計(jì)算某個(gè)特征在模型中加人或移除時(shí)對(duì)預(yù)測(cè)結(jié)果產(chǎn)生的影響,來(lái)評(píng)估該特征的重要性。通過(guò)對(duì)各特征邊際貢獻(xiàn)的所有可能排列取平均值,最終得到每個(gè)特征的 SHAP值。與其他解釋性方法相比,SHAP 值的優(yōu)勢(shì)在于,其不僅能夠準(zhǔn)確評(píng)估特征的重要性,還能夠捕捉模型中的非線性關(guān)系和特征之間的交互作用。該方法能夠滿足可加性、對(duì)稱性、零貢獻(xiàn)特征的冗余性和效率等條件,并能全面、準(zhǔn)確地反映機(jī)器學(xué)習(xí)模型處理信息的內(nèi)在邏輯,因此在解釋復(fù)雜模型時(shí)具有重要作用。28]
3.計(jì)算扎根運(yùn)用的可行性
計(jì)算扎根方法在社會(huì)科學(xué)研究中展現(xiàn)出較強(qiáng)的探索能力和理論構(gòu)建潛力,盡管目前尚未有研究將其應(yīng)用于養(yǎng)老詐騙風(fēng)險(xiǎn)分析,但近年來(lái)一些研究已開(kāi)始利用機(jī)器學(xué)習(xí)預(yù)測(cè)模型識(shí)別詐騙被害風(fēng)險(xiǎn)。例如,XuLiang等人運(yùn)用隨機(jī)森林模型,探索社會(huì)人口特征和心理因素對(duì)詐騙易感性的影響,并通過(guò)特征重要性分析不同變量對(duì)詐騙易感性的貢獻(xiàn)[29]Xu Liuchang 等人基于詐騙的兩階段框架,采用隨機(jī)森林分類模型,分別構(gòu)建詐騙暴露識(shí)別和詐騙被害識(shí)別模型,以評(píng)估預(yù)測(cè)效果并探討個(gè)體特征的影響。30]此外,Xu Liang等人進(jìn)一步納入地理環(huán)境因素,發(fā)現(xiàn)部分地理變量對(duì)詐騙暴露和被害風(fēng)險(xiǎn)具有正向預(yù)測(cè)作用。31]
當(dāng)然,現(xiàn)有研究大多數(shù)仍局限于單一或少量因素,較少有研究整合跨領(lǐng)域的個(gè)體特征并采用機(jī)器學(xué)習(xí)進(jìn)行綜合預(yù)測(cè),且在機(jī)器學(xué)習(xí)模型的解釋方面仍存在局限。上述研究主要基于特征重要性排序來(lái)評(píng)估各變量對(duì)詐騙風(fēng)險(xiǎn)的影響。例如,XuLiang等人僅利用隨機(jī)森林模型的特征重要性衡量詐騙易感性的關(guān)鍵因素。[32]這些研究未能進(jìn)一步探討風(fēng)險(xiǎn)因素如何具體影響詐騙被害風(fēng)險(xiǎn),即缺乏對(duì)變量之間作用機(jī)制的深入解析。
基于此,本研究采用計(jì)算扎根方法,不僅通過(guò)機(jī)器學(xué)習(xí)模型提高詐騙被害風(fēng)險(xiǎn)的預(yù)測(cè)能力,同時(shí)也結(jié)合可解釋性算法解析各風(fēng)險(xiǎn)因素的具體影響機(jī)制,以期在養(yǎng)老詐騙研究中構(gòu)建更完整的預(yù)測(cè)與解釋框架,并為未來(lái)的理論與實(shí)證研究提供新思路。
三、數(shù)據(jù)、測(cè)量與方法
(一)數(shù)據(jù)
本研究的數(shù)據(jù)來(lái)源于CHARLS2018年調(diào)查數(shù)據(jù)庫(kù)。該調(diào)查由北京大學(xué)國(guó)家發(fā)展研究院主持,并由北京大學(xué)中國(guó)社會(huì)科學(xué)調(diào)查中心和校團(tuán)委共同實(shí)施,旨在收集中國(guó)45歲及以上中老年家庭和個(gè)人的高質(zhì)量微觀數(shù)據(jù),以解構(gòu)中國(guó)的人口老齡化問(wèn)題,推動(dòng)跨學(xué)科的老齡化研究。CHARLS的調(diào)查問(wèn)卷內(nèi)容涵蓋個(gè)人基本情況、家庭結(jié)構(gòu)與經(jīng)濟(jì)支持、健康狀況、身體測(cè)量、醫(yī)療服務(wù)利用及醫(yī)療保險(xiǎn)、工作與退休、收入與消費(fèi)、資產(chǎn)、社區(qū)情況等方面。2018年的調(diào)查新增了詐騙被害的相關(guān)問(wèn)題,為本研究提供了重要的數(shù)據(jù)支持。CHARLS通過(guò)具有全國(guó)代表性的抽樣,調(diào)查了我國(guó)老年群體的詐騙被害情況,這與本研究的核心方向高度契合。2018年調(diào)查共涉及19289名受訪者。鑒于研究對(duì)象為老年群體,本研究在分析過(guò)程中排除了受訪者年齡小于60歲的樣本,對(duì)最終保留的8961份有效數(shù)據(jù)予以分析。
(二)測(cè)量
本研究的兩個(gè)核心被解釋變量分別為是否遭遇過(guò)詐騙(即詐騙暴露)以及詐騙后是否遭受財(cái)產(chǎn)損失。關(guān)于詐騙暴露,CHARLS問(wèn)卷中設(shè)置了“過(guò)去一年,是否有人試圖對(duì)您進(jìn)行詐騙?不需要有財(cái)物損失”這一問(wèn)題。回答為“有”的被編碼為1,表示過(guò)去一年曾遭遇詐騙;回答為“無(wú)”的被編碼為0,表示過(guò)去一年未遭遇詐騙。對(duì)于財(cái)產(chǎn)損失,受訪者在確認(rèn)曾遭遇詐騙的基礎(chǔ)上,進(jìn)一步回答具體詐騙類型以及實(shí)際遭受財(cái)產(chǎn)損失的數(shù)額。在關(guān)于財(cái)產(chǎn)損失的回答中,若回答數(shù)額大于0,該變量被編碼為1,表示遭受財(cái)產(chǎn)損失;若回答數(shù)額等于0,該變量被編碼為0,表示未遭受財(cái)產(chǎn)損失。
特征變量涵蓋了前述討論中多個(gè)領(lǐng)域的代表性因素:
第一,人口學(xué)方面和經(jīng)濟(jì)狀況方面。人口學(xué)變量包括年齡、性別、受教育程度(小學(xué)以下、小學(xué)、初中、高中及以上)、婚姻狀況、居住地(城鎮(zhèn)、城鄉(xiāng)接合部、農(nóng)村)。經(jīng)濟(jì)狀況變量包括年收入、養(yǎng)老金、月支出、現(xiàn)金資產(chǎn)和貸款。由于這些經(jīng)濟(jì)狀況變量呈現(xiàn)偏態(tài)分布,本研究對(duì)其進(jìn)行了對(duì)數(shù)轉(zhuǎn)換。
第二,認(rèn)知能力方面、心理健康和身體健康方面。認(rèn)知能力變量包括定向力、情景記憶能力和計(jì)算能力,常用于衡量老年人的認(rèn)知水平;心理健康變量涵蓋抑郁和生活滿意度,代表消極和積極兩個(gè)方向;身體健康變量包括自評(píng)健康、身體功能障礙(如殘疾、視力或聽(tīng)力問(wèn)題、語(yǔ)言障礙等)、慢性疾?。ㄈ绺哐獕?、糖尿病等14類慢性疾?。┮约叭粘I罨顒?dòng)能力(ADL)和工具性日常生活活動(dòng)能力(IADL)。[33]
第三,日?;顒?dòng)變量包括被訪者參與的活動(dòng)類型和活動(dòng)頻次。這些活動(dòng)包括:(1)串門、與朋友交往;(2)打麻將、下棋、打牌、參加社區(qū)活動(dòng);(3)為不與自己同住的親友或鄰居提供幫助;
(4)跳舞、健身、練氣功等;(5)參加社團(tuán)組織活動(dòng);(6)做志愿者或參加慈善活動(dòng);(7)照顧不與自己同住的病人或殘疾人;(8)上學(xué)或參加培訓(xùn);(9)炒股(基金及其他金融證券);(10)上網(wǎng)。
第四,本研究選擇先前詐騙被害次數(shù)作為衡量標(biāo)準(zhǔn)。CHARLS問(wèn)卷中對(duì)應(yīng)的問(wèn)題是:“除本次調(diào)查外,以前是否還有遭遇詐騙的經(jīng)歷?”若受訪者回答為肯定,將進(jìn)一步報(bào)告總共的被害次數(shù)(包括先前和本次)。為減少極端數(shù)據(jù)的影響,本研究遵循重復(fù)被害研究的慣例,將所有被害次數(shù)超過(guò)5次的情況處理為5次。
(三)方法
本研究采用的計(jì)算扎根方法按照以下6個(gè)步驟實(shí)施(如圖1所示)。
第一步,明確研究問(wèn)題和被解釋變量。本研究基于CHARLS調(diào)查數(shù)據(jù),探討若干風(fēng)險(xiǎn)因素對(duì)老年群體詐騙被害的預(yù)測(cè)能力,被解釋變量(Y)為老年群體的詐騙暴露和詐騙損失。每個(gè)被解釋變量均為二分類變量:對(duì)于詐騙暴露,曾遭遇過(guò)詐騙的受訪者記為1,未遭遇過(guò)詐騙的記為0;對(duì)于詐騙損失,實(shí)際遭受財(cái)產(chǎn)損失的記為1,未遭受財(cái)產(chǎn)損失的記為0。
第二步,準(zhǔn)備高維數(shù)據(jù)和解釋變量。本研究依據(jù)前文討論及CHARLS問(wèn)卷數(shù)據(jù),選取了24個(gè)特征變量 (X) ,涵蓋人口學(xué)、經(jīng)濟(jì)狀況、認(rèn)知能力、心理健康、身體健康、日常活動(dòng)的種類與頻次,以及先前受害次數(shù)。通過(guò)分析這些變量與被解釋變量之間的關(guān)系,識(shí)別老年群體詐騙被害的主要風(fēng)險(xiǎn)因素。
第三步,運(yùn)用機(jī)器學(xué)習(xí)進(jìn)行社會(huì)預(yù)測(cè)。本研究基于準(zhǔn)備好的高維數(shù)據(jù),考慮數(shù)據(jù)特點(diǎn)及適用于社會(huì)科學(xué)研究的機(jī)器學(xué)習(xí)算法,選擇隨機(jī)森林算法來(lái)訓(xùn)練預(yù)測(cè)模型。由于被解釋變量為類別變量,本研究采用隨機(jī)森林分類算法。
第四步,拆解黑箱模型,比較預(yù)測(cè)力。為了提高機(jī)器學(xué)習(xí)模型的可解釋性,本研究使用 SHAP值對(duì)訓(xùn)練好的模型進(jìn)行分析,評(píng)估各特征變量對(duì)被解釋變量的預(yù)測(cè)貢獻(xiàn)。如果某個(gè)特征 X 的SHAP值為正,表明其提高了受騙的概率;如果為負(fù),則表明其降低了受騙的概率。同樣的分析方法適用于詐騙損失的被解釋變量。
第五步,尋找潛在關(guān)系,倒推理論機(jī)制。根據(jù)特征 X 的預(yù)測(cè)力排序,本研究進(jìn)一步探討可能的變量關(guān)系,并揭示潛在機(jī)制。本研究結(jié)合現(xiàn)有理論,通過(guò)對(duì)詐騙經(jīng)歷和詐騙損失的預(yù)測(cè)結(jié)果進(jìn)行排序,驗(yàn)證或澄清與變量關(guān)系相關(guān)的理論推論。
第六步,通過(guò)交叉驗(yàn)證檢驗(yàn)結(jié)果的穩(wěn)健性。為了確保結(jié)果的穩(wěn)健性,本研究采用其他機(jī)器學(xué)習(xí)算法對(duì)相同被解釋變量進(jìn)行分析,比較不同算法下的預(yù)測(cè)結(jié)果,以驗(yàn)證模型的穩(wěn)定性和一致性。
四、研究發(fā)現(xiàn)
(一)社會(huì)預(yù)測(cè)
表1展示了主要特征變量( X )和被解釋變量(Y)的描述性統(tǒng)計(jì)結(jié)果。被解釋變量方面,詐騙暴露的均值為0.08,表明樣本中約有 8% 的老年受訪者在過(guò)去一年內(nèi)經(jīng)歷過(guò)詐騙;遭受財(cái)產(chǎn)損失的比例較低,僅為 2% 。特征變量方面,從先前受害次數(shù)看,樣本的平均先前受害次數(shù)為0.14,先前受害次數(shù)處于較低水平;從人口學(xué)信息看,樣本的平均年齡為68.46歲,受訪者的性別比例均衡(男性與女性各占 50% ),受教育程度集中于初中及以下,大部分受訪者處于已婚狀態(tài),且居住在城鄉(xiāng)接合部或農(nóng)村地區(qū);從經(jīng)濟(jì)狀況方面看,年收入、養(yǎng)老金和貸款的分布呈現(xiàn)出較大差異,樣本中少數(shù)老年人擁有較高額收人和現(xiàn)金資產(chǎn),其收入來(lái)源主要是養(yǎng)老金;從認(rèn)知狀況方面看,老年人的認(rèn)知定向力水平均值為7.88,處于較高水平,情景記憶和計(jì)算能力水平分別為2.65和1.71,總體認(rèn)知狀況處于中等以下水平;從心理健康方面看,老年人的抑郁和孤獨(dú)感程度分別為18.50 和1.66,處于中等偏下水平,生活滿意度為2.28,位于中等偏上水平,總體來(lái)看,心理健康處于中等偏上的水平;從身體健康和日常生活方面看,受訪的老年人實(shí)際身體健康狀況大大低于其自評(píng)健康水平,有一定慢性疾病癥狀,但發(fā)病率較低,其日常生活能力總體處于較低水平且日常活動(dòng)類型較少,頻次較低。
本研究使用隨機(jī)森林分類算法,以預(yù)測(cè)老年群體的詐騙暴露與詐騙損失情況。為了提高模型的預(yù)測(cè)性能,本研究選用了1000棵決策樹(shù),并在訓(xùn)練集( 70% 數(shù)據(jù))上進(jìn)行了迭代收斂。隨后在測(cè)試集( 30% 數(shù)據(jù))上評(píng)估模型的預(yù)測(cè)能力。其他參數(shù)均采用默認(rèn)值,包括將基尼系數(shù)作為不純度的衡量標(biāo)準(zhǔn)。[34]
如表2所示,隨機(jī)森林分類模型在預(yù)測(cè)詐騙暴露和詐騙損失兩個(gè)被解釋變量時(shí)表現(xiàn)良好。對(duì)于詐騙暴露,模型的準(zhǔn)確率達(dá)到 92% ,F(xiàn)1值為0.96,表明模型在識(shí)別詐騙暴露時(shí)具有較高的準(zhǔn)確性和穩(wěn)健性。同樣,詐騙損失的預(yù)測(cè)準(zhǔn)確率為 98% ,F(xiàn)1值達(dá)到0.99,進(jìn)一步證明了該模型在處理詐騙損失問(wèn)題時(shí)的有效性。
(二)比較預(yù)測(cè)能力
圖2展示了各主要特征變量(包括人口學(xué)變量、經(jīng)濟(jì)狀況、認(rèn)知能力、心理健康、身體健康、日?;顒?dòng)和先前被害等因素)對(duì)詐騙暴露和詐騙被害的預(yù)測(cè)力大小排序。前期研究已經(jīng)表明,人口學(xué)變量、經(jīng)濟(jì)狀況、認(rèn)知能力、心理健康、身體健康和日?;顒?dòng)等多種因素與老年群體的詐騙被害風(fēng)險(xiǎn)存在顯著關(guān)聯(lián)。因此,本研究運(yùn)用SHAP值,進(jìn)一步分析不同領(lǐng)域的因素對(duì)詐騙暴露及被害的具體影響。
其一,針對(duì)詐騙暴露,SHAP值分析結(jié)果顯示,預(yù)測(cè)力最強(qiáng)的前5個(gè)因素依次為養(yǎng)老金、活動(dòng)頻次、活動(dòng)種類、情景記憶和居住地。這表明,經(jīng)濟(jì)狀況、日常活動(dòng)、認(rèn)知能力和人口學(xué)因素是預(yù)測(cè)老年人詐騙暴露的關(guān)鍵因素。其中,養(yǎng)老金是影響詐騙暴露最大的變量,SHAP均值約為0.02,說(shuō)明養(yǎng)老金水平越高的老年人更容易成為詐騙目標(biāo),反映了財(cái)富水平在老年人詐騙暴露中的核心作用。
其二,針對(duì)詐騙損失,預(yù)測(cè)力最強(qiáng)的前5個(gè)因素依次為先前受害次數(shù)、抑郁、年齡、現(xiàn)金資產(chǎn)和養(yǎng)老金。這說(shuō)明,雖然經(jīng)濟(jì)狀況和認(rèn)知能力依然是預(yù)測(cè)老年人詐騙被害的關(guān)鍵因素,但在詐騙被害中,先前被害經(jīng)歷、年齡和心理健康(如抑郁)也起到了重要作用。其中,先前受害次數(shù)是最具預(yù)測(cè)力的變量,SHAP均值約為0.01,表明曾遭遇詐騙的老年人再次遭受財(cái)產(chǎn)損失的風(fēng)險(xiǎn)顯著增加。
(三)理論探尋
本研究對(duì)所有變量的SHAP值特征進(jìn)行了詳細(xì)分析和歸納,結(jié)合預(yù)測(cè)力優(yōu)先的原則,最終選取年齡、先前受害次數(shù)、經(jīng)濟(jì)狀況、抑郁(心理健康)、情景記憶(認(rèn)知狀況)以及活動(dòng)種類、活動(dòng)頻次(日?;顒?dòng))為重點(diǎn)研究對(duì)象。圖3至圖6展示了全樣本SHAP值的“特征影響圖”,反映了不同變量SHAP值的變化趨勢(shì)。圖中橫軸表示處理過(guò)的特征值,縱軸為SHAP值,單個(gè)灰色點(diǎn)代表一個(gè)樣本,黑色曲線則為通過(guò)Lowess 函數(shù)計(jì)算得到的平滑曲線。
根據(jù) SHAP值的變化模式,本研究總結(jié)了4種基本關(guān)系模式:直線形分布、“廠”字形分布、“L”形分布和“U”形分布。
1.直線形分布
直線形分布指的是影響因素與被解釋變量的關(guān)系呈現(xiàn)出較為均勻的線性變化,以“年齡”“情景記憶”“活動(dòng)種類”和“活動(dòng)頻次”為典型表型(圖 3a 、圖3b、圖3c、圖3d、圖3e、圖3f、圖3g 、圖3h)。這些變量的SHAP值隨特征值增加而呈現(xiàn)直線上升趨勢(shì)。
首先,對(duì)于“年齡”這一特征,研究結(jié)果表明,詐騙暴露或詐騙損失的可能性都隨年齡的增長(zhǎng)而增加。隨著年齡的增長(zhǎng),老年人的身體機(jī)能逐漸下降,體能、認(rèn)知和判斷能力受到較大影響。另一種解釋是,隨著年齡增長(zhǎng),個(gè)體會(huì)傾向于忽略負(fù)面情緒經(jīng)歷并追求正面情緒經(jīng)歷,[35]因此在面對(duì)騙術(shù)時(shí)更易上當(dāng)受騙。[36]
其次,對(duì)于屬于認(rèn)知能力范疇的“情景記憶”,研究結(jié)果表明,詐騙暴露的可能性隨情景記憶的增加而增加,而詐騙損失的可能性在情景記憶增強(qiáng)的情況下變化相對(duì)較小。此結(jié)論與先前研究相反,即老年人認(rèn)知狀況越好,越容易遭遇詐騙暴露,以及情景記憶達(dá)到一定程度時(shí)更容易遭受損失。對(duì)于以上兩點(diǎn),本研究的推測(cè)如下:第一,參加集體活動(dòng)的頻率和日常生活活動(dòng)能力是影響城市養(yǎng)老機(jī)構(gòu)老年人認(rèn)知功能水平的主要因素。37]本研究據(jù)此推測(cè),認(rèn)知狀況較好的老年人使用新興媒介產(chǎn)品的可能性更大,參與日常活動(dòng)頻率更高,更容易接觸到相關(guān)詐騙活動(dòng),則詐騙暴露的可能性更大。第二,當(dāng)情景記憶達(dá)到一定數(shù)值時(shí),該類人群的情景記憶已經(jīng)超出常人(由圖像中散點(diǎn)可知這類人群占比較少)。本研究推測(cè)其可能會(huì)更為頻繁地參加各類活動(dòng),而這些活動(dòng)可能存在一定的詐騙風(fēng)險(xiǎn)。因此,參加這些活動(dòng)不僅增加了詐騙暴露風(fēng)險(xiǎn),同時(shí)也增加了詐騙損失的可能性。
最后,對(duì)于屬于日?;顒?dòng)范疇的“活動(dòng)種類”和“活動(dòng)頻次”,研究結(jié)果表明,詐騙暴露或詐騙損失的可能性都隨著二者的增加而增加。值得注意的是,對(duì)于同一數(shù)值的活動(dòng)種類,詐騙暴露的可能性基本上大于詐騙損失的可能性,活動(dòng)頻次也是如此。隨著日?;顒?dòng)種類和次數(shù)的增多,老年群體遇到詐騙和遭受詐騙損失的可能性更大;但當(dāng)進(jìn)行相同種類和頻次的活動(dòng)時(shí),相比于詐騙暴露,詐騙損失的可能性更小且增長(zhǎng)速率更低。這與先前研究中“活動(dòng)增多可能增加老年人接觸潛在詐騙信息的機(jī)會(huì)”的研究結(jié)果一致。[38]
2.“廠”字形分布
“廠”字形分布是指,當(dāng)影響因素取值較小時(shí),影響因素與被解釋變量的關(guān)聯(lián)較強(qiáng),而在特征變量取值較大時(shí),影響逐漸趨于平緩。以“先前受害次數(shù)”和“貸款”為典型表現(xiàn)(圖4a—圖4d)。
其一,對(duì)于“先前受害次數(shù)”這一特征變量,研究結(jié)果表明,詐騙暴露及被害的可能性隨著先前受害次數(shù)的增加總體呈上升趨勢(shì),但在先前受害次數(shù)大于3次后,詐騙暴露和損失的可能性上升趨緩。對(duì)此,本研究推測(cè),先前受害次數(shù)對(duì)詐騙暴露及損失可能存在“邊際效應(yīng)遞減”的規(guī)律,即隨著先前受害次數(shù)的增加,再次被害的風(fēng)險(xiǎn)的增速會(huì)逐漸放緩。這表明在遭受3次詐騙之后再次遭遇詐騙的邊際概率下降,而遭受4次及以上詐騙的概率與遭受3次詐騙的概率相差無(wú)幾。
其二,對(duì)于“貸款”這一特征變量,研究結(jié)果表明,貸款較高的老年群體遭遇詐騙損失的可能性更大。對(duì)于貸款對(duì)詐騙暴露和被害的預(yù)測(cè),在前期的影響呈現(xiàn)緩慢上升的趨勢(shì),直至貸款達(dá)到約20000元( e9≈8103.08 , e10≈22026.47. )時(shí),SHAP值逐漸趨于平緩,甚至有輕微下降的趨勢(shì)。結(jié)合已有理論分析推測(cè),當(dāng)人均貸款大額增加后,用于投資和風(fēng)險(xiǎn)活動(dòng)的可支配財(cái)產(chǎn)減少,接觸詐騙和遭受詐騙損失的群體數(shù)量會(huì)停止增長(zhǎng)且在一定程度上減少。
3.“L”形分布
“L”形分布是指,當(dāng)影響因素取值較小時(shí),影響因素對(duì)被解釋變量的影響較為平緩;而當(dāng)特征變量取值增大時(shí),影響開(kāi)始顯著增強(qiáng)。以“收入”和“養(yǎng)老金”為典型表現(xiàn)(圖5a—圖5d)。
其一,對(duì)于“收入”這一特征變量,研究結(jié)果表明,高收入老年群體更加容易遭受詐騙暴露和詐騙損失,且暴露于詐騙下的老年群體遠(yuǎn)大于詐騙損失群體。根據(jù)圖像,高收入老年群體詐騙暴露的 SHAP值更大,并且詐騙暴露樣本集中于中等偏高收入群體,即集中于人均收入1100元至60000元( e7≈1096.63 , e11≈59874.14. )的群體。并且,同一收入群體詐騙暴露對(duì)應(yīng)的SHAP值變化較大,最高達(dá)到了 SHAP=0.21 的水平;與此對(duì)應(yīng),詐騙損失程度隨老年群體收入增長(zhǎng)呈現(xiàn)緩慢增長(zhǎng)的趨勢(shì),且中等收人群體的SHAP值變化較大。故高收入的老年群體更易受到詐騙,且暴露于詐騙的可能性大于遭受損失的可能性。結(jié)合已有研究分析,老年群體隨著年齡增長(zhǎng),收人累計(jì)高峰更加明顯,[39]因此這類群體更加容易處于詐騙暴露的環(huán)境之中。考慮到高收人者群體涉稅風(fēng)險(xiǎn)較大,對(duì)于可支配資產(chǎn)的管理和保護(hù)意識(shí)較強(qiáng)(如采用銀行存款、保險(xiǎn)、固定資產(chǎn)投資等形式),真正遭受詐騙損失的人數(shù)將少于詐騙暴露的人數(shù)。
其二,對(duì)于“養(yǎng)老金”這一特征變量,研究結(jié)果表明,高養(yǎng)老金的老年群體更加容易受到詐騙暴露和被害,且暴露于詐騙下的老年群體大于詐騙損失群體。根據(jù)圖像,相較于詐騙損失的老年群體,詐騙暴露的老年群體隨養(yǎng)老金增加而明顯增長(zhǎng),且SHAP值從0增長(zhǎng)到0.23。相反的是,詐騙損失群體數(shù)量與養(yǎng)老金數(shù)目相關(guān)性較小,SHAP值維持在0.01至0.05之間。結(jié)合已有研究分析,由于老年群體的收入大部分是養(yǎng)老金,故老年群體通過(guò)養(yǎng)老金積累了一定現(xiàn)金資產(chǎn)后,容易產(chǎn)生投機(jī)獲利的動(dòng)機(jī),這與王彬所提出的高額養(yǎng)老金容易誘導(dǎo)養(yǎng)老服務(wù)類詐騙和投資型養(yǎng)老詐騙的結(jié)論相似。[40]
4.“U”形分布
“U”形分布是指,當(dāng)影響因素的取值較高或較低時(shí),對(duì)被解釋變量的影響較為顯著,而在中間取值時(shí)影響相對(duì)較弱,呈現(xiàn)出“U”形分布。以“月支出”“現(xiàn)金資產(chǎn)”和“抑郁”為典型表現(xiàn)(圖6a—圖6f)。
其一,對(duì)于“月支出”和“現(xiàn)金資產(chǎn)”,研究結(jié)果表明,月支出和現(xiàn)金資產(chǎn)的SHAP值變化趨勢(shì)近似,均呈現(xiàn)出老年群體在中等月支出或現(xiàn)金資產(chǎn)狀態(tài)下,詐騙暴露和詐騙損失程度較小的特點(diǎn)。這與現(xiàn)金資產(chǎn)和月支出變量均值約為2000元有一定關(guān)系。如表1所示,現(xiàn)金資產(chǎn)的均值約為2140元,月支出的均值約為1700元。所以,可以推測(cè),中等月支出和現(xiàn)金資產(chǎn)總量的老年群體對(duì)詐騙行為和詐騙活動(dòng)的辨別能力更強(qiáng),對(duì)高風(fēng)險(xiǎn)投資行為的態(tài)度更為謹(jǐn)慎。而現(xiàn)金資產(chǎn)較多的老年群體對(duì)理財(cái)和套利的過(guò)度自信和預(yù)期損失減少,[41]會(huì)促使他們從事風(fēng)險(xiǎn)更高的財(cái)務(wù)決策,從而增加詐騙損失的可能性。
其二,對(duì)于“抑郁”這一特征,研究結(jié)果表明,詐騙損失可能性受抑郁的影響較小,而詐騙暴露可能性隨著抑郁程度的變化而呈現(xiàn)出先下降后上升的變化趨勢(shì)。抑郁程度的下降趨勢(shì)與IADL的負(fù)向影響有關(guān),42]即進(jìn)行日?;顒?dòng)有益于降低抑郁程度。對(duì)于上升趨勢(shì),相關(guān)實(shí)證研究發(fā)現(xiàn),健康的心理狀況能較好地預(yù)防老年群體詐騙暴露。43]兩種相反的影響相互對(duì)沖,圖6中的最低點(diǎn)即該平衡位置,表示正負(fù)效應(yīng)在此處相互抵消,詐騙暴露可能性最小。
(四)交叉驗(yàn)證
根據(jù)計(jì)算扎根方法的基本實(shí)施步驟,數(shù)據(jù)和算法在結(jié)果中的作用至關(guān)重要。為了檢驗(yàn)算法的穩(wěn)健性,本研究比較了XGBoost、LightGBM、CatBoost 和 RandomForest這4種算法的計(jì)算扎根結(jié)果,如圖7所示。根據(jù)4種算法計(jì)算出的SHAP值的箱線圖結(jié)果,所討論的特征(包括人口學(xué)中的年齡,先前受害次數(shù),經(jīng)濟(jì)狀況中的收入、養(yǎng)老金、貸款、支出和現(xiàn)金資產(chǎn),認(rèn)知狀況中的情景記憶,心理健康中的抑郁,以及日?;顒?dòng)中的活動(dòng)種類、活動(dòng)頻次)在不同算法中的排名均較為靠前,顯示出較強(qiáng)的預(yù)測(cè)力。因此,針對(duì)老年群體詐騙損失風(fēng)險(xiǎn)因素的分析,計(jì)算扎根方法在不同算法下表現(xiàn)出一定的穩(wěn)健性。
五、結(jié)論和討論
本研究基于CHARLS 2018年的數(shù)據(jù),采用計(jì)算扎根方法,構(gòu)建了一個(gè)綜合性的詐騙被害預(yù)測(cè)模型。主要實(shí)現(xiàn)了以下兩個(gè)目標(biāo):(1)通過(guò)算法模型預(yù)測(cè)各風(fēng)險(xiǎn)因素對(duì)詐騙暴露和財(cái)產(chǎn)損失的影響,量化這些因素對(duì)老年群體詐騙風(fēng)險(xiǎn)的貢獻(xiàn);(2)借助解釋模型的歸因算法,深人分析各風(fēng)險(xiǎn)因素對(duì)詐騙風(fēng)險(xiǎn)的影響機(jī)制。通過(guò)量化各風(fēng)險(xiǎn)因素與詐騙被害之間的關(guān)系,本研究識(shí)別出了對(duì)老年群體詐騙風(fēng)險(xiǎn)影響最顯著的關(guān)鍵因素,并利用SHAP值方法對(duì)模型進(jìn)行了拆解,揭示了特征變量在詐騙暴露和詐騙損失中的具體作用機(jī)制。
其一,預(yù)測(cè)模型的結(jié)果表明,在詐騙暴露方面,養(yǎng)老金、活動(dòng)頻次、活動(dòng)種類、情景記憶和居住地是預(yù)測(cè)力最強(qiáng)的5個(gè)因素。尤其是養(yǎng)老金水平較高的老年人更容易成為詐騙目標(biāo),反映了財(cái)富水平在暴露風(fēng)險(xiǎn)中的重要性。而在詐騙損失中,預(yù)測(cè)力較強(qiáng)的5個(gè)因素依次為先前受害次數(shù)、抑郁、年齡、現(xiàn)金資產(chǎn)和養(yǎng)老金,其中先前受害次數(shù)是最具預(yù)測(cè)力的變量。從應(yīng)用層面看,如果希望構(gòu)建老年群體詐騙被害風(fēng)險(xiǎn)篩查量表,本研究的結(jié)果表明,養(yǎng)老金、情景記憶、先前受害次數(shù)、活動(dòng)種類、活動(dòng)頻次、年齡和抑郁應(yīng)作為量表的重點(diǎn)考慮因素。尤其是先前受害次數(shù),它在預(yù)測(cè)模型中的重要性顯著高于許多傳統(tǒng)風(fēng)險(xiǎn)因素。盡管現(xiàn)有的篩查工具通常較為全面地考慮了老年群體的經(jīng)濟(jì)狀況、認(rèn)知能力和心理健康等方面的風(fēng)險(xiǎn)因素,但極少有工具將先前受害次數(shù)作為核心指標(biāo)。然而,本研究結(jié)果表明,曾遭受詐騙的老年人未來(lái)再次成為目標(biāo)的風(fēng)險(xiǎn)顯著提升。因此,在風(fēng)險(xiǎn)篩查中,先前受害次數(shù)應(yīng)被優(yōu)先納人,以提高工具的準(zhǔn)確性和實(shí)效性。從理論層面看,這些結(jié)果可以通過(guò)被害人學(xué)中的目標(biāo)一致性理論(target congruence theory)加以解釋。該理論是對(duì)日?;顒?dòng)理論中“合適目標(biāo)”(suitable targets)概念的擴(kuò)展,進(jìn)一步細(xì)化為目標(biāo)脆弱性(target vulnerability)、目標(biāo)吸引性(target gratifiability)和目標(biāo)對(duì)抗性(target antagonism)3個(gè)方面。44由于本研究的研究對(duì)象為老年群體,在詐騙活動(dòng)中,詐騙犯罪者往往處于主動(dòng)的一方。同時(shí),與詐騙犯罪者相比,老年群體在生理上處于弱勢(shì)地位,不易對(duì)犯罪者產(chǎn)生敵意或怨恨性行為。因此,本研究的結(jié)果契合目標(biāo)一致性理論中的前兩個(gè)方面。第一,可以通過(guò)老年人的年齡增長(zhǎng)或認(rèn)知能力下降來(lái)解釋目標(biāo)脆弱性,先前受害次數(shù)也可以被視為目標(biāo)脆弱性的一個(gè)表現(xiàn)。曾經(jīng)遭遇詐騙的老年人由于缺乏有效的防范策略或認(rèn)知上的疲勞,更容易成為再次被害的目標(biāo)。此外,詐騙者可能主動(dòng)鎖定這些曾經(jīng)被害的老年人,增加他們?cè)俅问茯_的風(fēng)險(xiǎn)。第二,目標(biāo)吸引性表明,養(yǎng)老金水平較高的老年人通常擁有更多的可支配資產(chǎn),這正是詐騙犯罪者希望獲取或操縱的資源。詐騙犯罪者通過(guò)虛假投資、保健品銷售或養(yǎng)老服務(wù)等手段,吸引這些高財(cái)富老年人,試圖從中獲取經(jīng)濟(jì)利益。本研究進(jìn)一步分析結(jié)果表明,目標(biāo)吸引性可能對(duì)詐騙暴露的解釋力更強(qiáng),而目標(biāo)脆弱性對(duì)詐騙被害的解釋性更為顯著。這一發(fā)現(xiàn)表明,對(duì)于詐騙這一非接觸性犯罪,“合適目標(biāo)”的不同屬性在詐騙的不同階段(暴露與被害)可能具有不同的解釋力。這一結(jié)果與先前研究中區(qū)分詐騙被害階段的發(fā)現(xiàn)相一致,45]進(jìn)一步說(shuō)明了針對(duì)不同階段的防范策略應(yīng)有所側(cè)重。
其二,解釋模型的結(jié)果表明,風(fēng)險(xiǎn)因素的 SHAP 值變化模式主要有4種形態(tài),包括直線形分布、“廠”字形分布、“L”形分布和“U”形分布。這些分布形態(tài)為政策制定提供了明確的干預(yù)啟示,特別是在何時(shí)以及如何介人老年群體的詐騙防范方面。第一,直線形分布,以“年齡”“情景記憶”“活動(dòng)種類”和“活動(dòng)頻次”為典型代表。這類特征對(duì)詐騙暴露及被害的影響隨著特征取值的增大呈線性變化,表明各取值區(qū)間的影響較為均勻。這一模式提示,相關(guān)部門應(yīng)根據(jù)老年人的具體年齡或認(rèn)知水平,逐步加大防范詐騙措施的力度。尤其對(duì)高齡老年人,應(yīng)盡早介入更多的宣傳和防護(hù)措施。對(duì)于認(rèn)知狀況較好的老年人,相關(guān)部門應(yīng)重點(diǎn)關(guān)注他們的社交及經(jīng)濟(jì)活動(dòng),提前干預(yù),預(yù)防他們暴露于潛在的詐騙風(fēng)險(xiǎn)中。第二,“廠”字形分布,以“先前受害次數(shù)”和“貸款”為典型代表。這類特征對(duì)詐騙暴露和被害的影響在閾值較小時(shí)上升幅度較大,但在達(dá)到某一閾值后增速放緩甚至趨于平穩(wěn)。這意味著對(duì)老年人群的干預(yù)應(yīng)重點(diǎn)放在先前受害次數(shù)較少的階段,即盡早發(fā)現(xiàn)并介入曾經(jīng)被害過(guò)的老年人群體,防止他們?cè)俅问茯_。對(duì)于貸款負(fù)擔(dān)較輕的老年人,政府和社會(huì)組織應(yīng)在早期介人,通過(guò)金融教育和社會(huì)支持體系,減少他們陷入高風(fēng)險(xiǎn)財(cái)務(wù)行為的可能性。第三,“L”形分布,以“收人”和“養(yǎng)老金”為典型。這類特征對(duì)詐騙暴露或被害的影響在取值較小時(shí)相對(duì)較小,但隨著取值增大會(huì)顯著變大。這表明,對(duì)于高收人和高養(yǎng)老金群體,應(yīng)在他們的財(cái)富積累到一定程度時(shí)進(jìn)行干預(yù),特別是在金融詐騙防范等方面增加宣傳和保護(hù)措施。第四,“U”形分布,以“抑郁”“月支出”和“現(xiàn)金資產(chǎn)”為代表。該分布表明,在這些變量的取值較低和較高時(shí),詐騙暴露和被害的風(fēng)險(xiǎn)都相對(duì)較大。針對(duì)這種模式,應(yīng)在抑郁水平較低和較高的老年人群體中加強(qiáng)政策干預(yù)。特別是對(duì)抑郁程度較高的老年人群,心理健康干預(yù)應(yīng)盡早介人。同時(shí),對(duì)現(xiàn)金資產(chǎn)水平或月支出水平極端的老年人,應(yīng)在其財(cái)務(wù)狀況發(fā)生重大變化的時(shí)候及時(shí)提供防范措施,避免他們成為詐騙的主要目標(biāo)。
本研究模型的結(jié)果為詐騙被害研究提供了重要的參考價(jià)值,但仍存在一定局限性。首先,盡管“計(jì)算扎根”方法在預(yù)測(cè)建模中具有創(chuàng)新性,但在相關(guān)研究中的應(yīng)用尚不廣泛,模型在不同場(chǎng)景下的預(yù)測(cè)能力可能存在一定差異。未來(lái)研究應(yīng)進(jìn)一步優(yōu)化算法,并在更豐富多樣的數(shù)據(jù)集上進(jìn)行驗(yàn)證,以提升模型的適用性和預(yù)測(cè)精度。其次,本研究未對(duì)詐騙類型進(jìn)行細(xì)致區(qū)分,主要由于CHARLS數(shù)據(jù)未涵蓋詐騙損失的詳細(xì)分類,限制了對(duì)不同詐騙類型差異性的分析。未來(lái)研究可利用更精細(xì)化的數(shù)據(jù),進(jìn)一步探索不同類型詐騙的影響機(jī)制。最后,由于損失金額變量缺失較多,本研究未能對(duì)詐騙損失金額進(jìn)行深人分析。雖然CHARLS問(wèn)卷包含該變量,但缺失率較高,使得數(shù)據(jù)無(wú)法有效支持損失金額與老年人財(cái)務(wù)狀況及生活質(zhì)量的關(guān)聯(lián)分析。未來(lái)研究可結(jié)合數(shù)據(jù)質(zhì)量更高的樣本,全面評(píng)估詐騙損失的經(jīng)濟(jì)后果,從而為防范措施的制定提供更具體的實(shí)證支持。
【 Abstract】 Based on the 2018 China Health and Retirement Longitudinal Study(CHARLS)data, this study utilizes 8,96l valid samples of elderly individuals aged 60 and above to construct a predictive and explanatory model for fraud victimization,using the computational grounded theory approach.The main findings are as folows:(1)The predictive model identifies the most significant factors influencing fraud exposure and property lossamong the elderly.Results indicate that pension lovel, frequency of activity, types of activity, episodic memory, and place of residence are five core predictors of fraud exposure. Regarding fraud-related property loss,number of cash victimization,depression,age,cash assets,and monthly expenditure are the primary predictive variables.(2)Through the explanatory model, this study further reveals the mechanisms of various risk factors and summarizes four typical patterns: linear distribution,T-shaped distribution,L-shaped distribution,and U-shaped distribution.The findings not only depen the theoretical understanding of fraud risks among the elderly but also provide a scientific basis for formulating targeted and precise prevention strategies.
【Keywords】the elderly group; fraud victims; computational grounded theory; machine learning;Shapley value