胡萱怡,謝 敏,劉思弋,吳雨璐,吳祥瑞,劉元元,何昌九,代光智,王 強*
(1. 四川大學(xué)華西醫(yī)院心理衛(wèi)生中心,四川 成都 610041;2. 成都市第四人民醫(yī)院,四川 成都 610000;3. 四川大學(xué)華西公共衛(wèi)生學(xué)院,四川大學(xué)華西第四醫(yī)院,四川 成都 610041
近年來,我國嚴重精神障礙患者肇事肇禍時有發(fā)生,給社會的正常運行秩序帶來極其惡劣的影響,已成為政法、公安、衛(wèi)健等部門的重點、難點工作[1]。2018年,國家衛(wèi)生健康委員會印發(fā)了《嚴重精神障礙管理治療工作規(guī)范(2018 年版)》(以下簡稱《規(guī)范》)[2],明確了嚴重精神障礙患者的概念及分類,并劃分了危險行為的等級(0~5 級),其中2 級以下為無危險行為或僅口頭威脅、喊叫,2 級及以上為有打砸行為。截至2020年底,全國登記在冊的嚴重精神障礙患者共6 430 587 例[3]。我國嚴重精神障礙患者肇事肇禍發(fā)生率約為10%[4],國外研究表明,11%~52%的精神障礙患者在12 個月內(nèi)存在危險行為,其危險行為發(fā)生率是一般人群的2~8 倍[5]。近年來,國內(nèi)外關(guān)于精神障礙患者危險行為影響因素的研究越來越多,因國內(nèi)外的政策制度不同、且存在較大的文化差異[6-9],國內(nèi)外研究的重點也存在差異。國外較多關(guān)注社區(qū)精神障礙患者的伴侶、童年經(jīng)歷、物質(zhì)依賴以及創(chuàng)傷后應(yīng)激反應(yīng)[10-13],國內(nèi)較多關(guān)注住院精神障礙患者的精神病性癥狀以及社區(qū)嚴重精神障礙患者的人口學(xué)特征[14-15]。國外研究顯示,Logistic 回歸分析、分類回歸樹、神經(jīng)網(wǎng)絡(luò)、隨機森林等模型對精神障礙患者發(fā)生危險行為的預(yù)測效果存在差異[16-17],也有研究顯示,向量機、隨機森林模型對精神障礙患者發(fā)生危險行為風(fēng)險預(yù)測的準確率高于Logistic回歸分析[16,18]。
分類決策樹作為一種數(shù)據(jù)驅(qū)動的數(shù)據(jù)挖掘技術(shù)[19],其基本思想是使用一定的分割規(guī)則對樣本不斷分割直到不可繼續(xù)分割,通過設(shè)置生長和修剪規(guī)則對分類決策樹進行調(diào)整以實現(xiàn)模型優(yōu)化[20]。分類決策樹通過構(gòu)建可視化的分類預(yù)測模型,方便決策者根據(jù)研究目的關(guān)注影響因素之間的聯(lián)系以及影響因素的作用路徑。但國內(nèi)多采用Logistic 回歸分析構(gòu)建預(yù)測模型[21-22],缺乏使用數(shù)據(jù)挖掘技術(shù)構(gòu)建預(yù)測模型的研究和比較,特別是關(guān)于分類決策樹模型的研究以及模型之間預(yù)測效果的比較。本研究采用Logistic 回歸分析及分類決策樹構(gòu)建社區(qū)嚴重精神障礙患者危險行為發(fā)生風(fēng)險的預(yù)測模型,并比較其預(yù)測效果,以期為精神衛(wèi)生防治工作中對發(fā)生危險行為的高風(fēng)險人群進行早期識別提供參考。
于2023 年12 月,選取社區(qū)嚴重精神障礙患者管理平臺登記在管的嚴重精神障礙患者為研究對象。納入標準:①符合《國際疾病分類(第10 版)》(International Classification of Diseases,tenth edition,ICD-10)中精神分裂癥、雙相情感障礙、分裂情感性障礙、癲癇所致精神障礙、偏執(zhí)型精神病、精神發(fā)育遲滯伴發(fā)精神障礙診斷標準之一;②基線信息完整;③2013 年—2022 年的隨訪記錄完整;④在管并簽署知情同意書;⑤年齡≥18 歲。排除標準:①合并嚴重軀體疾病者;②長期住院者。符合納入標準且不符合排除標準共11 484 例,按8∶2 隨機分為訓(xùn)練集(n=9 186)與測試集(n=2 298)。本研究經(jīng)成都市第四人民醫(yī)院醫(yī)學(xué)倫理委員會批準,審批號:[2020]倫審字(31)號。
通過社區(qū)嚴重精神障礙患者管理平臺,收集患者的年齡、性別、民族、戶籍、受教育情況、就業(yè)情況、婚姻狀況、經(jīng)濟情況、兩系三代精神疾病家族史、未經(jīng)治療時間、關(guān)鎖情況、監(jiān)護情況、殘疾情況、危險行為史、自知力、服藥依從性、社會功能、陽性癥狀、陰性癥狀以及社區(qū)康復(fù)情況。根據(jù)危險行為等級評估,將≥2 級者分為危險行為組,<2 級者分為無危險行為組。
采用SPSS 23.0 進行統(tǒng)計分析。計數(shù)資料以[n(%)]表示,組間比較采用χ2檢驗。選取具有臨床意義以及單因素分析中P<0.1 的變量進行Logistic回歸分析和分類決策樹建模。在訓(xùn)練集中,分別使用Logistic 回歸分析和分類決策樹建立社區(qū)嚴重精神障礙患者危險行為發(fā)生風(fēng)險的預(yù)測模型,在測試集中,采用ROC 曲線下面積(area under curve,AUC)評價模型預(yù)測效果,采用Hosmer-Lemeshow 擬合優(yōu)度評估模型的校準度。
決策樹的生長方法采用分類回歸決策樹法,設(shè)置最大樹深=5,最小父節(jié)點樣本量=100,最小子節(jié)點樣本量=50,最小更改值=0.0002;Logistic 回歸分析采用似然比檢驗法(向前:LR)篩選預(yù)測變量。檢驗水準α=0.05。
檢出1 115 例(9.71%)社區(qū)嚴重精神障礙患者存在危險行為。全樣本中,有無危險行為的患者年齡、性別、戶籍、受教育情況、就業(yè)情況、婚姻狀況、經(jīng)濟情況、監(jiān)護情況、殘疾情況、危險行為史、自知力、服藥依從性、陽性癥狀、陰性癥狀以及社會功能差異均有統(tǒng)計學(xué)意義(P均<0.01)。見表1。
表1 基本資料比較[n(%)]Table 1 Comparison of basic data
Omnibus 檢驗結(jié)果顯示,Logistic 回歸模型χ2=3.949(P<0.05)。Hosmer-Lemeshow 擬合優(yōu)度檢驗顯示,Logistic 回歸模型χ2=12.173(P>0.05)。Logistic 回歸分析結(jié)果顯示,城市戶籍、貧困、有監(jiān)護人、精神殘疾、危險行為史陽性、自知力不全、自知力缺失以及有陽性癥狀是患者發(fā)生危險行為的危險因素(OR=1.778、1.459、2.719、1.483、3.890、1.423、2.528、2.124,P均<0.01);年齡≥60 歲、受過教育、醫(yī)囑無需用藥以及社會功能一般是患者發(fā)生危險行為的保護因素(OR=0.594、0.824、0.422、0.719,P<0.05或0.01)。見表2。
表2 訓(xùn)練集中社區(qū)嚴重精神障礙患者危險行為Logistic回歸結(jié)果Table 2 Logistic regression results of risk behaviors patients with severe mental disorders in training set
危險行為史、陽性癥狀、社會功能、經(jīng)濟情況、自知力、戶籍、殘疾情況以及年齡是患者發(fā)生危險行為的影響因素。危險行為史與危險行為的相關(guān)性最高。在危險行為史陽性的節(jié)點中,社會功能良好但自知力不全的節(jié)點危險行為發(fā)生率最高,為65.88%,社會功能一般或較差且同時具有陽性癥狀的節(jié)點危險行為發(fā)生率為45.26%;而在危險行為史陰性的節(jié)點中,具有陽性癥狀、自知力不全或缺失、社會功能較差且≤60 歲的節(jié)點危險行為發(fā)生率最高,為32.24%。微信掃OSID 碼查看分類決策樹模型圖。
基于測試集的模型評價結(jié)果顯示,Logistic 回歸模型AUC=0.729(95%CI:0.692~0.766);分類決策樹模型AUC=0.721(95%CI:0.705~0.737)。模型間AUC 差異無統(tǒng)計學(xué)意義(Z=0.067,P>0.05)。Logistic 回歸模型的準確率為70.97%,靈敏度為59.71%,特異度為72.05%;分類決策樹模型的準確率為68.28%,靈敏度為64.46%,特異度為68.60%。見圖1、圖2、表3。
圖1 測試集中多因素Logistic回歸ROC曲線Figure 1 ROC curves of multi-factor Logistic regression in the testing set
圖2 測試集中分類決策樹模型ROC曲線Figure 2 ROC curves of classification decision tree model in the testing set
表3 Logistic回歸及分類決策樹混淆矩陣Table 3 Confusion matrices of Logistic regression and classification decision tree
本研究結(jié)果顯示,社區(qū)嚴重精神障礙患者危險行為的發(fā)生率約為9.71%,與全國嚴重精神障礙患者肇事肇禍發(fā)生率接近,高于上海市(2.43%)、無錫市(7.18%)、深圳市寶安區(qū)(3.90%)等調(diào)查結(jié)果,低于南京市江寧區(qū)(42.4%)的調(diào)查結(jié)果[23-26],可能是因為上海市、無錫市、深圳市為全國精神衛(wèi)生綜合管理試點地區(qū),嚴重精神障礙患者治療管理工作取得一定成效,患者危險行為發(fā)生率較低。
本研究結(jié)果顯示,城市戶籍、貧困、有監(jiān)護人、精神殘疾、危險行為史陽性、自知力不全或缺失、有陽性癥狀是社區(qū)嚴重精神障礙患者發(fā)生危險行為的危險因素,與近年來國內(nèi)對社區(qū)嚴重精神障礙患者發(fā)生危險行為的研究結(jié)果一致[23-25]。但本研究結(jié)果顯示,社會功能一般是患者發(fā)生危險行為的保護因素,以及在危險行為史陽性的患者中,社會功能良好但自知力不全的節(jié)點危險行為發(fā)生率最高,社會功能一般或較差且同時具有陽性癥狀的節(jié)點危險行為發(fā)生率也相對較高,而在危險行為史陰性的患者中,具有陽性癥狀、自知力不全或缺失、社會功能較差且年齡≤60 歲的節(jié)點危險行為發(fā)生率最高,提示社會功能與其他影響因素密切關(guān)聯(lián)。
本研究在Logistic回歸模型基礎(chǔ)上,采用了分類決策樹模型對社區(qū)嚴重精神障礙患者發(fā)生危險行為的風(fēng)險進行預(yù)測,以增加預(yù)測模型的可解釋性[26-27]。本研究結(jié)果顯示,Logistic 回歸模型和分類決策樹模型的準確性和擬合優(yōu)度均較好,兩者ROC曲線下面積分別為0.729和0.721,提示兩種模型預(yù)測效果較為一致。Logistic 回歸模型的特異度稍高于分類決策樹模型,靈敏度稍低于分類決策樹模型。
綜上所述,分類決策樹模型與Logistic回歸模型預(yù)測效果相當,分類決策樹模型的預(yù)測效果并不優(yōu)于Logistic 回歸模型。本研究可能可為今后臨床識別社區(qū)嚴重精神障礙患者發(fā)生危險行為的高風(fēng)險人群提供一定參考。本研究局限性在于:對比建立嚴重精神障礙者危險行為的風(fēng)險預(yù)警系統(tǒng)的核心因素[28],本研究缺乏個人成長經(jīng)歷、生物學(xué)、生活環(huán)境等因素分析,模型的預(yù)測效果受其他因素的影響可能較大。未來研究可加入個人成長信息、生活應(yīng)激事件、情緒變化及神經(jīng)影像學(xué)資料等開展隊列研究,進一步構(gòu)建對嚴重精神障礙患者危險行為發(fā)生風(fēng)險預(yù)測效果更好的模型。