高升潤,李 蕓,李雨衡,王艷慶,高成杰
術(shù)后譫妄(postoperative delirium,POD)是常見的術(shù)后并發(fā)癥,老年患者發(fā)生率高,以急性注意力和認(rèn)知障礙為主要表現(xiàn),病因不明,可致住院時間延長、圍手術(shù)期死亡率增高、永久性認(rèn)知障礙等。所以術(shù)前篩查POD高危人群,盡早發(fā)現(xiàn)并及時進(jìn)行干預(yù),對逆轉(zhuǎn)或減少POD至關(guān)重要[1,2]。機(jī)器學(xué)習(xí)(machine learning,ML)是一種根據(jù)相關(guān)算法自動構(gòu)建數(shù)據(jù)模型,高效處理復(fù)雜數(shù)據(jù)的技術(shù),ML技術(shù)的深度發(fā)展有助于開發(fā)高效可靠的預(yù)測模型工具,促進(jìn)和支持臨床診療[3],科學(xué)分析醫(yī)學(xué)數(shù)據(jù)有利于早期篩查POD以改善預(yù)后。本文對POD相關(guān)ML風(fēng)險預(yù)測模型的研究成果進(jìn)行綜述,以期為臨床提供參考。
1.1 概述 計算機(jī)科學(xué)的顯著進(jìn)步,促使醫(yī)學(xué)診療逐步進(jìn)入人工智能(artificial intelligence, AI)時代。ML是AI學(xué)習(xí)的重要領(lǐng)域,通過計算機(jī)模擬人類學(xué)習(xí)現(xiàn)有數(shù)據(jù)或圖像,根據(jù)內(nèi)置模型算法,發(fā)掘新規(guī)律,總結(jié)新經(jīng)驗、新知識等,實現(xiàn)性能提升及自身完善[3,4]。利用ML構(gòu)建模型,可以有效提取相關(guān)數(shù)據(jù),深入挖掘其價值,為臨床決策提供可靠依據(jù)[5],具有模型構(gòu)建穩(wěn)定、預(yù)測準(zhǔn)確等優(yōu)點。醫(yī)學(xué)科研中經(jīng)典的ML算法有線性回歸、邏輯回歸、決策樹模型等。當(dāng)前基于ML算法相關(guān)的疾病預(yù)測模型已廣泛應(yīng)用于醫(yī)療活動中,可以及時篩查高危人群,有效幫助醫(yī)務(wù)人員及時干預(yù),減少不良結(jié)局,提高患者生命質(zhì)量。
1.2 預(yù)測模型的評估及驗證 鑒別力是評價預(yù)測模型的重要指標(biāo),能夠反映模型對真陽性和真陰性的鑒別能力。常通過制作接收者操作特征曲線(receiver operating characteristic,ROC)并計算曲線下面積 (area under curve,AUC)來體現(xiàn),即以1-特異度(假陽性率)為橫坐標(biāo),靈敏度(真陽性率)為縱坐標(biāo)繪制。AUC即“C”統(tǒng)計量,亦稱為一次性統(tǒng)計量,屬于二分類變量,范圍值在0.5~1,越接近1表示鑒別力越強(qiáng),適用于內(nèi)部驗證模型,即先建模后驗證,測試集和訓(xùn)練集同源。多個模型比較時常需外部驗證,即收集不同源及時間段的數(shù)據(jù)進(jìn)行測試和驗證[6]。預(yù)測模型研究對象影響因素冗雜,研究數(shù)據(jù)呈不同特征,影響預(yù)測結(jié)果,理想的預(yù)測模型可以克服不良因素影響,能夠耐受對其內(nèi)、外效度的驗證,具備充分的準(zhǔn)確性及抗干擾能力[7]。
常見的POD風(fēng)險預(yù)測模型按照ML算法分類有Logistic回歸預(yù)測模型、列線圖預(yù)測模型、決策樹及集成樹預(yù)測模型,基于臨床電子健康記錄數(shù)據(jù)(electronic health record,EHR)及應(yīng)用程序的ML衍生模型也有進(jìn)一步發(fā)展。
3.1 Logistic回歸預(yù)測模型 Logistic回歸是一種有監(jiān)督分類學(xué)習(xí)模型的多因素回歸分析方法,主要研究二分類或多分類變量與多個影響因素之間的關(guān)系[14]。王玉偉和李慧[15]選取200例Stanford A型主動脈夾層(Stanford type A aortic dissection,TAAD)接受手術(shù)的患者,進(jìn)行l(wèi)ogistic回歸分析并構(gòu)建TAAD術(shù)后譫妄風(fēng)險預(yù)測模型,檢驗?zāi)P蛥^(qū)分度和擬合優(yōu)度。另前瞻性選取行外科手術(shù)治療的25例TAAD患者對模型預(yù)測效能進(jìn)行外部驗證。Logistic回歸分析顯示男、年齡>54.6歲、術(shù)前血乳酸值>1.96 mmol/L、術(shù)中深低溫停循環(huán)時間>35.7 min、術(shù)后住ICU時間>8.3 d、術(shù)后急性腎功能不全、術(shù)后感染均是影響患者術(shù)后發(fā)生譫妄的危險因素,該預(yù)測模型AUC、敏感度、特異度分別為0.913、0.753、0.865,驗證模型AUC為0.884,敏感度和特異度分別為0.745、0.836。顯示該模型可用于TAAD患者發(fā)生POD風(fēng)險的預(yù)測,效果良好。
3.2 列線圖預(yù)測模型 列線圖是一種定量分析圖,由多因素二分類回歸或COX比例風(fēng)險模型分析得出,屬于回歸方程結(jié)果的可視化表達(dá),可以表現(xiàn)不同變量之間的相關(guān)性,主要是通過使用互不相交的線段以直尺做垂線的方式估算事件發(fā)生概率[16]。李繁等[17]探討了老年患者肺癌根治術(shù)POD危險因素,并以此構(gòu)建驗證預(yù)測POD發(fā)生風(fēng)險的列線圖模型。經(jīng)多因素logistic回歸分析顯示,年齡≥5歲、術(shù)前簡易精神狀態(tài)量表(MMSE)評分≤25分、術(shù)前預(yù)后營養(yǎng)指數(shù)<45、查爾森合并癥指數(shù)(CCI)評分≥2分、鱗癌、術(shù)中低血壓和手術(shù)時間≥3 h為POD的獨立危險因素。以此構(gòu)建的列線圖模型經(jīng)內(nèi)部驗證顯示對老年肺癌患者POD發(fā)生風(fēng)險具有較高的預(yù)測效能和臨床應(yīng)用價值。Li等[18]回顧性分析了384例髖關(guān)節(jié)置換術(shù)的老年患者,通過意識障礙評估方法將患者分為譫妄組和非譫妄組。采用多因素logistic回歸分析POD的危險因素,并根據(jù)結(jié)果建立列線圖。單因素分析顯示高齡、糖尿病、腔隙性腦梗死、手術(shù)類型、術(shù)中失血量、電解質(zhì)紊亂和貧血是POD的危險因素。多變量邏輯回歸顯示POD的獨立危險因素是年齡、手術(shù)類型、電解質(zhì)失衡、貧血等,列線圖可以為老年股骨頸骨折患者髖關(guān)節(jié)置換術(shù)后的POD提供個體化預(yù)測。Chen等[19]進(jìn)行的一項回顧性的研究分析顯示,接受腹腔鏡胃切除術(shù)的老年胃癌患者年齡、安眠藥、ICU時間、白蛋白/纖維蛋白原比值(AFR)、中性粒細(xì)胞/淋巴細(xì)胞比值(NLR)是發(fā)生POD的獨立危險因素,基于此五個因素構(gòu)建的列線圖模型AUC為0.807,可以有效預(yù)測老年胃癌患者的POD。Cox回歸風(fēng)險模型廣泛應(yīng)用于流行病學(xué),可納入多變量因素,對患者預(yù)后及生存關(guān)系分析更具優(yōu)勢[20]。黃宛冰等[21]回顧性分析559例Stanford B型主動脈夾層術(shù)后患者資料,POD的發(fā)生率為14.49%,應(yīng)用LASSO回歸及多變量Cox回歸分析發(fā)現(xiàn),年齡≥60歲、暈厥、入住ICU、入院時中性粒細(xì)胞計數(shù)>6.3×109/L、術(shù)后估計腎小球濾過率<90 ml/(min·1.73 m2)是POD的獨立危險因素,基于此構(gòu)建列線圖預(yù)測模型,采用自助法重抽樣1000次進(jìn)行內(nèi)部驗證。結(jié)果顯示C統(tǒng)計值為0.774,內(nèi)部驗證為0.762。術(shù)后1、3、7 d的AUC分別為0.776、0.771和0.778,該模型對Stanford B型主動脈夾層患者POD具有較好的風(fēng)險預(yù)測效能和臨床應(yīng)用價值。
3.3 決策樹及集成樹預(yù)測模型 決策樹是一種有監(jiān)督學(xué)習(xí),由訓(xùn)練集的某個特征決定非葉子節(jié)點,該特征的不同取值繼續(xù)劃分成若干個子樹,直至滿足某個條件不再分裂成葉子節(jié)點,整個過程可視化,能夠處理連續(xù)變量及離散問題,可以解決學(xué)習(xí)中的分類及回歸問題[22]。隨機(jī)森林、極限梯度提升算法(extremegradientboosting,XGBoost)等屬于集成樹模型,是以決策樹為分類器集成多個決策樹結(jié)果,形成最終預(yù)測輸出[23]。Liu等[24]回顧性分析了950例非腦部手術(shù)老年患者的臨床信息,應(yīng)用多層感知器、XGBoost和K近鄰算法三種ML算法構(gòu)建模型并驗證,發(fā)現(xiàn)XGBoost表現(xiàn)最優(yōu),訓(xùn)練集中AUC值為0.982,驗證集AUC值為0.924,準(zhǔn)確度較高,該預(yù)測模型顯示出較高的預(yù)測能力和臨床實用性。該研究顯示,POD與年齡、吸煙史、酗酒史、慢性阻塞性肺病、高血壓病史、手術(shù)時間延長和術(shù)后入住ICU多因素相關(guān)。R?hr等[25]納入1277例60歲以上計劃手術(shù)和接受全身麻醉的患者,結(jié)合基本臨床參數(shù)和術(shù)中腦電圖特征進(jìn)行回顧性分析,采用隨機(jī)森林模型,通過10次重復(fù)的10倍交叉驗證,結(jié)果顯示腦電圖特征可以改善分類,結(jié)合臨床參數(shù)構(gòu)建模型較單純臨床參數(shù)模型更能達(dá)到最佳效果,該工具易于應(yīng)用,可早期識別有發(fā)生POD風(fēng)險的患者。
3.4 衍生模型 ML可通過臨床檢測或監(jiān)測記錄數(shù)據(jù)預(yù)測高危人群,對于某些具有潛在特征性指標(biāo)疾病亦能及時洞察[23]。Bishara等[26]回顧性分析了24 885例成年患者的術(shù)前EHR,根據(jù)術(shù)前風(fēng)險特征開發(fā)并內(nèi)部驗證神經(jīng)網(wǎng)絡(luò)和XGBoost兩種衍生的POD風(fēng)險ML預(yù)測模型,并將其性能與傳統(tǒng)邏輯回歸開發(fā)的模型“臨床醫(yī)師指導(dǎo)”和“ML混合”及譫妄風(fēng)險分層工具進(jìn)行比較。POD的總發(fā)生率為5.3%,ML模型神經(jīng)網(wǎng)絡(luò)、XGBoost顯著優(yōu)于臨床醫(yī)師指導(dǎo)、ML混合等回歸模型以及譫妄風(fēng)險分層工具,神經(jīng)網(wǎng)絡(luò)、XGBoost和ML混合模型具備良好的效能,通過EHR數(shù)據(jù)及ML模型預(yù)測圍手術(shù)期POD高危人群具有較高辨別力,可以實現(xiàn)自動化、實時的POD風(fēng)險分層,改善POD高?;颊叩膰中g(shù)期管理。Jung等[27]納入兩家醫(yī)院的3980例膝關(guān)節(jié)置換術(shù)患者,一家醫(yī)院的1931例患者用于開發(fā)和訓(xùn)練,另一家醫(yī)院的2049例患者進(jìn)行外部驗證,使用EHR收集術(shù)前變量,最終選擇年齡、血清白蛋白、術(shù)前服用的安眠藥和鎮(zhèn)靜藥的數(shù)量、術(shù)前服用的藥物總數(shù)(任何一種口服藥物)、神經(jīng)系統(tǒng)疾病、抑郁癥和跌倒風(fēng)險等七項內(nèi)容作為POD的關(guān)鍵預(yù)測因素,基于網(wǎng)絡(luò)應(yīng)用程序構(gòu)建XGBoost預(yù)測模型用于篩查POD高危人群,該模型顯示出良好的預(yù)測效能。POD的發(fā)生率與手術(shù)類型相關(guān),該研究模型局限于膝關(guān)節(jié)置換術(shù),限制其普遍性,對于基礎(chǔ)疾病未量化其嚴(yán)重程度及功能障礙,該模型中可修改變量混雜因素與POD因果關(guān)系難以闡明。Wang等[28]收集術(shù)前、術(shù)中和術(shù)后變量的數(shù)據(jù),通過R進(jìn)行統(tǒng)計分析,利用python構(gòu)建模型,將ML算法應(yīng)用于微血管減壓手術(shù)POD的預(yù)測,準(zhǔn)確率達(dá)到96.7%,具備極佳的預(yù)測價值。文獻(xiàn)[29]通過ML自動化模塊提取圍手術(shù)期獲得的電子數(shù)據(jù),經(jīng)運算篩選出年齡、術(shù)中出血量、麻醉時間、拔管時間、ICU時間、MMSE評分、CCI、NLR等8項POD相關(guān)因素,并建立邏輯回歸、隨機(jī)森林、極限梯度增強(qiáng)樹、支持向量機(jī)算法等模型,進(jìn)行全自動評分,經(jīng)驗證邏輯回歸模型可以體現(xiàn)圍手術(shù)期POD風(fēng)險變化程度,有助于POD預(yù)測及合理干預(yù)。另有學(xué)者通過網(wǎng)絡(luò)及AI計算,結(jié)合譫妄預(yù)測危險因子開發(fā)了一款應(yīng)用程序,該程序基于Ahituv的臨床決策模型,包含患者數(shù)據(jù)輸入、患者譫妄危險因素預(yù)測結(jié)果輸入、使用簡版譫妄評估量表進(jìn)行譫妄評估、譫妄預(yù)防干預(yù)應(yīng)用等四個模塊,經(jīng)驗證該程序可顯著提高譫妄預(yù)測能力[30]。
ML技術(shù)用于臨床醫(yī)學(xué)領(lǐng)域是當(dāng)前研究熱點,關(guān)于POD相關(guān)的ML預(yù)測模型的研究亦取得了積極進(jìn)展,顯示出獨特優(yōu)勢及極佳的應(yīng)用價值。但多數(shù)研究模型局限于某類手術(shù)POD的預(yù)測,缺乏臨床推廣及實用的普適性。在風(fēng)險因素篩選、預(yù)測模型評估驗證等方面存在諸多差異,結(jié)合臨床客觀檢查指標(biāo)構(gòu)建ML風(fēng)險預(yù)測模型研究較少。如何減少偏倚,進(jìn)行有效的內(nèi)部驗證和多中心的外部驗證,提高預(yù)測模型的穩(wěn)定性、準(zhǔn)確性及實用性,是將來POD風(fēng)險預(yù)測模型構(gòu)建研究的重點。