[摘要]"目的"基于極限梯度提升(extreme"gradient"boosting,XGBoost)構(gòu)建胸腰椎骨折內(nèi)固定術(shù)后發(fā)生下肢深靜脈血栓(deep"vein"thrombosis,DVT)的預(yù)測模型。方法"選取2019年1月至2022年12月于溫州醫(yī)科大學(xué)附屬第一醫(yī)院行胸腰椎骨折內(nèi)固定術(shù)患者220例,分為訓(xùn)練集(154例)和測試集(66例)。訓(xùn)練集經(jīng)過合成少數(shù)類過采樣技術(shù)處理,基于XGBoost建立預(yù)測模型,在測試集上采用受試者操作特征曲線下面積、準(zhǔn)確率、F1得分、敏感度和特異性指標(biāo)比較性能,并基于SHAP值量化影響因素的貢獻程度進行可解釋性分析。結(jié)果"XGBoost模型在多個指標(biāo)上的表現(xiàn)優(yōu)于邏輯回歸、支持向量機和隨機森林模型,其在原測試集上的曲線下面積為0.761,臨床決策曲線表明其有一定的臨床應(yīng)用價值。結(jié)論"基于年齡、體質(zhì)量指數(shù)及術(shù)后白蛋白、D-二聚體、總蛋白、紅細胞沉降率、凝血酶原時間建立的XGBoost模型可有效預(yù)測胸腰椎骨折內(nèi)固定術(shù)后下肢DVT的發(fā)生,在臨床實踐中具有良好的應(yīng)用前景。
[關(guān)鍵詞]"胸腰椎骨折;下肢深靜脈血栓;合成少數(shù)類過采樣技術(shù);極限梯度提升;可解釋性分析
[中圖分類號]"R619""""""[文獻標(biāo)識碼]"A""""[DOI]"10.3969/j.issn.1673-9701.2024.33.010
A"XGBoost"model"for"risk"prediction"of"lower"extremity"deep"vein"thrombosis"after"internal"fixation"surgery"for"thoracolumbar"fractures
LIAO"Jiajia,"LIANG"Xiaona,"XU"Xiaojing,"ZHAN"Jiangxian
391"Ward"of"Spine"Surgery,"the"First"Affiliated"Hospital"of"Wenzhou"Medical"University,"Wenzhou"325000,"Zhejiang,"China
[Abstract]"Objective"To"construct"a"predictive"model"for"the"occurrence"of"lower"extremity"deep"vein"thrombosis"(DVT)"after"internal"fixation"surgery"for"thoracolumbar"fractures"by"using"extreme"gradient"boosting"(XGBoost)."Methods"Data"of"220"patients"who"underwent"internal"fixation"surgery"for"thoracolumbar"fractures"in"the"First"Affiliated"Hospital"of"Wenzhou"Medical"University"from"January"2019"to"December"2022"was"collected."The"dataset"was"divided"into"a"training"set"(154"cases)"and"a"testing"set"(66"cases)."The"training"set"was"processed"by"using"the"synthetic"minority"over-sampling"technique"and"the"predictive"model"was"build"based"on"XGBoost."The"performance"was"compared"on"the"testing"set"by"using"area"under"receiver"operating"characteristic"curve,"accuracy,nbsp;F1"score,"sensitivity"and"specificity."The"interpretability"analysis"base"on"SHAP"was"conducted"to"quantify"the"degree"of"contribution"of"influencing"factors."Results"The"XGBoost"model"outperformed"logistic"regression,"support"vector"machine"and"random"forest"models"on"multiple"metrics,"with"an"area"under"the"curve"of"0.761"on"the"original"testing"set."The"decision"curve"indicated"that"the"XGBoost"model"has"clinical"application"value."Conclusion"The"XGBoost"model"based"on"factors"such"as"age,"body"mass"index,"and"postoperative"albumin,"D-dimer,"total"protein,"erythrocyte"sedimentation"rate,"prothrombin"time"can"effectively"predict"the"occurrence"of"lower"extremity"DVT"after"internal"fixation"surgery"for"thoracolumbar"fractures,"which"has"good"potential"for"clinical"application.
[Key"words]"Thoracolumbar"fractures;"Deep"vein"thrombosis;"Synthetic"minority"over-sampling"technique;"Extreme"gradient"boosting;"Interpretability"analysis
胸腰椎骨折多由骨質(zhì)疏松或外力作用(車禍、摔倒或高墜等)所致,因其特殊的解剖功能特點,臨床上多以手術(shù)治療為主,而術(shù)后下肢深靜脈血栓(deep"vein"thrombosis,DVT)是最常見和最危險的并發(fā)癥之一,嚴(yán)重者可導(dǎo)致肺栓塞,危及患者的生命[1]。研究顯示脊柱外科術(shù)后患者下肢DVT發(fā)生率為0.3%~"31.0%[2]。因此,及時評估患者的血栓形成風(fēng)險并采取預(yù)防措施尤為重要。目前,關(guān)于胸腰椎骨折術(shù)后下肢DVT事件發(fā)生的危險因素還未形成共識。本研究通過回顧性分析探討胸腰椎骨折內(nèi)固定術(shù)后發(fā)生下肢DVT的危險因素。以機器學(xué)習(xí)為代表的數(shù)據(jù)驅(qū)動方法近年來在包括醫(yī)學(xué)在內(nèi)的領(lǐng)域得到大量有效的驗證。Tseng等[3]使用多個機器學(xué)習(xí)模型預(yù)測患者心臟手術(shù)相關(guān)的急性腎損傷,Chang等[4]使用極限梯度提升(extreme"gradient"boosting,XGBoost)模型和聚類算法分析高血壓相關(guān)癥狀的概率。然而,機器學(xué)習(xí)模型常被視為一個“黑箱”,其中間過程和內(nèi)在機制難以解釋[5]?;赟hapley值解釋(Shapley"additive"explanation,SHAP)的方法可量化每個特征對預(yù)測結(jié)果的貢獻,提高模型的可解釋性。本研究利用XGBoost構(gòu)建風(fēng)險預(yù)測模型,評價其性能并利用SHAP對模型進行可解釋性分析,探究術(shù)后發(fā)生下肢DVT的關(guān)鍵因素,以期為早期預(yù)防、診斷和治療DVT提供參考。
1""資料與方法
1.1""研究對象
采取回顧性研究方法選取2019年1月至2022年12月于溫州醫(yī)科大學(xué)附屬第一醫(yī)院行胸腰椎骨折內(nèi)固定術(shù)患者220例。參考《深靜脈血栓形成的診斷和治療指南(第三版)》[6]中關(guān)于下肢DVT的診斷標(biāo)準(zhǔn),根據(jù)術(shù)后超聲結(jié)果將患者分為無血栓形成組(無DVT組)和血栓形成組(DVT組)。其中無DVT組194例,DVT組26例。本研究經(jīng)溫州醫(yī)科大學(xué)附屬第一醫(yī)院倫理委員會審批通過[倫理審批號:(2024)第(R146)號]。
納入標(biāo)準(zhǔn):①經(jīng)影像學(xué)檢查確診為胸腰椎骨折;②行胸腰椎骨折切開復(fù)位內(nèi)固定術(shù);③術(shù)前影像學(xué)檢查均未發(fā)生下肢DVT;④術(shù)后住院期間行下肢靜脈超聲檢查。排除標(biāo)準(zhǔn):①既往有DVT或肺栓塞史;②有長期應(yīng)用抗凝藥或激素史;③有下肢靜脈手術(shù)史;④合并下肢外周血管病變;⑤合并下肢靜脈病變;⑥合并除胸腰椎外其他部位骨折;⑦合并休克、全身嚴(yán)重多發(fā)傷、顱腦損傷、意識不清或表達障礙;⑧合并惡性腫瘤,嚴(yán)重心、肺、肝、腎等臟器功能障礙及凝血功能障礙。
1.2""方法
通過查閱電子病歷系統(tǒng)收集患者的臨床資料。①一般資料:性別、年齡、體質(zhì)量指數(shù)(body"mass"index,BMI)、吸煙史、飲酒史、手術(shù)時長;②并發(fā)癥:高血壓、糖尿病、高血脂、冠心?。虎坌g(shù)后化驗檢測指標(biāo):D-二聚體、血小板計數(shù)、纖維蛋白原、活化部分凝血活酶時間、凝血酶時間、凝血酶原時間(prothrombin"time,PT)、紅細胞沉降率(erythrocyte"sedimentation"rate,ESR)、總蛋白、白蛋白、C反應(yīng)蛋白。
1.3""統(tǒng)計學(xué)方法
采用SPSS"26.0統(tǒng)計學(xué)軟件對數(shù)據(jù)進行處理分析。計數(shù)資料以例數(shù)(百分率)[n(%)]表示,組間比較采用c2檢驗;計量資料先行Shapiro-Wilk檢驗,符合正態(tài)分布的計量資料以均數(shù)±標(biāo)準(zhǔn)差()表示,組間比較采用t檢驗,不符合正態(tài)分布的計量資料以中位數(shù)(四分位數(shù)間距)[M(Q1,Q3)]表示,組間比較采用Mann-Whitney"U檢驗。部分化驗指標(biāo)缺失數(shù)據(jù)使用平均值填充。P≤0.05為差異有統(tǒng)計學(xué)意義。
在機器學(xué)習(xí)中,偏差刻畫模型預(yù)測值與真實值之間的差,方差刻畫模型預(yù)測值的離散程度。XGBoost模型在提升法的基礎(chǔ)上,利用正則化、樹剪枝和子采樣等方法有效降低方差。因此,XGBoost模型具有卓越的性能并廣泛應(yīng)用于各種場景。
首先,將原始數(shù)據(jù)集(220例)按7∶3的比例劃分為訓(xùn)練集(154例)和測試集(66例)。針對訓(xùn)練集中樣本不平衡的問題,對訓(xùn)練集樣本進行合成少數(shù)類過采樣技術(shù)(synthetic"minority"over-sampling"technique,SMOTE)的處理,設(shè)置最后的無DVT組與DVT組比例相同,將過采樣后產(chǎn)生的數(shù)據(jù)集劃分為SMOTE后訓(xùn)練集和SMOTE后測試集,訓(xùn)練集和測試集比例為9∶1。其次,采用Python"3建立XGBoost模型,在原測試集上計算受試者操作特征曲線下面積(area"under"the"curve,AUC)、準(zhǔn)確率、F1得分、敏感度和特異性并比較性能,利用SHAP對特征進行重要性排序,挑選個例進行可解釋性分析。
2""結(jié)果
2.1""兩組患者的臨床資料比較
兩組患者的性別、年齡、D-二聚體、血小板計數(shù)、ESR、總蛋白、白蛋白比較,差異有統(tǒng)計學(xué)意義(P≤0.05),見表1。
2.2""模型效果對比
邏輯回歸(logistic"regression,LR)、支持向量機(support"vector"machine,SVM)、隨機森林(random"forest,RF)和XGBoost是4種常用的機器學(xué)習(xí)算法,在原測試集上評估的結(jié)果見表2,其中XGBoost模型在AUC、準(zhǔn)確率、F1得分和特異性上均優(yōu)于其他模型,受試者操作特征曲線(receiver"operating"characteristic"curve,ROC曲線)見圖1。利用原測試集繪制決策曲線,見圖2。相比LR模型和SVM模型,RF模型和XGBoost模型的決策曲線大部分位于全部采取干預(yù)措施曲線和不采取干預(yù)措施曲線上方,說明其在臨床實踐中具有一定的實用性和效益。
2.3""影響因素可解釋性分析
2.3.1""特征重要性分析""本研究納入的影響因素包括性別、年齡、BMI、高血壓、糖尿病、高血脂、冠心病、吸煙史、飲酒史、手術(shù)時長、D-二聚體、術(shù)后血小板計數(shù)、術(shù)后纖維蛋白原、活化部分凝血活酶時間、凝血酶時間、PT、ESR、總蛋白、白蛋白、C反應(yīng)蛋白。為對模型進行直觀性解釋,對胸腰椎骨折內(nèi)固定術(shù)后患者發(fā)生下肢DVT的特征重要性進行分析。特征權(quán)重排序見圖3,結(jié)果顯示影響患者術(shù)后發(fā)生下肢DVT的因素從大到小依次為年齡、白蛋白、D-二聚體、BMI、總蛋白、ESR、PT。
模型的平均特征重要性分布見圖4,正數(shù)代表該特征使模型傾向于預(yù)測發(fā)生DVT,負數(shù)代表該特征使模型傾向于預(yù)測不發(fā)生DVT,絕對值大小量化特征的貢獻程度。色帶圖代表特征值的大小,顏色越藍代表特征值越小,顏色越紅代表特征值越大。如高齡使模型傾向于預(yù)測發(fā)生DVT,低齡使模型傾向于預(yù)測不發(fā)生DVT。
2.3.2""典型預(yù)測的解釋""選取1例預(yù)測為DVT的樣本,其SHAP解釋見圖5,該樣本為術(shù)后發(fā)生下肢DVT的77歲患者,白蛋白27.3g/L低于正常范圍,而D-二聚體20mg/L、ESR"72mm/h遠高于正常范圍,其中高齡和低白蛋白水平是模型預(yù)測該患者發(fā)生DVT的重要因素。
3""討論
3.1""胸腰椎骨折內(nèi)固定術(shù)后下肢DVT的危險因素
基于SHAP值分析可知,高齡、術(shù)后低白蛋白、術(shù)后D-二聚體水平高、BMI高、術(shù)后總蛋白水平異常、術(shù)后ESR高、術(shù)后PT縮短均是胸腰椎骨折內(nèi)固定術(shù)后下肢DVT的危險因素。高齡患者術(shù)后更易發(fā)生下肢DVT,其原因可能為隨著年齡的增長,血管壁逐漸失去彈性和柔韌性而變得脆弱;血管內(nèi)皮功能退化及心臟泵血能力下降可使血液流動減慢,血液中的凝血因子更容易聚集在一起[7-8]。此外,高齡患者因手術(shù)后疼痛致活動減少,使血液運行滯緩,加劇術(shù)后發(fā)生下肢DVT的風(fēng)險。白蛋白是一種主要由肝臟合成的蛋白質(zhì),廣泛存在于血液中,具有天然抗凝作用,與血液中凝血因子結(jié)合以減少凝血因子在血栓形成中的活性,通過抗氧化作用減少血管內(nèi)皮的氧化應(yīng)激。低白蛋白水平可通過增加炎癥反應(yīng)和血液黏度等多種機制提高下肢DVT形成的風(fēng)險。D-二聚體是一種反映纖溶酶激活與交聯(lián)蛋白形成的特異性分子標(biāo)志物。因其水平穩(wěn)定性、對纖溶及凝血狀態(tài)評價的特異性及敏感度可直觀反映機體纖溶活性與凝血功能狀態(tài),對DVT的形成與發(fā)展發(fā)揮重要作用[9]。Yamasaki等[10]研究發(fā)現(xiàn),患者腰椎術(shù)后1周D-二聚體為19.5μg/ml時DVT風(fēng)險增加4.09倍。Jiang等[11]研究顯示D-二聚體異常升高程度與血栓形成概率及其大小呈正相關(guān)。BMI作為衡量體質(zhì)量的重要指標(biāo),本研究中DVT組患者BMI達到(25.05±3.85)kg/m2,屬于超重。研究發(fā)現(xiàn)超重患者體內(nèi)脂肪含量明顯高于正常人群,脂肪堆積可增加靜脈系統(tǒng)的壓力,尤其是下肢靜脈,進而導(dǎo)致血液回流不暢,增大下肢DVT發(fā)生的風(fēng)險[12]。此外,超重患者手術(shù)過程中可因術(shù)野暴露困難而導(dǎo)致周圍組織和軟組織損傷較多[13]??偟鞍捉M成成分的變化對血栓形成有重要影響,這些變化直接影響血液黏度和凝固特性,或間接通過慢性疾病和全身炎癥狀態(tài)增加下肢DVT風(fēng)險。陳小蘭等[14]研究發(fā)現(xiàn)ESR與下肢DVT形成顯著相關(guān)。炎癥反應(yīng)可導(dǎo)致血液中凝血因子的活化和血小板聚集,從而提高ESR,增加下肢DVT風(fēng)險。PT是外源凝血系統(tǒng)較為靈敏和最為常用的篩選指標(biāo),主要反映凝血因子Ⅶ、Ⅹ、Ⅱ、Ⅴ及組織因子在體內(nèi)的活性。當(dāng)PT縮短時表面凝血過程加速,提示機體處于高凝狀態(tài),下肢DVT風(fēng)險增加[15]。
3.2""XGBoost模型效能和臨床價值
本研究構(gòu)建胸腰椎骨折內(nèi)固定術(shù)后下肢DVT風(fēng)險預(yù)測模型,并利用SHAP值彌補機器學(xué)習(xí)模型“黑箱”的缺點。模型在臨床中作為一種輔助工具,可有效識別高風(fēng)險患者,預(yù)防下肢DVT的發(fā)生。XGBoost模型在測試集上的表現(xiàn)優(yōu)于LR等模型,且在臨床決策上具有一定應(yīng)用價值。利用SHAP值模型揭示年齡、白蛋白、D-二聚體、BMI、總蛋白、ESR、PT與發(fā)生下肢DVT的非線性關(guān)系,有助于進一步探索下肢DVT發(fā)生的機制,為制定合理的干預(yù)方案提供依據(jù)。對高齡患者,在病情允許的情況下可適當(dāng)下床活動以加快下肢血液流速,預(yù)防DVT發(fā)生。術(shù)后白蛋白較低的患者可予圍手術(shù)期白蛋白及營養(yǎng)補充治療。術(shù)后應(yīng)對患者的D-二聚體、ESR、凝血功能等指標(biāo)進行動態(tài)監(jiān)測,及時給予低分子量肝素等抗凝藥物以預(yù)防下肢DVT的發(fā)生。同時,應(yīng)做好基礎(chǔ)預(yù)防、物理預(yù)防,包括正確使用彈力襪、間歇性充氣加壓裝置等。
綜上所述,基于XGBoost的胸腰椎骨折內(nèi)固定術(shù)后下肢DVT風(fēng)險預(yù)測模型具有較好的效果。本研究將SHAP值用于量化每個特征對預(yù)測結(jié)果的貢獻,從而幫助醫(yī)護人員理解影響因素與預(yù)測結(jié)果之間的復(fù)雜關(guān)系。年齡、白蛋白、D-二聚體、BMI、總蛋白、ESR、PT可作為識別高風(fēng)險患者并進行干預(yù)的參考依據(jù)。針對每一個樣本,SHAP解釋圖可清晰展現(xiàn)各個因素對預(yù)測結(jié)果的影響程度。本研究屬于回顧性研究,且所有數(shù)據(jù)均來源于單中心調(diào)查,可能存在一定偏倚,后續(xù)應(yīng)進行外部多中心、大樣本量的研究進行驗證,以進一步探討其在臨床中的應(yīng)用價值。
利益沖突:所有作者均聲明不存在利益沖突。
[參考文獻]
[1] FUJI"T,"AKAGI"M,"ABE"Y,"et"al."Incidence"of"venous"thromboembolism"and"bleeding"events"in"patients"with"lower"extremity"orthopedic"surgery:"A"retrospective"analysis"of"a"Japanese"healthcare"database[J]."J"Orthop"Surg"Res,"2017,"12:"1–9.
[2] GLOTZBECKER"M"P,"BONO"C"M,"WOOD"K"B,"et"al."Thromboembolic"disease"in"spinal"surgery:"A"systematic"review[J]."Spine,"2009,"34(3):"291–303.
[3] TSENG"P"Y,"CHEN"Y"T,"WANG"C"H,"et"al."Prediction"of"the"development"of"acute"kidney"injury"following"cardiac"surgery"by"machine"learning[J]."Crit."Care,nbsp;2020,"24:"1–13.
[4] CHANG"W,"LIU"Y,"XIAO"Y,"et"al."A"machine-learning-based"prediction"method"for"hypertension"outcomes"based"on"medical"data[J]."Diagnosis,"2019,"9(4):"178.
[5] MEDICINE"T"L"R."Opening"the"black"box"of"machine"learning[J]."The"Lancet,"2018,"6(11):"801.
[6] 李曉強,"張福先,"王深明."深靜脈血栓形成的診斷和治療指南"(第三版)[J]."中國血管外科雜志,"2017,"9(4):"250–257.
[7] TOMINAGA"H,"SETOGUCHI"T,"TANABE"F,"et"al."Risk"factors"for"venous"thromboembolism"after"spine"surgery[J]."Medicine,"2015,"94(5):"e466.
[8] ZHAO"C"M,"ZHANG"Y,"YANG"S"D,"et"al."Risk"factors"for"lower"limb"deep"vein"thrombosis"in"patients"with"single-level"lumbar"fusion:"A"prospective"study"of"710"cases[J]."Clin"Appl"Thromb/Hemost,"2018,"24(9_suppl):"157S–162S.