楊佳蕾,陳思玎,孟霞,姜勇,王擁軍
在我國(guó),卒中是導(dǎo)致死亡和長(zhǎng)期殘疾的主要原因。高血糖不僅是卒中發(fā)病的獨(dú)立危險(xiǎn)因素,也是導(dǎo)致患者死亡和殘疾的危險(xiǎn)因素之一,對(duì)預(yù)后有顯著影響[1-2]。研究顯示約40%的急性缺血性卒中患者入院時(shí)合并糖尿病或有血糖異常升高,這些患者的住院時(shí)間更長(zhǎng)且短期和長(zhǎng)期死亡率均更高[3]。針對(duì)血糖異常的急性缺血性卒中人群建立預(yù)后的預(yù)測(cè)模型,從而對(duì)患者進(jìn)行精準(zhǔn)風(fēng)險(xiǎn)分層和管理,對(duì)優(yōu)化醫(yī)療資源配置和改善患者預(yù)后有重要意義。
目前常用的卒中預(yù)后預(yù)測(cè)模型主要是基于回歸模型進(jìn)行構(gòu)建[4]。大數(shù)據(jù)時(shí)代的到來(lái)對(duì)數(shù)據(jù)處理邏輯、效率和深度都提出了更高要求,機(jī)器學(xué)習(xí)在臨床醫(yī)學(xué)中得到了更深入的應(yīng)用[5]。本研究基于中國(guó)國(guó)家卒中登記研究Ⅲ(China national stroke registration studyⅢ,CNSR-Ⅲ),采用傳統(tǒng)logistic回歸和機(jī)器學(xué)習(xí)的方法建立血糖異常急性缺血性卒中患者的預(yù)后預(yù)測(cè)模型,并對(duì)其預(yù)測(cè)性能進(jìn)行比較,以期為建立更完善的預(yù)測(cè)模型提供借鑒。
1.1 研究對(duì)象 本研究基于CNSR-Ⅲ研究。CNSR-Ⅲ為全國(guó)多中心的前瞻性卒中隊(duì)列研究,納入2015年8月-2018年3月的急性缺血性卒中或TIA患者15 166例。CNSR-Ⅲ的研究設(shè)計(jì)、隨訪(fǎng)方案、患者臨床特征等信息已經(jīng)發(fā)表[6]。本研究納入標(biāo)準(zhǔn):①納入CNSR-Ⅲ研究;②年齡≥18歲;③完成頭顱MRI檢測(cè),經(jīng)DWI序列檢測(cè)明確有高信號(hào);④有糖尿病史或入院后經(jīng)檢測(cè)判斷符合糖尿病診斷標(biāo)準(zhǔn);⑤有3個(gè)月隨訪(fǎng)的mRS記錄。CNSR-Ⅲ研究獲得首都醫(yī)科大學(xué)附屬北京天壇醫(yī)院倫理委員會(huì)的批準(zhǔn)(文件號(hào):KY2015-001-01),患者或其家屬均簽署知情同意書(shū)。
1.2 預(yù)測(cè)變量和結(jié)局變量 本研究的結(jié)局變量是急性缺血性卒中發(fā)病3個(gè)月預(yù)后不良。以面對(duì)面方式對(duì)患者進(jìn)行隨訪(fǎng),根據(jù)mRS分為預(yù)后良好組(mRS 0~2分)和預(yù)后不良組(mRS 3~6分)。
結(jié)合臨床經(jīng)驗(yàn)、既往文獻(xiàn)報(bào)道以及本研究數(shù)據(jù)收集情況(缺失值<30%)確定納入模型分析的預(yù)測(cè)因子,包括年齡、性別、BMI、發(fā)病前mRS、吸煙史、重度飲酒史、卒中病史、高血壓、脂代謝紊亂、冠心病、心房顫動(dòng)、腎功能不全、肝功能不全、發(fā)病至到院時(shí)間≤24 h、入院NIHSS、出院NIHSS、≥50%責(zé)任顱內(nèi)動(dòng)脈狹窄、≥50%責(zé)任顱外動(dòng)脈狹窄、多發(fā)梗死灶、梗死灶前后循環(huán)分布、TOAST分型等臨床特點(diǎn),入院后24 h內(nèi)的實(shí)驗(yàn)室檢查結(jié)果(白蛋白、球蛋白、血紅蛋白、纖維蛋白原、HDL-C、hs-CRP、糖化血紅蛋白、脂蛋白磷脂酶A2活性及含量、脂蛋白a、前蛋白轉(zhuǎn)換酶枯草溶菌素9、人幾丁質(zhì)酶3樣蛋白1、載脂蛋白-C3、載脂蛋白-A2),入院后的治療措施(抗血小板、抗凝、降壓、降脂、抗氧化和降糖治療)。
1.3 模型構(gòu)建 缺失數(shù)據(jù)中的連續(xù)變量采用線(xiàn)性插值法填補(bǔ),分類(lèi)變量采用眾數(shù)填補(bǔ)。本研究采用傳統(tǒng)logistic回歸以及隨機(jī)森林模型、梯度提升決策樹(shù)(gradient boosted decision trees,GBDT)模型和極致梯度提升(eXtreme Gradient Boosting,XGBoost)等機(jī)器學(xué)習(xí)模型。
1.3.1 數(shù)據(jù)集劃分 采用分層采樣10折交叉驗(yàn)證的方法將數(shù)據(jù)集隨機(jī)平均分割成10份,循環(huán)抽取其中9份作為訓(xùn)練集,用于預(yù)測(cè)模型訓(xùn)練,通過(guò)逐漸減少訓(xùn)練誤差達(dá)到模型參數(shù)權(quán)重的優(yōu)化;另外1份作為測(cè)試集,對(duì)不同模型的預(yù)測(cè)效能進(jìn)行評(píng)價(jià)與對(duì)比[7]。
1.3.2 機(jī)器學(xué)習(xí)預(yù)測(cè)模型 隨機(jī)森林模型是一種由多決策樹(shù)構(gòu)成的集成算法,每棵決策樹(shù)針對(duì)樣本進(jìn)行獨(dú)立判斷,最后綜合多決策樹(shù)的分類(lèi)情況得到預(yù)測(cè)結(jié)局的最終結(jié)果。隨機(jī)森林模型可以處理高維度數(shù)據(jù),無(wú)需做特征選擇,對(duì)變量的共線(xiàn)性不敏感,結(jié)果對(duì)于非平衡數(shù)據(jù)比較穩(wěn)健[8]。GBDT模型使用回歸樹(shù)作為決策樹(shù),采用連續(xù)的方式構(gòu)造決策樹(shù),每棵樹(shù)都試圖糾正前一棵樹(shù)的錯(cuò)誤,目的是使最終的預(yù)測(cè)誤差最小。每棵樹(shù)只能對(duì)部分?jǐn)?shù)據(jù)做出好的預(yù)測(cè),所有樹(shù)的結(jié)論累加起來(lái)得到最終結(jié)果,是一種泛化能力較強(qiáng)的算法[9-10]。XGBoost模型的本質(zhì)是GBDT模型,但是對(duì)算法進(jìn)行了改進(jìn),具備可擴(kuò)展、高效的特點(diǎn)[11]。在XGBoost機(jī)器模型中,預(yù)測(cè)因子的重要性通過(guò)SHAP值體現(xiàn),使用SHAP值顯示變量特征對(duì)模型輸出影響的分布[12]。
1.4 統(tǒng)計(jì)學(xué)方法 使用SAS 9.4軟件進(jìn)行統(tǒng)計(jì)學(xué)分析。符合正態(tài)分布的連續(xù)變量以表示,非正態(tài)分布的連續(xù)變量以M(P25~P75)表示,組間單因素分析采用t檢驗(yàn)或Wilcoxon秩和檢驗(yàn);分類(lèi)變量以頻數(shù)(%)表示,組間單因素分析采用χ2檢驗(yàn)。將所有預(yù)測(cè)變量納入logistic回歸模型和機(jī)器學(xué)習(xí)模型,計(jì)算各模型ROC的AUC,采用Brier分?jǐn)?shù)評(píng)價(jià)校準(zhǔn)度,綜合F1分?jǐn)?shù)、準(zhǔn)確率、靈敏度和特異度評(píng)價(jià)不同模型的預(yù)測(cè)價(jià)值。以P<0.05為差異具有統(tǒng)計(jì)學(xué)意義。
2.1 基本資料 研究共納入3694例符合標(biāo)準(zhǔn)的患者,平均年齡62.4±10.4歲,男性2408例(65.2%),3個(gè)月預(yù)后良好3109例(84.2%),預(yù)后不良585例(15.8%)。單因素分析顯示預(yù)后不良組的年齡、入院和出院NIHSS高于預(yù)后良好組,卒中病史、高血壓、冠心病、心房顫動(dòng)、腎功能不全、發(fā)病至到院≤24 h、≥50%責(zé)任顱內(nèi)動(dòng)脈狹窄、≥50%責(zé)任顱外動(dòng)脈狹窄、多發(fā)梗死比例和住院期間的抗凝、降壓、降糖治療的比例高于預(yù)后良好組,實(shí)驗(yàn)室檢查中球蛋白、纖維蛋白原、hs-CRP、脂蛋白a、人幾丁質(zhì)酶3樣蛋白1水平高于預(yù)后良好組;BMI,男性、吸煙史和住院后抗血小板治療比例,白蛋白、血紅蛋白、載脂蛋白-C3和載脂蛋白-A2水平低于預(yù)后良好組;此外,兩組間發(fā)病前mRS、梗死灶前后循環(huán)分布及TOAST分型差異也具有統(tǒng)計(jì)學(xué)意義(表1)。
表1 患者臨床特征
2.2 回歸模型與機(jī)器學(xué)習(xí)模型的預(yù)測(cè)性能比較傳統(tǒng)logistic回歸模型、隨機(jī)森林模型、GBDT模型和X G B o o s t 模型預(yù)測(cè)預(yù)后不良的AUC分別為0.843(0.814~0.872)、0.847(0.823~0.871)、0.845(0.819~0.871)和0.848(0.820~0.876)。機(jī)器學(xué)習(xí)模型的AUC有高于logistic回歸模型的趨勢(shì),但差異沒(méi)有統(tǒng)計(jì)學(xué)意義。在AUC最高的XGBoost模型中,采用SHAP圖可視化重要性前10位的預(yù)測(cè)因子為出院及入院NIHSS、年齡、性別、血紅蛋白水平、hs-CRP水平、白蛋白水平、發(fā)病前mRS、TOAST分型和載脂蛋白-A2水平(圖1)。傳統(tǒng)logistic回歸模型、隨機(jī)森林模型、GBDT模型和XGBoost模型的靈敏度分別為0.373(0.340~0.405)、0.679(0.629~0.728)、0.426(0.383~0.468)和0.634(0.583~0.686),機(jī)器學(xué)習(xí)模型的靈敏度優(yōu)于logistic回歸模型(均P<0.05),所有模型的校準(zhǔn)度均良好,各模型的其他評(píng)價(jià)指標(biāo)包括F1分?jǐn)?shù)、準(zhǔn)確率和特異度差異均無(wú)統(tǒng)計(jì)學(xué)意義(表2)。
表2 logistic回歸模型與機(jī)器學(xué)習(xí)模型對(duì)預(yù)后不良預(yù)測(cè)性能的比較
圖1 極致梯度提升模型中前10位預(yù)測(cè)因子SHAP圖
續(xù)表
本研究基于隨機(jī)森林、GBDT和XGBoost等3種機(jī)器學(xué)習(xí)方法建立了預(yù)測(cè)血糖異常急性缺血性卒中患者3個(gè)月功能預(yù)后的預(yù)測(cè)模型,并且與傳統(tǒng)logistic回歸模型的預(yù)測(cè)效果進(jìn)行比較。研究結(jié)果顯示,盡管機(jī)器學(xué)習(xí)模型的區(qū)分度(AUC)稍?xún)?yōu)于logistic回歸模型,但是并未體現(xiàn)出顯著優(yōu)勢(shì)。這可能是由于本研究納入了3694例患者,3個(gè)月預(yù)后不良者585例,即總樣本量與正樣本數(shù)量相對(duì)于萬(wàn)級(jí)人群數(shù)量較少,沒(méi)有體現(xiàn)出機(jī)器學(xué)習(xí)模型在處理大樣本數(shù)據(jù)方面的優(yōu)勢(shì)。在既往納入2604例急性卒中患者的回顧性研究中,研究者采用深度神經(jīng)網(wǎng)絡(luò)模型、隨機(jī)森林模型及l(fā)ogistic回歸模型預(yù)測(cè)患者3個(gè)月功能預(yù)后良好(mRS 0~2分),并且與洛桑急性卒中登記(acute stroke registry and analysis of Lausanne,ASTRAL)量表進(jìn)行比較。研究結(jié)果顯示當(dāng)機(jī)器學(xué)習(xí)模型選擇與ASTRAL評(píng)分相同的變量時(shí),即使采用不同的決策樹(shù)構(gòu)建模型,機(jī)器學(xué)習(xí)也未能顯著提高預(yù)測(cè)模型的效度[13]。對(duì)于納入logistic回歸模型和機(jī)器學(xué)習(xí)模型的預(yù)測(cè)變量,是否需要分別使用單因素或多因素logistic回歸、Boruta算法或其他方式進(jìn)行特征篩選,然后再分別納入不同模型,這值得后續(xù)研究進(jìn)行進(jìn)一步探索。
本研究對(duì)表現(xiàn)最優(yōu)的XGBoost模型的預(yù)測(cè)因子SHAP值進(jìn)行排序,結(jié)果顯示對(duì)預(yù)測(cè)模型影響權(quán)重最大的前3個(gè)變量是出院NIHSS、入院NIHSS和年齡,這與既往研究一致[14-15],提示卒中嚴(yán)重程度與患者年齡是影響預(yù)后的重要因素。除此之外,性別、血紅蛋白水平、hs-CRP水平、白蛋白水平及發(fā)病前mRS均可對(duì)預(yù)后產(chǎn)生顯著影響。在TOAST病因分型中,SHAP值提示其他病因或不明原因型缺血性卒中的預(yù)后欠佳。本研究還發(fā)現(xiàn)低載脂蛋白-A2水平與預(yù)后不良相關(guān)。載脂蛋白-A2主要參與人體HDL-C的合成,低載脂蛋白-A2水平提示低HDL-C水平。有研究報(bào)道載脂蛋白-A2基因敲入家兔的血漿HDL-C水平較對(duì)照組高,在給予高脂飲食后,基因敲入家兔對(duì)飲食引起的高血脂有更好的抵抗能力,并且主動(dòng)脈粥樣硬化斑塊形成較少[16]。本研究中的機(jī)械學(xué)習(xí)模型與既往研究均提示載脂蛋白-A2可能是干預(yù)動(dòng)脈粥樣硬化這一卒中危險(xiǎn)因素的靶點(diǎn)。
本研究存在一定局限性。對(duì)于機(jī)器學(xué)習(xí)模型而言,本研究的總樣本量及正樣本數(shù)量較少,可能影響了機(jī)器學(xué)習(xí)模型構(gòu)建優(yōu)勢(shì)的體現(xiàn)。另外,本研究部分特征變量因發(fā)生較多缺失而被剔除,這對(duì)預(yù)測(cè)模型決策樹(shù)構(gòu)建有一定影響。盡管本研究基于CNSR-Ⅲ研究全面、豐富的臨床特征變量進(jìn)行了分析,但是研究結(jié)果有待進(jìn)一步結(jié)合其他外部大樣本數(shù)據(jù)庫(kù)進(jìn)行聯(lián)合分析與驗(yàn)證。