郭祈福, 張海榮, 邵楠, 童曉維, 黃建釵,5
新型冠狀病毒肺炎(corona virus disease 2019,COVID-19)是由2019新型冠狀病毒感染引起的一種急性呼吸道傳染病,起病急、傳播快、傳染性強(qiáng)、流行范圍廣,其重癥患者易發(fā)生全身炎癥反應(yīng)綜合征,引發(fā)多臟器功能障礙,死亡率高達(dá)13.4%[1]。此外,重癥患者通常需要更多醫(yī)療資源,給醫(yī)療系統(tǒng)造成巨大壓力。因此,早期識別重癥病例至關(guān)重要,有利于醫(yī)療資源的優(yōu)化配置,并改善患者預(yù)后。目前,雖已存在多個成熟且廣泛應(yīng)用的重癥病例預(yù)測模型[2],但多數(shù)是針對大型醫(yī)院收集的COVID-19患者的完整數(shù)據(jù)進(jìn)行危險因素篩選及建模,其中部分指標(biāo)在基層醫(yī)療單位難以獲取,故實用性不強(qiáng),可操作性欠佳。因此,本研究擬納入常用且容易獲得的臨床變量,建立有效實用的預(yù)測模型,以便在不同場景下準(zhǔn)確評估COVID-19患者的病情,幫助早期識別可能發(fā)展為重癥的高?;颊?。
1.1 對象 選取2020年1月17日—3月24日于湖北省宜昌市第三人民醫(yī)院住院的非輕型COVID-19成人患者343例,男性189例,女性154例,年齡(53.41±16.83)歲(18~91歲);訓(xùn)練集240例(70%),男性140例,女性100例,年齡(53.61±16.89)歲(18~88歲);測試集103例(30%),男性49例,女性54例,年齡(52.94±16.77)歲(20~91歲)。診斷標(biāo)準(zhǔn)、臨床分型嚴(yán)格按照《新型冠狀病毒肺炎診療方案(試行第七版)》[3]。重型和危重型病例統(tǒng)稱為重癥病例。排除癥狀輕微且無肺部影像學(xué)改變的輕型患者。
1.2 方法
1.2.1 數(shù)據(jù)收集 收集錄入患者入院時的臨床特征(吸煙和飲酒史、并發(fā)癥、疾病分型、常見癥狀、生命體征等)及實驗室檢查數(shù)據(jù),并經(jīng)專人核查,核查過程存在的任何問題均由兩位專業(yè)醫(yī)師綜合判斷、解釋。
1.2.2 實驗室檢查 患者于入院時采集鼻咽拭子標(biāo)本進(jìn)行實時熒光定量聚合酶鏈反應(yīng)(real time fluorescent quantitative polymerase chain reaction, qRT-PCR)以確診,采集血液進(jìn)行血常規(guī)、血清生化(包括肝腎功能、肌酸激酶、肌酸激酶同工酶和乳酸脫氫酶等)、凝血功能、C反應(yīng)蛋白和降鈣素原等檢查。
內(nèi)部建模:訓(xùn)練集240例,根據(jù)病情分為重癥組和非重癥組,將患者入院時的臨床特征及實驗室檢查指標(biāo)采用非條件單因素logistic回歸分析,初步篩選COVID-19重癥病例的潛在預(yù)測因素,將單因素分析具有統(tǒng)計學(xué)意義的指標(biāo)納入多因素logistic回歸分析(方法:向前),按分析模型的復(fù)雜程度分為自評模型(模型1)、基層模型(模型2)和復(fù)雜模型(模型3)。模型1:納入在上述單因素分析中P<0.05 的人口統(tǒng)計學(xué)特征、并發(fā)癥和臨床癥狀;模型2:除了模型1納入的因素外,增加了上述單變量分析中P<0.05的生命征和門診常規(guī)評估的化驗指標(biāo);模型3則包含了所有上述單變量分析中P<0.05的因素。
模型評估(內(nèi)部驗證與外部驗證):采用R軟件(版本3.6.1),采用一致性指數(shù)及Nomogram列線圖評價預(yù)測模型的判別能力。將多因素分析中具有統(tǒng)計學(xué)意義指標(biāo)的OR值取整賦值,計算各患者3種模型得分。為便于評估每個患者的具體病情,結(jié)合其得分,運(yùn)用列線圖對每個患者的重癥概率進(jìn)行預(yù)測分析。列線圖中,每個預(yù)測變量均單獨繪制,變量狀態(tài)與最頂部指定的點值相對應(yīng),最后將這些變量的點值相加并繪制在底部的總分標(biāo)度尺上,該標(biāo)度對應(yīng)最底部的點值即發(fā)生重癥COVID-19的風(fēng)險值。內(nèi)部驗證:將訓(xùn)練集患者的總分進(jìn)行ROC曲線分析,通過Z檢驗比較3種模型曲線下面積評估預(yù)測模型效果,通過約登指數(shù)法確定診斷界值,計算模型的靈敏度、特異度、陽性預(yù)測值及陰性預(yù)測值。外部驗證:通過計算測試集患者3種模型得分并進(jìn)行ROC曲線分析,同樣通過Z檢驗比較3種模型曲線下面積評估預(yù)測模型效果,通過訓(xùn)練集樣本確定的診斷界值,計算3種模型的靈敏度、特異度、陽性預(yù)測值及陰性預(yù)測值。
2.1 訓(xùn)練集和測試集患者的臨床特征和實驗室指標(biāo)比較 兩組患者入院時的臨床特征和實驗室指標(biāo)差別均無統(tǒng)計學(xué)意義(表1~2)。
2.2 訓(xùn)練集患者的臨床特征 訓(xùn)練集240例中,入院時重癥45例(18.75%);76例(31.7%)患者至少有1個并發(fā)癥,常見的并發(fā)癥為高血壓病60例(25.0%)、糖尿病28例(11.7%)和冠心病12例(5.0%);常見的癥狀為發(fā)熱191例(79.6%)、咳嗽176例(73.3%)和咳痰109例(45.4%),具體見表3。訓(xùn)練集患者入院時的實驗室檢查結(jié)果見表4。
表1 訓(xùn)練集和測試集患者臨床特征的比較
表2 訓(xùn)練集和測試集患者的實驗室指標(biāo)比較
表2 (續(xù))
表3 訓(xùn)練集患者入院時臨床特征中計數(shù)資料的描述性分析
表3 (續(xù))
表4 訓(xùn)練集患者入院時臨床特征和實驗室指標(biāo)中計量資料的描述性分析
2.3 采用單因素和多因素logistic回歸分析篩選重癥患者的預(yù)測因素 針對訓(xùn)練集患者總共36個變量進(jìn)行單因素logistic回歸分析,結(jié)果顯示,22個變量(包括年齡、并發(fā)癥、從發(fā)病到首次入院的時間、發(fā)熱、咳嗽、咳痰、呼吸困難、疲勞、呼吸頻率>24 min-1,以及入院時血淋巴細(xì)胞、血紅蛋白、血小板、直接膽紅素、白蛋白、天門冬氨酸氨基轉(zhuǎn)移酶、乳酸脫氫酶、肌酸激酶、肌酸激酶同工酶MB、部分凝血活酶時間、D-二聚體、C反應(yīng)蛋白和降鈣素原的水平)均與重癥COVID-19的發(fā)生相關(guān),作為建立預(yù)測模型的預(yù)備因素(表5~6)。進(jìn)一步行多因素logistic 回歸分析發(fā)現(xiàn),存在并發(fā)癥、發(fā)熱、咳痰、呼吸困難、血淋巴細(xì)胞數(shù)減少和D-二聚體升高是重癥COVID-19的獨立預(yù)測因素(模型3,表7)。
表5 單因素logistic回歸分析篩選重癥新型冠狀病毒肺炎預(yù)測因素(臨床特征)
表6 單因素logistic回歸分析篩選重癥新型冠狀病毒肺炎預(yù)測因素(實驗室指標(biāo))
表6 (續(xù))
表7 重癥新型冠狀病毒肺炎3種預(yù)測模型的多因素logistic回歸分析結(jié)果
本研究通過多因素logistic回歸分析構(gòu)建了3個預(yù)測重癥COVID-19的模型:自評模型(模型1)、基層模型(模型2)和復(fù)雜模型(模型3),詳見表7。
模型1納入在上述單變量分析中P<0.05的年齡、并發(fā)癥和臨床癥狀(包括發(fā)熱、咳嗽、咳痰、呼吸困難和疲勞),多因素logistic回歸分析發(fā)現(xiàn)存在并發(fā)癥、發(fā)熱、咳痰和呼吸困難是重癥COVID-19的獨立預(yù)測因素。模型2除了模型1納入的因素外,增加了上述單變量分析中P<0.05的呼吸頻率、血常規(guī)中的淋巴細(xì)胞數(shù)、血紅蛋白、血小板和C反應(yīng)蛋白水平,多變量分析發(fā)現(xiàn)存在并發(fā)癥、發(fā)熱、咳痰、呼吸困難、血淋巴細(xì)胞數(shù)減少是重癥COVID-19 的獨立預(yù)測因素。模型3則包含了所有上述單變量分析中P<0.05的因素,多變量分析發(fā)現(xiàn)有并發(fā)癥、發(fā)熱、咳痰、呼吸困難、血淋巴細(xì)胞數(shù)減少和D-二聚體升高是預(yù)測COVID-19重癥病例的獨立危險因素,其中發(fā)熱、D-二聚體升高,尤其呼吸困難是最強(qiáng)有力的預(yù)測因素。3個預(yù)測模型中各預(yù)測因素的OR值詳見表7。
2.4 重癥COVID-19預(yù)測模型的評估(內(nèi)部驗證和外部驗證) 3個預(yù)測模型均以列線圖的形式呈現(xiàn):模型1、2、3的一致性指數(shù)分別為0.902、0.924和0.943,決定系數(shù)R2分別為0.525、0.604和0.664 (圖1)。
圖1 模型1、模型2和模型3的列線圖Fig.1 Nomograms of model 1, model 2 and model 3
3種預(yù)測模型各預(yù)測因素的OR值取整賦值(表8),后在訓(xùn)練集(內(nèi)部驗證)和測試集(外部驗證)通過ROC曲線對3種預(yù)測模型進(jìn)行評估、驗證。圖2顯示了3種預(yù)測模型的ROC曲線。3種模型的ROC曲線下面積(area under ROC,AUROC)在內(nèi)部驗證時分別為0.898、0.920、0.937,在外部驗證時分別為0.870、0.878、0.879(P<0.001)。模型3的AUROC大于模型2,模型2的AUROC大于模型1,但3種模型對于重癥COVID-19的預(yù)測效果差別無統(tǒng)計學(xué)意義(圖2,表9)。內(nèi)部和外部驗證均發(fā)現(xiàn),3種模型預(yù)測重癥COVID-19的效能良好,具有較高的診斷敏感性(84.4%~90.0%)和特異性(67.5%~89.2%)、高的陰性預(yù)測值(negative predictive value,NPV)(均>95%)、可接受的陽性預(yù)測值(positive predictive value,PPV)(內(nèi)部驗證:48.1%~65.0%;外部驗證:40.0%~53.1%)(表10)。
表8 3種預(yù)測模型預(yù)測因素OR值取整賦值情況
A:內(nèi)部驗證;B:外部驗證。圖2 預(yù)測重癥新型冠狀病毒肺炎的受試者工作特效曲線Fig.2 Receiver operating characteristic curves for predicting severe COVID-19
表9 3種模型預(yù)測重癥新型冠狀病毒肺炎的效果比較
早期識別存在重癥風(fēng)險的COVID-19患者并盡早采取恰當(dāng)?shù)尼t(yī)療措施,不僅可避免醫(yī)療資源的濫用,還能改善患者的預(yù)后。本研究基于單變量和多變量分析的結(jié)果,構(gòu)建并驗證了3種預(yù)測 COVID-19重癥病例的模型。模型1是一個自評模型,納入年齡、并發(fā)癥和常見癥狀,便于患者自行評估病情。模型2作為基層模型,除了模型1納入的年齡、并發(fā)癥和常見癥狀外,還增加了單變量分析中具有統(tǒng)計學(xué)意義且在基層醫(yī)療機(jī)構(gòu)易于獲得的呼吸頻率、血常規(guī)中的部分指標(biāo)和C反應(yīng)蛋白,主要是方便醫(yī)生通過簡單的體檢和實驗室檢查快速評估風(fēng)險,便于早期決策,特別適用于基層醫(yī)療單位或門診患者。模型3包含了單變量分析中P<0.05的所有變量,更加復(fù)雜,更適合醫(yī)生對住院患者病情的準(zhǔn)確評估。列線圖作為這些模型的可視化預(yù)測工具,可作為醫(yī)生和患者早期評估個體疾病嚴(yán)重風(fēng)險簡單有效的工具。在3個預(yù)測模型中,一致性指數(shù)均>0.9,決定系數(shù)R2>0.5,表明3個模型預(yù)測重癥COVID-19具有良好的效果。
表10 3種模型預(yù)測重癥新型冠狀病毒肺炎的效能
3種預(yù)測模型的內(nèi)外部驗證均顯示有較高的AUROC、診斷敏感性、特異性和NPV,PPV雖不太高,但可接受。因此,3種模型均可作為預(yù)測COVID-19重癥病例的有價值的工具。與LIU等[4]的研究比較,本研究的預(yù)測模型不僅通過內(nèi)部驗證,還進(jìn)行外部驗證,具有更高的AUROC,而與GONG等[5]的研究比較,本研究的模型3具有更高的AUROC、診斷敏感性和特異性。相較于TANG等[6]和CHANG等[7]的研究,本研究建模的例數(shù)相對較少,但其建立的3種預(yù)測模型,適用于不同的場景,且各預(yù)測因素容易獲得,實用性更強(qiáng)。雖然OH教授的團(tuán)隊也建立了3個預(yù)測模型[8],但這3個模型主要用于預(yù)測患者發(fā)生不同程度疾病進(jìn)展風(fēng)險的可能性,通過評估每個患者可能的修正臨床嚴(yán)重程度評分,結(jié)合3個模型,進(jìn)一步評估其發(fā)生不同程度疾病進(jìn)展的風(fēng)險,而本研究中的3個預(yù)測模型,則是基于3個不同的場景,不僅醫(yī)生可用,也有利于患者自我評估,便于指導(dǎo)患者及時就診或住院治療。本研究通過對各模型預(yù)測因素的OR值取整賦值進(jìn)行建模,更便于實際操作。因此,這3個模型對于準(zhǔn)確的個體化評估重癥COVID-19病例具有各自的特點、優(yōu)勢及應(yīng)用場景。模型3的AUROC大于模型2,模型2的AUROC大于模型1,在診斷敏感性、特異性、PPV和NPV上表現(xiàn)出相似的結(jié)果。在一定程度上,可認(rèn)為模型3對COVID-19重癥患者的預(yù)測效果優(yōu)于另外兩個模型,但差別無統(tǒng)計學(xué)意義。
本研究發(fā)現(xiàn),入院時存在并發(fā)癥、發(fā)熱、咳痰、呼吸困難、血淋巴細(xì)胞減低和D-二聚體升高與重癥COVID-19的發(fā)生相關(guān),其中發(fā)熱、D-二聚體升高,尤其是呼吸困難,是COVID-19重癥病例最有力的預(yù)測因素。大量文獻(xiàn)證明,并發(fā)癥與COVID-19 的嚴(yán)重程度和致命結(jié)局有關(guān),最常見的是高血壓病、糖尿病和冠心病[9-11]。除了上述類似的結(jié)果,本研究還發(fā)現(xiàn),并發(fā)癥越多的患者,越有可能發(fā)展為COVID-19重癥病例,這與之前的研究[12-13]結(jié)論亦一致。
發(fā)熱是COVID-19患者最常見的臨床表現(xiàn),重癥患者更常出現(xiàn)呼吸困難[14-15],本研究結(jié)果與之一致。本研究還發(fā)現(xiàn),除了發(fā)熱(OR=10.611)和呼吸困難(OR=19.674),痰的產(chǎn)生也是重癥病例的早期預(yù)警指標(biāo)。早期有痰的患者患重癥COVID-19的風(fēng)險更高,在模型3中OR為4.033,原因可能是咳痰通常預(yù)示著合并細(xì)菌感染,從而加重患者的病情。本研究表明,發(fā)熱不僅是最常見的癥狀,而且是預(yù)測病情嚴(yán)重程度的最有力因素之一,而呼吸困難是重癥病例的最有力預(yù)測因素,這與文獻(xiàn)[8]的結(jié)論一致,提示同時有發(fā)熱和呼吸困難的患者應(yīng)更加重視其發(fā)展為重癥病例的可能性。
血淋巴細(xì)胞參與清除新型冠狀病毒感染的細(xì)胞,因此淋巴細(xì)胞數(shù)的增加可能是COVID-19病情恢復(fù)的關(guān)鍵[16-17]。越來越多的證據(jù)表明,重癥COVID-19 患者經(jīng)常出現(xiàn)血液高凝狀態(tài)[18],臨床上血栓栓塞事件發(fā)生率很高[19]。COVID-19患者淋巴細(xì)胞計數(shù)減少和D-二聚體升高與疾病嚴(yán)重程度升高和預(yù)后不良有關(guān)[9,15,19-20],本研究結(jié)果與之一致。本研究中,與對照組比較,血淋巴細(xì)胞數(shù)減少(<1.26×109L-1)和D-二聚體升高(≥1.35 μg/L)患者發(fā)生重癥的風(fēng)險分別達(dá)到6.512倍和10.843倍。
以往研究表明,與年輕患者相比,老年患者具有更嚴(yán)重的病情和更差的預(yù)后,高齡是重癥病例的重要獨立預(yù)測因素[21-23],這與本研究多變量分析的結(jié)果不一致,考慮可能與樣本量小、單中心研究的選擇偏倚、統(tǒng)計分析方法不同有關(guān)。
本研究也存在一些局限性。第一,作為單中心回顧性研究,樣本量相對較小,有必要在未來的多中心前瞻性和縱向研究中進(jìn)一步確認(rèn)結(jié)果。第二,癥狀輕微且無肺部影像學(xué)改變的輕型患者預(yù)后好,且武漢COVID-19疫情暴發(fā)期間,因醫(yī)療資源緊缺,很多輕型患者未入院診療,為減少偏倚,在本研究中予以剔除,因此本研究的模型不適用于預(yù)測輕型患者。第三,考慮到入院時胸部影像學(xué)數(shù)據(jù)部分患者因病情危重或在基層醫(yī)療單位無法第一時間完善,同時兼顧建立模型的實用性,因此在分析研究數(shù)據(jù)時未納入影像學(xué)的資料建模,這可能在一定程度上影響模型的預(yù)測效能及PPV值。第四,3種模型的PPV都不太高,這意味著篩查陽性患者的概率不是太高,可能會導(dǎo)致一些醫(yī)療資源的浪費(fèi)。但是,NPV高意味著漏診率低,有助于排除COVID-19的重癥患者。
總之,入院時存在并發(fā)癥、發(fā)熱、咳痰、呼吸困難、血淋巴細(xì)胞數(shù)減少和D-二聚體升高是重癥COVID-19的良好預(yù)測因素。本研究構(gòu)建了3種簡單有效的模型作為預(yù)測重癥COVID-19的工具,當(dāng)條件較差時,建議使用自評模型或基層模型,如果條件允許,為了獲得更好的預(yù)測結(jié)果,建議使用復(fù)雜模型進(jìn)行預(yù)測。