劉望陽,楊修登
(邵陽學院附屬第一醫(yī)院檢驗科,湖南邵陽 422001)
流行性感冒(簡稱流感)是一種由流感病毒引起的急性上呼吸道疾病,主要表現(xiàn)為咳嗽、發(fā)熱、流涕等癥狀。某些流感患者,特別是嬰幼兒、老年人、孕婦以及有基礎(chǔ)疾病的人群,可能會出現(xiàn)較嚴重的并發(fā)癥,導致醫(yī)院和社區(qū)死亡[1]。2018年全球統(tǒng)計數(shù)據(jù)顯示,每年有3萬多名5歲以下兒童死于流感相關(guān)的急性下呼吸道感染[2]。而在新冠大流行之前,流感是世界衛(wèi)生組織首個實行全球監(jiān)測的傳染病[3]。流感一般好發(fā)于天氣寒冷的冬春季節(jié),主要通過呼吸道傳播,人群普遍易感。而2022年夏天,我國南方多個省份出現(xiàn)了流感的區(qū)域性流行。
疾病的早期預測可以為發(fā)熱患者的診斷提供重要依據(jù)。目前國內(nèi)的研究主要局限于對流感的描述性流行病學分析[4-5],缺乏評估工具用于指導臨床醫(yī)生對于發(fā)熱患者進行早期個體化評估。因此,本研究旨在通過常見的實驗室檢查結(jié)果,篩選出發(fā)熱患者發(fā)生流感病毒感染的潛在風險因素,并構(gòu)建風險預測模型,以期為臨床醫(yī)生識別疑似流感患者提供參考工具。
1.1研究對象 選取2022年6月13日至7月5日于邵陽學院附屬第一醫(yī)院發(fā)熱門診就診的未成年(<18歲)發(fā)熱患者1 001例(體溫>37.3 ℃),其中男性583例,女性418例。本研究經(jīng)邵陽學院第一附屬醫(yī)院倫理委員會審核批準(批準文號:K2023-002-01),采集的所有醫(yī)療數(shù)據(jù)均已脫敏處理,將患者的聯(lián)系方式和地址等信息均采用“*”進行隱藏,隱去患者姓名信息。
1.2患兒基本特征和實驗室指標收集 基本特征包括患兒的性別和年齡。外周血全血細胞計數(shù)和超敏C反應蛋白(hypersensitive C-reactive protein, hs-CRP)采用BC7500-CRP全自動血液分析儀(深圳邁瑞醫(yī)療器械有限公司)檢測,其中,3歲及以下兒童采集右手無名指手指血約500 μL,3歲以上未成年人采集肘靜脈血2 mL進行血常規(guī)和hs-CRP檢測。儀器每日進行2個水平的質(zhì)控分析,結(jié)果均在控后再進行標本檢測。鼻拭子流感病毒抗原檢測采用膠體金法(廈門英科新創(chuàng)生物科技有限公司),該法與病毒分離培養(yǎng)法比較,甲型抗原檢測和乙型抗原檢測的總體符合率分別為92.17%和86.95%。采集患者鼻拭子標本用于流感病毒抗原檢測,鼻拭子在鼻咽腔后壁旋轉(zhuǎn)不少于15 s,以充分獲取分泌物。
將非正態(tài)分布的連續(xù)變量經(jīng)對數(shù)轉(zhuǎn)換為正態(tài)分布,然后通過Lasso回歸篩選預測因子,多因素Logistic回歸篩選獨立危險因素,建立未成年發(fā)熱患者發(fā)生甲型流感病毒(influenza A virus, INFA)感染的風險預測模型,使用列線圖展示。以ROC曲線下面積評估列線圖性能;采用Boot-strap法重復抽樣1 000次,計算出相對校正的一致性指數(shù)(C-Index)以驗證列線圖的預測性能;決策曲線分析(decision curve analysis, DCA)用于評估臨床有效性。
2.1患兒一般資料 本研究統(tǒng)計分析了2022年6月8日至7月22日我院發(fā)熱人群以及所有進行流感病毒抗原檢測人群的INFA檢測陽性率結(jié)果,結(jié)果見圖1。最終納入6月13日至7月5日未成年發(fā)熱患者1 001例,其中男性583例(58.24%),女性418例(41.76%)。INFA檢測陽性和陰性患者的一般資料比較見表1。
表1 INFA陽性和陰性患者的一般資料比較
圖1 發(fā)熱患者及所有患者INFA檢測陽性率
2.2Lasso回歸分析 將20個相關(guān)變量作為自變量,以患者是否發(fā)生INFA感染作為因變量,進行Lasso回歸,結(jié)果見圖2。Lambda.min對應的是使模型估計誤差最小的λ,此時篩選的變量個數(shù)為15個,Lambda.lse對應的是內(nèi)部交叉驗證誤差在1個標準差內(nèi)最大值的λ值,此時篩選的變量個數(shù)為9個,分別為年齡、白細胞(white blood cells, WBC)、紅細胞(red blood cells, RBC)、紅細胞壓積(hematocrit, HCT)、平均血紅蛋白濃度(mean corpuscular hemoglobin concentration, MCHC)、血小板分布寬度(platelet distribution width, PDW)、血小板壓積(thrombocytocrit, PCT)、淋巴細胞數(shù)(lymphocyte count, Lym#)和中性粒細胞數(shù)(neutrophil count, Neut#)。
圖2 Lasso回歸內(nèi)部交叉驗證圖
2.3構(gòu)建Logistic預測模型 將篩選的9個自變量納入多因素Logistic回歸分析,采用逐步回歸法,α進=0.05,α出=0.05。預測模型顯示年齡、HCT、PDW、PCT、Lym#和Neut#是發(fā)生INFA感染的危險因素,見表2。根據(jù)預測變量繪制列線圖,見圖3。通過列線圖,可獲得每個變量的相應數(shù)值的得分,將所有變量的得分相加即可得到總分。根據(jù)總分向下繪制的垂直線,可得到發(fā)熱患者發(fā)生INFA感染的概率。
表2 未成年發(fā)熱患者發(fā)生INFA感染的Logistic回歸分析
圖3 預測發(fā)熱患者發(fā)生INFA感染的列線圖
2.4預測模型的驗證 通過繪制預測模型預測未成年發(fā)熱患者發(fā)生INFA感染的ROC曲線評估模型的區(qū)分度。ROC曲線下面積為0.728(0.697~0.759),見圖4。采用Boot-strap法自抽樣1 000次進行內(nèi)部驗證,結(jié)果顯示未成年發(fā)熱患者發(fā)生INFA感染的風險預測模型的C-Index為0.720。校準曲線與理想曲線具有很好的重合性,說明此模型校準度較好,見圖5。
圖4 預測模型預測發(fā)熱患者發(fā)生INFA的ROC曲線
圖5 預測模型的校準曲線
2.5預測模型的臨床有效性評估 利用DCA曲線評估預測模型的臨床有效性,未成年發(fā)熱患者發(fā)生INFA感染風險的列線圖的DCA曲線見圖6。結(jié)果顯示,當閾值概率>45.45%時,用此列線圖預測未成年發(fā)熱患者發(fā)生INFA感染風險會比所有患者均實施治療方案更有利。
圖6 評估預測模型臨床有效性的DCA曲線
流感流行期間各個年齡段人群均有發(fā)病。但是從年齡分布來看,流感發(fā)病率隨年齡增長呈明顯的遞減趨勢。流感陽性病例主要集中于未成年人群,尤其是兒童[6]。未成年人作為特殊群體,機體自身的免疫功能尚不成熟;并且長時間處于相對人群密集且通風不良的環(huán)境中,個別學生感染就可以造成大面積的病毒傳播。因此,本研究所納入的發(fā)熱患者主要是未成年人群。
在本研究中,筆者通過Lasso回歸和多因素Logistic回歸篩選出了6個與INFA感染獨立相關(guān)的危險因素,即年齡、HCT、PDW、PCT、Lym#和Neut#,并且據(jù)此建立了風險預測模型,并以列線圖的形式呈現(xiàn)。列線圖是一種基于數(shù)學模型的,對Logistic回歸結(jié)果直觀展示的圖形形式。它量化了各個指標在特定事件中的相對分值,以預測某事件發(fā)生的概率,從而實現(xiàn)對風險事件的個性化評估。本研究所采用的預測指標均為臨床上常規(guī)開展的實驗室檢查指標,方便易得,沒有額外增加患者負擔,實用性較好。結(jié)果顯示,預測模型的ROC曲線下面積為0.728,內(nèi)部驗證C-Index為0.720,表明模型的預測水準較高;并且校正曲線與理想曲線幾乎重合,說明該模型具有較好的區(qū)分度和校準度。
同時,本研究發(fā)現(xiàn),白細胞作為臨床上最為常用的感染初步判斷指標之一,陰性組的外周血白細胞顯著高于陽性組。因此推測,陰性組主要是由于細菌性感染等其他原因?qū)е碌陌l(fā)熱,從而導致白細胞顯著升高。同樣的,相較于陰性組,陽性組的中性粒細胞數(shù)、淋巴細胞數(shù)和單核細胞數(shù)均出現(xiàn)了顯著降低,這與朱旻等[7]和姜舒亞等[8]的研究結(jié)果一致,流感病毒通過在體內(nèi)引起淋巴細胞凋亡等方式抑制免疫反應,從而導致白細胞數(shù)降低。C反應蛋白(CRP)是一種主要由肝臟分泌的急性時相反應蛋白,是臨床常用的感染診斷指標,具有高敏感性,但特異性較低[9],在正常機體含量很少,一旦機體發(fā)生感染,CRP濃度可在一定時間內(nèi)迅速升高。但是在本研究中,陰性組的CRP水平顯著高于陽性組,這與鄢青等[10]的研究結(jié)果一致,分析原因可能是由于細菌性感染或者其他原因?qū)е玛幮曰颊叱霈F(xiàn)的發(fā)熱癥狀。
通過建立臨床預測模型繪制列線圖預測某疾病的發(fā)生風險已經(jīng)在臨床研究中得到了廣泛實踐[11],而基于此類方法預測發(fā)熱患者是否發(fā)生流感感染仍鮮有文獻報道。Huang等[12]通過納入大量的住院患兒建立了類似的臨床預測模型,該預測模型的ROC曲線下面積與本研究無明顯差異(0.725 vs 0.728),但是其納入的人群主要是5歲以下有嚴重癥狀的兒童,臨床用藥可能會干擾某些指標的檢測。而本研究的對象是所有的未成年發(fā)熱患兒,所采用的風險預測指標也是臨床上易于獲取的,因此本研究更具有一般性和普遍性,結(jié)果可能會更適用于未成年人群,對發(fā)熱門診醫(yī)生更具有參考價值。
然而,本研究仍有一些不足之處。首先,本研究是單中心的回顧性研究,可能存在不同程度的選擇偏倚。其次,本研究中陽性患者的判定是依據(jù)鼻咽拭子流感病毒抗原測定,使用的是膠體金法,雖然檢測速度快、特異性高,但是敏感性有限[7]。流感病毒核酸檢測有非常高的特異性,并且核酸檢測會反映采樣質(zhì)量,如果采用核酸檢測結(jié)果作為最終的判定依據(jù)可以在一定程度上避免出現(xiàn)假陰性。第三,本研究僅使用內(nèi)部數(shù)據(jù)進行重復抽樣驗證,若使用外部多中心數(shù)據(jù)進行驗證,可以將列線圖推廣到其他地區(qū)。