向黔靈,江智霞,胡汝均,袁曉麗,楊曉玲,張芳,張習(xí)瑩
肺炎是顱腦損傷(Traumatic Brain Injury,TBI)患者住院期間常見的感染并發(fā)癥,發(fā)生率為30%~60%[1-3]。TBI患者繼發(fā)肺炎不僅影響疾病的恢復(fù)速度,延長住院時間、增加醫(yī)療費用[4],而且會加重病情進展,嚴(yán)重者可造成呼吸衰竭和休克,增加患者病死率[5]。因此,早期識別TBI患者肺炎發(fā)生的高危人群,及時預(yù)防和治療尤為重要。預(yù)測模型能使用疾病預(yù)測因子來估計患者發(fā)病的概率[6]。顱腦損傷患者發(fā)生肺炎的風(fēng)險預(yù)測模型,能顯著提高肺炎的診斷效率[7],以便采取相應(yīng)的預(yù)防和治療措施,減輕患者及家庭的負(fù)擔(dān)。目前已有學(xué)者開發(fā)了顱腦損傷患者肺炎發(fā)生的風(fēng)險預(yù)測模型,但模型的構(gòu)建方法、預(yù)測效能等各方面不一。因此,本研究旨在全面檢索國內(nèi)外相關(guān)研究,進行系統(tǒng)性地分析與評價,以期更好地為顱腦損傷患者肺炎發(fā)生風(fēng)險預(yù)測模型的構(gòu)建與應(yīng)用提供依據(jù)。
1.1文獻檢索策略 計算機檢索PubMed、Web of Science、Cochrane圖書館、Embase、萬方數(shù)據(jù)庫、中國知網(wǎng)、維普數(shù)據(jù)庫、中國生物醫(yī)學(xué)文獻數(shù)據(jù)庫中有關(guān)顱腦損傷患者肺炎發(fā)生風(fēng)險預(yù)測模型的文獻,檢索時限為建庫至2021年8月2日。以traumatic brain injury,craniocerebral trauma,head trauma,brain injuries;pneumonia,pulmonary infection,respiratory tract infections,hospital-acquired pneumonia;prediction model,risk prediction model,risk assessment,predictor為英文檢索詞。以顱腦損傷,顱腦創(chuàng)傷,顱腦外傷,創(chuàng)傷性腦外傷;肺炎,醫(yī)院獲得性肺炎,肺部感染;預(yù)測模型,風(fēng)險預(yù)測模型,模型,預(yù)測因子,風(fēng)險評估為中文檢索詞。采用主題詞和關(guān)鍵詞相結(jié)合的方式進行檢索,并對納入文獻的參考文獻進行手工檢索。
1.2文獻納入與排除標(biāo)準(zhǔn) 納入標(biāo)準(zhǔn):①研究對象為顱腦損傷患者;②研究內(nèi)容為顱腦損傷患者肺炎發(fā)生風(fēng)險的預(yù)測模型;并描述了預(yù)測模型的建立過程;③具體說明診斷(評估)肺炎發(fā)生的診斷標(biāo)準(zhǔn);④研究類型包括隊列研究、病例對照研究和橫斷面研究等。排除標(biāo)準(zhǔn):①僅為危險因素研究,沒有構(gòu)建預(yù)測模型;②研究未排除入院時已發(fā)生肺炎患者或未具體說明患者入院時是否發(fā)生肺炎;③會議摘要、灰色文獻等非正式發(fā)表文獻;④綜述、基于系統(tǒng)評價/Meta分析建立模型;⑤無法獲取全文,非中英文文獻;⑥模型包含的預(yù)測變量<2個。
1.3文獻篩選與數(shù)據(jù)提取 由2名研究者按照納入和排除標(biāo)準(zhǔn)獨立篩選文獻,若2人意見存在分歧且經(jīng)過討論不能達成共識,則尋求第3位研究者意見并達成一致。文獻篩選首先閱讀文題和摘要,在排除不符合文獻后,進一步閱讀全文,以確定最終是否納入。確定納入文獻后,提取資料包括文獻發(fā)表年份、第一作者、研究地區(qū)、研究設(shè)計類型、研究對象、預(yù)測結(jié)果、候選變量、缺失數(shù)據(jù)、建立模型的方法、樣本量、變量選擇、模型性能、驗證方法、最終包含的預(yù)測因子、模型呈現(xiàn)形式、適用性和局限性等。
1.4文獻質(zhì)量評價 由2名研究者采用適用于病例對照研究及隊列研究的紐卡斯?fàn)?渥太華量表(Newcastle Ottawa Scale,NOS)對納入文獻進行質(zhì)量評價,如有分歧則通過討論或由第3位研究者裁定。NOS分別從研究對象的選擇、組間可比性以及結(jié)果/暴露因素這3個方面進行評分,NOS總分為9分,根據(jù)評分標(biāo)準(zhǔn)給分,0~4分為低質(zhì)量文獻,5~9分為高質(zhì)量文獻。
1.5納入文獻的偏倚風(fēng)險和適用性評估 由2名研究者使用預(yù)測模型研究的偏倚風(fēng)險評估工具(Prediction Model Risk of Bias Assessment Tool,PROBAST)從研究對象、預(yù)測因子、結(jié)果和統(tǒng)計分析4個領(lǐng)域,進行納入文獻的偏倚風(fēng)險評估;從研究對象、預(yù)測因子和結(jié)果3個領(lǐng)域進行適用性評估。
2.1文獻篩選流程和結(jié)果 通過檢索得到相關(guān)文獻674篇,其中英文文獻594篇,中文文獻80篇。去除重復(fù)文獻83篇,閱讀標(biāo)題和摘要排除579篇,閱讀全文排除6篇(1篇中文未構(gòu)建模型、1篇英文未構(gòu)建具體模型、2篇英文結(jié)局指標(biāo)不是肺炎、1篇全文非英文文獻、1篇結(jié)果與已納入文獻重復(fù)),最終納入6篇文獻[7-12]。
2.2納入文獻的基本特征、建模情況及質(zhì)量評價 6篇文獻NOS評分總分均為6分,為高質(zhì)量文獻。文獻的基本特征及建模情況見表1。
表1 納入文獻的基本特征及建模情況
2.3模型性能及驗證情況 有5項研究[8-12]報告了區(qū)分度指標(biāo);僅2項研究[8-9]報告了校準(zhǔn)度指標(biāo),校準(zhǔn)方法為Hosmer-Lemeshow檢驗。1個模型[7]未報告受試者工作特征曲線下面積(Area Under the Curve,AUC),5個模型[8-12]的AUC為0.806~0.949;模型[7]的Kappa系數(shù)為0.815,預(yù)測一致性較高。在模型驗證方面,有1項研究[8]進行了外部驗證,2項研究[9,11]進行了內(nèi)部驗證,其中1項[11]采用Bootstrap法重復(fù)抽樣1 000次進行內(nèi)部驗證,另1項[9]隨機選擇研究中50%樣本進行模型驗證。
2.4偏倚風(fēng)險和適用性評價
2.4.1與研究對象有關(guān)的偏倚 如果納入研究選擇的數(shù)據(jù)來源不合適,或未按原先制訂的納入、排除標(biāo)準(zhǔn)選擇研究對象,可能會造成選擇偏倚[13]。經(jīng)過評價,納入的6項研究與研究對象有關(guān)的偏倚風(fēng)險均較低。
2.4.2與預(yù)測因子有關(guān)的偏倚 6項研究在預(yù)測因子領(lǐng)域偏倚風(fēng)險均不清楚。雖然6項研究均為單中心研究,但未提及是否按照統(tǒng)一標(biāo)準(zhǔn)評估預(yù)測變量,因此問題“所有研究對象的預(yù)測因子是否以類似的方式定義和評估”的回答是“沒有信息”。6項研究均為回顧性研究,無法得知預(yù)測指標(biāo)的評估是否是在不了解結(jié)果的情況下進行的,因此問題“預(yù)測因子的評估是否在不了解結(jié)果數(shù)據(jù)的情況下進行的”回答是“沒有信息”。
2.4.3與結(jié)果有關(guān)的偏倚 6項研究在結(jié)果領(lǐng)域偏倚風(fēng)險均不清楚。6項研究分別有結(jié)果的診斷標(biāo)準(zhǔn),但并未詳細描述是否與所有研究對象的結(jié)果確定有關(guān),因此問題“結(jié)果的定義和確定方式是否相似”的回答是“沒有信息”。6項研究未報告結(jié)果確定時是否不清楚預(yù)測因子的信息,因此問題“是否在不知道預(yù)測因子信息的情況下確定結(jié)果”的回答是“沒有信息”。
2.4.4與分析有關(guān)的偏倚 6項研究在分析領(lǐng)域的偏倚風(fēng)險均較高。6項研究中除了符永華等[12]的因變量事件數(shù)(Events Per Variable,EPV)和樣本量達到要求外,其余研究樣本量均不足。有研究指出,對連續(xù)變量進行分類會降低預(yù)后模型預(yù)測能力[14]。本研究中有2個模型[8,11]對部分連續(xù)變量進行了二分類,1個模型[12]對全部連續(xù)變量進行了二分類。在缺失數(shù)據(jù)及處理方面,6項研究均沒有提供有關(guān)信息。在變量選擇上,有3項研究[7,9,11]在進行單變量分析后直接多變量分析,未應(yīng)用恰當(dāng)?shù)淖兞窟x擇方法;此外,均未提及數(shù)據(jù)的復(fù)雜性。在模型性能評估方面,僅2項研究[8-9]同時報告了校準(zhǔn)度和區(qū)分度。
2.4.5適用性評價 在適用性方面,納入的6項模型在研究對象領(lǐng)域、結(jié)果領(lǐng)域適用性風(fēng)險低,在預(yù)測因子領(lǐng)域適用性風(fēng)險不清楚;6項研究的整體適用性均不清楚。
系統(tǒng)評價可通過循證的方法幫助研究者全面檢索、客觀評價顱腦損傷患者肺炎發(fā)生風(fēng)險預(yù)測模型,評估其整體質(zhì)量,為模型的構(gòu)建及應(yīng)用提供依據(jù)。指南推薦使用PROBAST風(fēng)險評估工具對預(yù)測模型進行系統(tǒng)評價和Meta分析,有助于解釋預(yù)測模型的潛在適用性和普遍性,也有助于規(guī)范模型的開發(fā)[15]。本研究系統(tǒng)檢索了顱腦損傷患者肺炎發(fā)生風(fēng)險預(yù)測模型的相關(guān)研究,逐層篩選最終納入6項研究,其中1個模型未報告AUC,其Kappa系數(shù)為0.815,預(yù)測一致性較高。余下5個模型的AUC為0.806~0.949,預(yù)測性能較好。但納入的6項研究均存在偏倚風(fēng)險,主要原因包括:未報告盲法、樣本量不足、模型過度擬合、未報告或未處理缺失數(shù)據(jù)、模型性能缺乏評估。
本系統(tǒng)評價納入的6項研究,整體偏倚風(fēng)險普遍較高,整體適用性均不清楚,若考慮到模型的推廣應(yīng)用,尚缺乏可以廣泛應(yīng)用于此類患者臨床實踐的預(yù)測模型,接下來需要開發(fā)偏倚風(fēng)險較低、適用性較高的預(yù)測模型。從現(xiàn)有的研究中,得出幾點今后對相關(guān)預(yù)測模型研究的啟示:①GCS評分、機械通氣、術(shù)后白蛋白水平、APACHE Ⅱ評分是納入的6個模型中包含最多的預(yù)測因子。應(yīng)注意對這些變量進行評估,可以開展知識培訓(xùn),保證醫(yī)護人員能夠準(zhǔn)確評估患者GCS評分、APACHEⅡ評分,密切關(guān)注患者機械通氣情況及血清學(xué)指標(biāo)。②在建模樣本量方面,有5個模型研究樣本量不足,可能會導(dǎo)致參數(shù)估計準(zhǔn)確性受到影響。針對模型的開發(fā)研究, EPV>20會讓研究更有說服力;如果EPV<10可能會造成過度擬合[16-17];而針對模型的驗證研究,結(jié)果事件數(shù)<100可能會造成偏倚[18]。因此,在今后的模型開發(fā)中,需要納入足夠的樣本量,最好能開展多中心研究。③6個模型中,馮金周等[10]的模型運用了PCA分析法,其余模型使用logistic回歸分析法建立模型。PCA是機器學(xué)習(xí)算法中的一種,可以處理復(fù)雜的臨床數(shù)據(jù),在保留數(shù)據(jù)特征的同時,通過計算機進行原始變量降維,將高維空間數(shù)據(jù)轉(zhuǎn)換為低維,建立相應(yīng)的線性方程組[19]。從模型預(yù)測性能來看,PCA分析法建立的模型AUC=0.949,與納入的其他模型相比,其預(yù)測性能更佳。提示大數(shù)據(jù)與人工智能時代的到來,計算機科學(xué)與臨床醫(yī)學(xué)的結(jié)合日益緊密,對于一些復(fù)雜數(shù)據(jù)的處理,需要找尋新的分析方法,選擇預(yù)測性能更佳的模型來指導(dǎo)臨床。因此,建立模型除了運用傳統(tǒng)的回歸分析外,還可以探索運用其他機器學(xué)習(xí)方法,如決策樹(Decision Tree,DT)、隨機森林(Random forest,RF)、支持向量機(Support Vector Machines,SVM)、樸素貝葉斯(Naive Baye-sian Model,NBM)、梯度增強算法(Gradient Boosting,GB)、人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,ANNs)等方法構(gòu)建模型。④納入的6個模型,僅2項采用了內(nèi)部驗證,1項進行了外部驗證。臨床研究中重模型開發(fā)而輕驗證是目前常見問題,大多研究僅停留在建模階段,導(dǎo)致僅少數(shù)模型可用于臨床實踐[20]。內(nèi)部驗證能夠防止模型過度擬合[21];外部驗證關(guān)注模型的可移植性和可泛化性[22],使用新的數(shù)據(jù)再次評估模型的性能,提高模型質(zhì)量。有研究指出,盡管一些模型因未進行內(nèi)外部驗證而被評為高風(fēng)險偏倚,但并不能否定其預(yù)測價值,可以視情況合理選用[23]。⑤6項研究在缺失數(shù)據(jù)上均未提供有關(guān)信息,可以看作研究者忽略了缺失數(shù)據(jù)的處理。研究表明有效處理缺失數(shù)據(jù),才能準(zhǔn)確地反映研究群體的特征,數(shù)據(jù)缺失可能會影響數(shù)據(jù)分析的質(zhì)量,正確處理數(shù)據(jù)可以減少偏倚[24]。目前常用的缺失值處理方法有加權(quán)法、刪除法、插補法3大類[25]。針對不同原因及形式造成的數(shù)據(jù)缺失,需要采取合適的方法進行處理。⑥納入的研究中有4項[7-9,12]研究通過計算顱腦損傷患者繼發(fā)肺炎的公式、1項[11]以列線圖模型、1項[10]以PCA-logistic回歸模型對應(yīng)的影響系數(shù)呈現(xiàn)結(jié)果。為了提高醫(yī)護人員使用風(fēng)險預(yù)測模型時的依從性,并減少臨床工作耗時,今后研究需同時關(guān)注模型的預(yù)測精準(zhǔn)度與使用便捷性,通過恰當(dāng)形式呈現(xiàn)預(yù)測模型,建議研發(fā)操作界面簡便的自動化信息平臺,便于臨床實際操作應(yīng)用。
本研究共納入6項顱腦損傷患者肺炎發(fā)生風(fēng)險預(yù)測模型的研究,對模型的各方面特征進行了系統(tǒng)評價,研究結(jié)果提示相關(guān)模型研究尚處于發(fā)展階段,今后研究者可以開展多中心、大樣本研究,結(jié)合大數(shù)據(jù)分析方法,開發(fā)預(yù)測性能優(yōu)良、使用簡便的預(yù)測模型,在使用過程中不斷校正模型,使模型研究趨于成熟。本研究僅納入了中、英文文獻,可能存在發(fā)表偏倚;且納入患者年齡跨度較大,模型中的預(yù)測因子是否適用有待進一步探究。