崔念奇,鄭瓊,張玉萍,金靜芬,3,4
譫妄是一種急性發(fā)作和病情反復波動的疾病,其特征是意識和注意障礙,伴有認知功能的改變、睡眠-覺醒周期紊亂和精神運動性興奮或抑制[1]。一項針對ICU成人患者的系統(tǒng)評價報道ICU譫妄發(fā)生率為31%[2]。譫妄可對ICU患者造成諸多的負性影響,如增加ICU住院時間、持續(xù)認知功能障礙及病死率。譫妄的持續(xù)監(jiān)測和早期篩查是譫妄治療的重要基礎,ICU護士在譫妄評估及篩查中扮演關鍵角色,亟需提供兼具高靈敏度和特異度的譫妄評估工具[3]。隨著ICU譫妄評估工具診斷準確性試驗數(shù)量的增加,研究者對不同的評估工具進行了診斷準確性系統(tǒng)評價及Meta分析,但其證據(jù)級別尚不清楚,研究結論不統(tǒng)一。美國醫(yī)學研究所(Institute of Medicine,IOM)將臨床實踐指南定義為:通過系統(tǒng)評價生成的證據(jù)以及對各種備選干預方式進行利弊評價之后提出的最優(yōu)指導意見[4]。故所有推薦意見的證據(jù)都應源于系統(tǒng)評價。然而針對同一臨床問題可能會存在諸多系統(tǒng)評價,決策者根據(jù)海量的系統(tǒng)評價證據(jù)進行決策時可能會面臨障礙。系統(tǒng)評價再評價(umbrella reviews)通過對特定研究問題可獲得的系統(tǒng)評價和Meta分析進行全面而系統(tǒng)的評價,形成特定研究問題或現(xiàn)有研究結果的全面概況,并提供了解證據(jù)體強度和潛在偏倚風險的可能性[5]。就ICU患者譫妄評估而言,有別于診斷準確性試驗的Meta分析往往僅能提供單一評估工具診斷的準確性,系統(tǒng)評價再評價可以綜合不同譫妄評估工具的診斷準確性,并比較同一評估工具不同研究結果之間的差別,明確不同系統(tǒng)評價及Meta分析證據(jù)級別及可能的偏倚風險。因此,本研究基于JBI系統(tǒng)評價再評價方法學[5],對現(xiàn)有適合ICU患者譫妄評估工具診斷準確性系統(tǒng)評價及Meta分析進行全面評價,明確證據(jù)質量及潛在偏倚風險,為護理人員進行臨床決策提供參考。研究計劃書已于PROSPERO平臺注冊(ID:CRD42021242586)并公開發(fā)表[6]。本研究基于系統(tǒng)評價再評價優(yōu)先報告條目清單(Preferred Reporting Items for Overviews of Systematic Reviews including harms checklist,PRIO-harms)進行報告[7-8]。
1.1文獻納入與排除標準 納入標準:①研究類型,診斷準確性試驗系統(tǒng)評價及Meta分析。②研究對象,ICU成人患者(年齡≥18歲),病種不限。③診斷標準,采用公認的美國精神疾病診斷與統(tǒng)計手冊(DSM)[1]或WHO國際疾病分類(ICD)[9]作為金標準,具體版本不限。以DSM-V為例,譫妄診斷標準包括意識障礙,伴有注意力的集中、保持或變換目標能力降低;認知的改變或出現(xiàn)知覺障礙,且其認知障礙不能由一種原本存在或發(fā)展的神經(jīng)認知障礙或昏迷所解釋;在短時間內(nèi)發(fā)生并在1 d內(nèi)有所波動;從病史、實驗室檢查或體檢中有跡象表明是一般軀體情況的直接生理性后果。④結局指標,合并敏感度和合并特異度。某一譫妄評估工具的合并敏感度=所有真陽性人數(shù)/(所有真陽性人數(shù)+所有假陰性人數(shù)),合并特異度=所有真陰性人數(shù)/(所有真陰性人數(shù)+所有假陽性人數(shù))。排除標準:研究對象僅納入ICU臨終患者,非中英文發(fā)表,無法獲取全文的文獻。
1.2文獻檢索策略 2022年4月,計算機檢索CDSR(Cochrane Database of Systematic Reviews)、JBI、Medline、Embase、CINAHL、Web of Science、PsycINFO、中國知網(wǎng)、維普全文數(shù)據(jù)庫以及中國生物醫(yī)學文獻數(shù)據(jù)庫。灰色文獻檢索Google Scholar,同時手工檢索納入文獻的參考文獻列表。檢索時限為2016年1月至2022年4月,研究類型限制為系統(tǒng)評價和/或Meta分析。中文檢索詞為譫妄、神經(jīng)認知障礙、蘇醒譫妄、意識模糊、急性腦功能障礙、腦代謝疾??;重癥監(jiān)護病房、危重患者醫(yī)療、危重癥護理、危重癥監(jiān)護結局、重癥監(jiān)護、重癥醫(yī)學科、加強監(jiān)護病房、ICU、EICU、SICU、CCU;系統(tǒng)評價、Meta分析、薈萃分析、元分析、綜述。英文檢索詞為delirium,emergence delirium,neurocognitive disorders,brain syndrome,cerebral insufficiency,delirious*,attention,cognitive,consciousness,perception,neurocognitive;intensive care units,critical care,critical care nur-sing,intensive care,acute care,cardiac,coronary,heart,burn,respiratory,surgical,surger*,stepdown,speciali#ed,highdependency,weaning,postoperati*,postsurg*,ICU*,SICU*,CCU*,EICU*,HDU*,SDU*,EDSDU;Meta-Analysis,Systematic Review,具體檢索策略見研究計劃書[6]。
1.3文獻篩選與資料提取 由2名研究人員按照標準獨立篩選文獻,如遇分歧由第3名研究人員協(xié)助解決。文獻篩選參照PRISMA2020文獻篩選流程[10]。雙人進行文獻資料提取,如遇分歧由第3名研究人員協(xié)助解決。提取內(nèi)容包括第一作者、診斷準確性試驗數(shù)量、診斷金標準、譫妄評估工具、合并敏感度、合并特異度、文獻質量評價工具。
1.4質量評價工具及證據(jù)分級 由于目前暫無診斷準確性試驗系統(tǒng)評價特異性質量評價工具,本研究采用JBI系統(tǒng)評價方法學質量評價工具進行質量評價[11-12]。證據(jù)質量的評價方法采用GRADE[13],對偏倚風險、間接性、不一致性、不精確性及發(fā)表偏倚進行評價。偏倚風險評價采用原系統(tǒng)評價診斷準確性研究質量評價結果,若原系統(tǒng)評價未對偏倚風險進行評估,本研究采用Cochrane協(xié)作網(wǎng)推薦的診斷準確性研究質量評價工具QUADAS-2[14-15]。間接性主要根據(jù)納入系統(tǒng)評價與系統(tǒng)評價再評價擬回答的臨床問題之間的匹配程度進行評價。不一致性主要根據(jù)合并敏感度、合并特異度可信區(qū)間重疊程度,I2和P值進行評價。不精確性通過系統(tǒng)評價理論所需樣本量,合并敏感度、合并特異度可信區(qū)間閾值下限與臨床可接受閾值下限比較。本研究中通過查表法估算理論所需樣本量[16],臨床可接受閾值下限設定為0.70。
1.5資料分析方法 使用重疊百分比,重疊區(qū)域(Covered Area,CA)及修正重疊區(qū)域(Corrected Covered Area,CCA)對納入系統(tǒng)評價中的原始研究重復情況進行分析[17]。CCA在0~5表示低度重疊,6~10中度重疊,11~15高度重疊,>15極高度重疊。GRADE證據(jù)質量評價通過GRADE pro GDT(Guideline Development Tool)進行分級并制作證據(jù)概要表。若納入系統(tǒng)評價未對發(fā)表偏倚進行評估,本研究通過將原始研究數(shù)據(jù)錄入Stata14.0制作Deeks漏斗圖以評估發(fā)表偏倚。
2.1文獻篩選流程及納入系統(tǒng)評價特征 初檢獲得2 961篇文獻,使用軟件去除重復文獻,閱讀標題、摘要和全文排除主題不符、非ICU、非系統(tǒng)評價或Meta分析文獻,最終納入5篇系統(tǒng)評價[18-22],涉及ICU意識模糊評估法(Confusion Assessment Method for the Intensive Care Unit,CAM-ICU)、ICU譫妄篩查量表(Intensive Care Delirium Screening Checklist,ICDSC)、意識模糊量表(Neelon and Champagne Confusion Scale,NEECHAM)、護理譫妄篩查量表(Nursing Delirium Screening Scale,Nu-DESC)、譫妄識別評分(Delirium Detection Score,DDS)5種譫妄評估工具,其中一篇系統(tǒng)評價[21]還涉及4項譫妄快速診斷方案(the 4 ′A′s Test,4AT),但由于其金標準不符合納入標準,未提取相關內(nèi)容。3篇[18,20,22]使用QUADAS-2,1篇[24]使用JBI診斷性研究質量評價工具,1篇[21]使用改良Newcastle-Ottawa量表評價方法學質量。納入系統(tǒng)評價特征見表1。
表1 納 入 系 統(tǒng) 評 價 特 征
2.2納入系統(tǒng)評價方法學質量評價 3篇[18-19,22]系統(tǒng)評價質量等級為高,即所有條目評價結果均為“是”;2篇[20-21]系統(tǒng)評價質量等級為中,其中Jeong等[20]發(fā)表的系統(tǒng)評價未評估發(fā)表偏倚,Patel等[21]發(fā)表的系統(tǒng)評價未采用合適的質量評價標準對原始研究進行方法學質量評價。
2.3納入系統(tǒng)評價重復研究情況 重疊百分比為25/51×100%=49.02%,CA為80/(51×5)=0.31,CCA為(80-51)/(51×5-51)=0.14。
2.4證據(jù)質量評價 對納入系統(tǒng)評價中不同的譫妄評估工具合并敏感度及合并特異度進行質量評價,結果顯示譫妄評估工具中等質量證據(jù)占比5%,低質量證據(jù)占比75%,極低質量證據(jù)占比20%。證據(jù)質量降級主要集中在偏倚風險,不一致性和不精確性。僅Jeong等[20]的系統(tǒng)評價未評估納入研究的發(fā)表偏倚,本研究通過制作Deeks漏斗圖評估發(fā)表偏倚,結果顯示P值為0.19,提示漏斗圖對稱,存在發(fā)表偏倚可能性較低,不考慮降級。
3.1ICU患者譫妄評估工具證據(jù)質量 本研究納入的5篇系統(tǒng)評價包含多個適用于ICU患者的譫妄評估工具,均顯示具有良好的敏感度和特異度,但證據(jù)質量普遍為低或極低。重復研究結果顯示,本研究納入系統(tǒng)評價存在低度重疊現(xiàn)象,研究結果效應因重疊被過度放大的可能性較低?;诂F(xiàn)有證據(jù),CAM-ICU可能是最適合于ICU患者譫妄評估的工具。在Chen等[18]的研究中,CAM-ICU相較于ICDSC,發(fā)現(xiàn)非譫妄患者及內(nèi)科ICU和機械通氣譫妄患者表現(xiàn)更佳(P<0.05)。Ho等[19]的研究同樣支持CAM-ICU是現(xiàn)有最佳ICU患者譫妄評估工具,但是該研究未對不同的譫妄評估工具診斷準確性差別進行顯著性檢驗。Patel等[21]發(fā)現(xiàn),CAM-ICU對神經(jīng)重癥患者譫妄評估同樣具有較好的適用性。本研究表明,相較于DDS,CAM-ICU在老年重癥患者中具有良好的敏感度和特異度。與CAM-ICU相比,Nu-DESC合并敏感度和特異度的表現(xiàn)不佳,證據(jù)質量等級為極低到低質量。證據(jù)質量對指南推薦意見強度具有重要影響,但并不是唯一重要因素,利益相關人群的價值觀與偏好同樣是影響指南推薦意見的重要因素。Jeong等[20]推薦使用Nu-DESC作為譫妄評估工具的原因是:Nu-DESC兼具診斷準確性和臨床適用性,是“實踐者友好型”譫妄評估工具,即Nu-DESC更加符合臨床護士價值觀與偏好。相關研究報告,ICU護士在使用CAM-ICU對患者進行譫妄評估時存在障礙,認為CAM-ICU使用過程存在困難[23-24]。Tsuruta等[25]推薦將多種評估工具相結合進行譫妄篩查,然而現(xiàn)有譫妄篩查障礙因素之一就是增加護理人員工作負擔[3]。鑒于CAM-ICU在譫妄評估中的診斷準確性結果,如何增加臨床護士應用CAM-ICU對譫妄篩查的執(zhí)行力是未來的研究重點,同時政策制定者在向實踐者推薦譫妄評估工具時,應充分考慮不同評估工具證據(jù)質量及利益相關人群價值觀。美國重癥醫(yī)學會2018年發(fā)布的PADIS指南[3]在譫妄評估工具的推薦意見給予良好實踐聲明,未明確具體的證據(jù)質量及推薦級別,主要因為譫妄篩查效果與患者終點結局之間的相關性存在證據(jù)缺口,因此未來研究可針對這一證據(jù)缺口開展相關研究。
3.2亟待形成診斷準確性試驗系統(tǒng)評價質量評價工具 診斷準確性試驗系統(tǒng)評價方法學質量評價目前暫無特異性工具,偏倚風險的評估也缺乏明確標準。因AMSTAR 2制定嚴謹,應用廣泛且可操作性強,GRADE工作組推薦使用該工具進行系統(tǒng)評價方法學質量評價。而AMSTAR 2適應范圍不包括診斷性試驗系統(tǒng)評價、網(wǎng)狀Meta分析、單個病例數(shù)據(jù)的Meta分析、概況性評價和現(xiàn)實主義評價[26]。GRADE工作組推薦使用QUADAS-2評價工具對診斷準確性試驗系統(tǒng)評價偏倚風險進行質量評價,即從病例選擇的偏倚風險、待評價試驗的偏倚風險、參考試驗(金標準)的偏倚風險及病例流程與進展情況的偏倚風險四方面綜合評價[16]。而QUADAS-2適用于診斷準確性試驗原始研究的偏倚風險評價,因此該工具在診斷準確性試驗系統(tǒng)評價中的實用性有待驗證。鑒于目前暫無針對診斷準確性試驗系統(tǒng)評價質量評價工具,亟待形成適合該類系統(tǒng)評價的質量評價工具,幫助研究者進行準確的質量分級。
3.3系統(tǒng)評價再評價為指南改編推薦意見形成提供重要證據(jù)來源 臨床實踐指南對于醫(yī)療質量的提升至關重要,但構建一部新指南對于資源的需求是巨大的[27]。當已存高質量指南時,指南改編被認為是構建新指南的替代方案[28]。但由于待改編指南的發(fā)布時間及指南納入證據(jù)本身存在滯后性的特點,最新的研究證據(jù)往往不能及時被指南納入。系統(tǒng)評價作為指南改編的重要證據(jù)來源,在形成推薦意見的過程中扮演重要角色。系統(tǒng)評價再評價通過對特定臨床問題或現(xiàn)象的系統(tǒng)評價進行綜合,可以為決策者提供更為全面的研究證據(jù)概況,從而更有利于幫助決策者進行臨床決策。以最經(jīng)典的干預性系統(tǒng)評價為例,系統(tǒng)評價再評價相較于系統(tǒng)評價在如下方面具有優(yōu)勢:綜合同一種疾病或人群不同干預措施的應用效果;綜合同一種干預措施不同方法的干預效果;綜合同一種干預措施在不同人群中的應用效果;綜合同一干預措施對同一或不同人群的負性影響;同一人群的同一干預措施在不同系統(tǒng)評價結果中存在沖突[29]。鑒于系統(tǒng)評價再評價的上述優(yōu)勢,本研究團隊在指南改編的過程中,將系統(tǒng)評價再評價作為形成推薦意見的重要證據(jù)來源。
譫妄評估工具診斷準確性試驗整體證據(jù)質量等級較低。在現(xiàn)有證據(jù)中,CAM-ICU可能是ICU患者譫妄評估的最佳工具。但管理者并不能依此推薦該工具,應充分結合利益相關人群價值觀、本土適用性等方面綜合考慮。未來指南改編可通過系統(tǒng)評價再評價為推薦意見的形成提供證據(jù)來源,同時亟待構建診斷準確性試驗系統(tǒng)評價質量評價工具。本研究局限性:由于不同原始研究數(shù)據(jù)報告差異性,本研究未再次提取原始研究數(shù)據(jù)進行Meta分析;研究僅納入2016年之后發(fā)表的中英文文獻,結果可能存在偏倚。