譚朵廷,梁 昊,余怡嬪,談宇權,方 格,鐘俐芹,胡志希*
(1.湖南中醫(yī)藥大學中醫(yī)學院,湖南 長沙 410208;2.湖南中醫(yī)藥大學中醫(yī)診斷研究所,湖南 長沙 410208;3.湖南中醫(yī)藥大學中西醫(yī)結合學院,湖南 長沙 410208)
制定納入、排除標準(以下簡稱納排標準)是臨床試驗中至關重要的一步。 合理的納排標準是保證試驗順利開展的前提,PAWLIK 在《臨床試驗》[1]中提到:納入標準是所有研究對象必須滿足的條件,根據臨床試驗的目的確定, 排除標準是符合納入標準基礎上的其他不滿足試驗要求的特殊情況。 診斷試驗往往基于橫斷面和病例對照設計[2-3],同時也應是真實世界的研究[4-5],其納入的對象應包括目標疾病中的各種臨床類型,也應包括需鑒別的疑似病例[6],若納排標準有偏差,將會高估或低估試驗的效能[7-8]。
目前, 診斷試驗的納排標準無書寫規(guī)范提供參考,導致臨床研究中納排標準的寫法與內容各不相同[9],有些甚至缺乏納排標準[10],影響診斷試驗的質量和進行二次研究[11-12]。本研究檢索近5 年北京大學圖書館“中文核心期刊”(以下簡稱北大核心期刊)中的診斷試驗,提取其中的納排標準,分析書寫現狀和存在的問題,并查閱診斷試驗報告規(guī)范和質量評價工具,為規(guī)范書寫納排標準提供思路與借鑒。
北大核心期刊目錄下臨床醫(yī)學類期刊,剔除康復、護理、影像類期刊后,納入《中華檢驗醫(yī)學雜志》《中華危重病急救醫(yī)學》《中華臨床醫(yī)師雜志(電子版)》《中國循證醫(yī)學雜志》《中華急診醫(yī)學雜志》《中國組織工程研究》《中國疼痛醫(yī)學雜志》和《中國感染與化療雜志》8 本期刊。
計算機檢索中國知網(CNKI)數據庫,檢索范圍為2017 年1 月1 日至2022 年6 月7 日北大核心期刊中臨床醫(yī)學目錄下期刊,提取期刊中發(fā)表的診斷試驗。 檢索公式為:TKA=(診斷)AND JN=(中華檢驗醫(yī)學雜志、中華危重病急救醫(yī)學、中華臨床醫(yī)師雜志、中國循證醫(yī)學雜志、中華急診醫(yī)學雜志、中國組織工程研究、中國疼痛醫(yī)學雜志、中國感染與化療雜志)。
(1)診斷試驗;(2)發(fā)表時間為2017 年1 月1 日至2022 年6 月7 日。
(1)僅有摘要;(2)重復發(fā)表的研究。
逐篇閱讀文獻,篩選出診斷試驗。 建立“診斷試驗納排標準信息表”,提取以下內容:篇名、年份、納排標準內容及書寫位置、研究設計類型,并將信息錄入Excel 表中。
共檢索相關文獻2086 篇。 閱讀文題和摘要后,篩除不符合條件的1674 篇,下載文獻并閱讀全文,篩除非診斷試驗186 篇,最終納入226 篇診斷性試驗。 其中《中華檢驗醫(yī)學雜志》81 篇、《中華急診醫(yī)學雜志》50 篇、《中華危重病急救醫(yī)學》35 篇、《中華臨床醫(yī)師雜志(電子版)》31 篇、《中國感染與化療雜志》14 篇、《中國組織工程研究》10 篇、《中國循證醫(yī)學雜志》3 篇和《中國疼痛醫(yī)學雜志》2 篇。2017年39 篇,2018 年27 篇,2019 年54 篇,2020 年49 篇,2021 年47 篇,2022 年10 篇。 文 獻 檢 索 流 程見圖1。
圖1 文獻檢索流程與結果
納入的8 本期刊中,《中華檢驗醫(yī)學雜志》近5年診斷試驗的發(fā)文量最多,共計81 篇,其次是《中華急診醫(yī)學雜志》和《中華危重病急救醫(yī)學》,分別是50 篇和35 篇。 《中華危重病急救醫(yī)學》的納排標準書寫質量最高,35 篇診斷試驗中共28 篇研究包含了完整的納入標準和排除標準,部分研究還寫明剔除標準,總體完整率高達80.0%,其次是《中華急診醫(yī)學雜志》和《中國組織工程研究》,分別達到了72.0%和70.0%。 見表1。
表1 不同期刊診斷試驗發(fā)文量以及納排標準的完整率
近5 年,診斷試驗的發(fā)文量呈上升趨勢,以2019年發(fā)文量最多,共54 篇,其次為2020 年和2021 年。診斷試驗中納排標準的書寫完整率有所提升,2018年的完整率為40.7%,2019 年提升至44.0%,2021年納排標準的書寫質量最佳,完整率達到63.8%,詳見表2。 整體上,診斷試驗中納排標準的書寫質量正在逐步提升。
表2 近5 年診斷試驗發(fā)文數量以及納排標準完整率
226 篇診斷試驗中,112 篇含有完整的納排標準;74 篇既無納入標準,也無排除標準;23 篇研究僅有排除標準,缺少納入標準;17 篇僅有納入標準,缺少排除標準。 詳見圖2。
圖2 含有/缺少納入標準和排除標準的篇數
根據RUTJES 等[2]的研究,診斷試驗有四類研究設計,分別為A 型單門設計、B 型單門設計、C 型雙門設計(健康人群對照)和D 型雙門設計(其他疾病對照),如圖3 所示。前兩類設計使用統(tǒng)一的納排標準納入對象,后兩類設計亦稱為“病例對照設計”[13],通過雙重的納排標準,分別納入疾病組和對照組進入研究。
圖3 診斷試驗中的四種研究設計注:A. A 型單門設計,B.B 型單門設計,C.C 型雙門設計(健康人對照),D.D 型雙門設計(其他疾病對照)。
本文納入的研究中,A 型設計22 篇、B 型76篇、C 型34 篇、D 型89 篇。 共123 篇研究為雙門設計,此類研究將試驗人群分為對照組和疾病組,其中107 篇的對照組缺少納排標準。
所有的納排標準都置于研究的第一部分。 這一部分內容中,除了納排標準之外,還包含研究對象的一般資料,如疾病類型和病情嚴重程度等。其中120篇研究將納排標準置于一般資料之前,32 篇放置在一般資料之后。
共提取130 份納入標準和134 份排除標準。 其中,115 篇研究的納入標準包含診斷信息,如癥狀、體征和診斷標準;54 篇設定了納入對象的人口學特征,如性別、年齡;18 篇要求臨床資料完整;11 篇要求含有知情同意書。
102 篇研究的排除標準剔除了合并其他疾病的患者,如惡性腫瘤、血液疾病等;57 篇排除重要臟器功能異常的人群,如心、肝、腎衰竭;37 篇排除服用某類藥物的患者;27 篇排除臨床資料不齊全的研究對象;26 篇排除妊娠或哺乳期女性。同時,有部分研究將納入標準的反面寫入排除標準,這種重復書寫的情況出現在28 篇研究中。 詳見表3。
表3 納入標準和排除標準的書寫內容
納入標準是納入對象必須滿足的條件,一般較寬泛,內容簡明扼要,通常包括診斷信息和人口學特征,排除標準是用來剔除滿足納入標準但不適合進入研究的個體[14-15]。 因此,排除標準并非納入標準的對立面,兩者不是“互補”關系[16],而應以納入標準為主,確定研究主體,以排除標準為輔,排除研究主體中會干擾結果的個體,兩者關系如圖4 所示。
圖4 納入標準與排除標準的關系
不恰當的納排標準將影響研究的進展和結論的可靠性。 過于嚴格的納排標準,會降低研究的可行性,限制結論的外延性;過于寬泛的納排標準,研究對象的異質性過高,會影響研究結論的可靠性[14]。因此,納排標準應兼顧外延性和可靠性。
本研究結果顯示,目前北大核心期刊所刊載的診斷試驗中納排標準存在3 點不足:(1)內容欠完整;(2)位置不統(tǒng)一;(3)納排標準內容重復。
3.2.1 內容欠完整 納入226 篇診斷試驗中,74 篇研究既無納入標準也無排除標準,97 篇無納入標準,91 篇無排除標準,缺乏納排標準將無法客觀地評估結論的有效性[17]。 115 篇納排標準中無知情同意書,一部分隨意放在文中的其他位置,知情同意書的書寫位置決定了何時簽署它[18],因此,應作為入選條件之一置于納入或排除標準中;15 篇缺乏診斷信息,無法得知納入對象的疾病情況、癥狀和體征;123篇研究采用病例對照設計,大多數研究默認寫明“診斷標準”可替代“納入標準”,實際上,病例對照設計也應有明確的納排標準[2],“診斷標準”如果作為納入對象的標準之一,應置于納入標準中。
3.2.2 位置不統(tǒng)一 根據診斷準確性研究報告標準(standards for reporting of diagnostic accuracy studies, STARD)報告規(guī)范[19],納排標準是在研究開始之前確定的,一般資料是最終納入對象的信息。 因此,納排標準應寫在前,一般資料寫在后。 本研究發(fā)現,目前診斷試驗中納排標準的書寫位置不統(tǒng)一,或在一般資料前,或在一般資料后,或包含于一般資料之中,不便于讀者尋找納排信息。
3.2.3 納排標準內容重復 納排標準不是“互補關系”。 在關于D-二聚體診斷髖關節(jié)置換后慢性假體周圍感染的診斷試驗中[20],納入標準為D-二聚體、降鈣素原和白細胞總數等指標齊全者,而排除標準是D-二聚體、降鈣素原、白細胞總數等指標不齊全者,此為典型的“互補”條件。 這種將納入標準的反面寫入排除標準是無意義的重復,在112 篇同時含有納排標準的研究中,28 篇含有此類“錯誤的重復”,是由于對納排標準定義不明確而造成的。
在每年發(fā)表的診斷試驗中,僅有約20%的研究報告遵循了STARD[21],其中有相當一部分研究缺少納排標準。 這將無法對研究存在的偏倚和適用范圍進行判斷,也無法準確評價診斷試驗的有效性。 為了規(guī)范納排標準的書寫,本文查閱STARD 報告規(guī)范[22]、診斷準確性研究的質量評價工具(quality assessment of diagnostic accuracy studies, QUADAS)-2,診斷試驗質量評價工具[23]以及國家藥監(jiān)局發(fā)布的相關規(guī)定[24],提取與納排標準相關內容,總結如下:
3.3.1 STARD 報告規(guī)范 (1)描述研究對象的入選條件;(2)描述潛在研究對象的特征,如癥狀、體征、病理資料等;(3)描述潛在研究對象納入的時間和地點;(4)描述研究對象的納入方式:連續(xù)納入或隨機納入。
3.3.2 QUADAS-2 質量評價工具 (1)是否描述病例的選擇和納入病例的情況? (2)是否連續(xù)或隨機地納入病例?(3)是否避免了病例對照設計?(4)是否避免了不合理的排除?
3.3.3 《體外診斷試劑臨床試驗技術指導原則》 “受試人群應能夠代表目標人群的特征,包括人口學特征(性別、年齡)、癥狀、體征、合并癥以及疾病的階段、部位和嚴重程度等;同時受試者應排除不適合該臨床試驗的生理或病理特征,并根據以上要求合理設計受試者的納入和排除標準。 ”
綜合以上內容,診斷試驗中“納入研究對象”應注意以下問題:(1)完整并具代表性的納排標準;(2)盡量避免病例對照設計和不合理的排除;(3)詳述納入研究對象的時間和地點;(4)隨機或連續(xù)地納入研究對象。
根據以上內容,診斷試驗的納排標準可從以下3 點進行規(guī)范:
3.4.1 內容需完整 完整的納排標準應同時包含納入標準和排除標準,且診斷標準不能代替納排標準。納入標準的內容包括:診斷信息、人口學特征和知情同意書等。 排除標準的內容可包括:合并其他疾病、重要臟器功能異常、妊娠/哺乳等,具體的內容應圍繞研究目標來確定。
3.4.2 標準要統(tǒng)一 在診斷試驗中,對照組和疾病組通過統(tǒng)一的納排標準、 連續(xù)募集研究對象的設計屬于“單門設計”[7],這是最為理想的研究設計,即圖3 所示的A 型單門設計。 但目前很多研究尤其是回顧性研究,多預先設定好其他疾病與目標疾病進行鑒別,并招募一定數量的個體作為對照組,這屬于“雙門設計”。 盡管這類設計易于開展,成本較低,適合于診斷試驗初期,但應盡量避免僅有健康人群作為對照[25],且實驗組和對照組都應具有相應的納排標準[2]。
3.4.3 定義需明確 應明確納入標準和排除標準的定義。納入標準是研究對象入組的基本條件,排除標準是滿足納入標準但不適宜參與試驗的特殊人群,兩者不是正反面的關系。 其次,在表達方式上,應盡量使用肯定句來表達,尤其在排除標準中,雙重否定容易造成混淆。
除此之外,在書寫納排標準之前,應先闡述對象來源,包括納入對象的時間、地點和方式(連續(xù)或隨機)。 并于納排標準之后寫明研究對象的一般資料。本研究初步擬定了納排標準的書寫范式。詳見表4。應依次書寫對象來源、納排標準和一般資料,其具體內容應結合臨床實際和研究目的確定。
表4 診斷試驗中納排標準的書寫范式
在診斷試驗中,不同患病率、不同的患者構成、不同的對照組會直接影響對診斷試驗結果的評價[26-27]。因此,使用規(guī)范的納排標準,一定程度上能降低因不合理的納入對象造成的偏倚;另一方面,規(guī)范的納排標準能便于讀者判斷結論的可信度和適用范圍,更好地應用于臨床實踐,提升診斷試驗的質量。