王亞輝 徐虹 李大金
醫(yī)學研究報告規(guī)范是指導各類醫(yī)學研究、臨床實踐報告規(guī)范使用的文件,有助于客觀、完整、科學地報告研究方法和結(jié)果,保證報告的透明性。[1—2]醫(yī)學研究報告規(guī)范種類較多,如指南(guideline)、建議(recommendation)、標準(standard)等,主要的文件形式包括清單、流程圖和文字說明。醫(yī)學研究報告規(guī)范對作者、編輯、審稿人均具有重要作用:對作者,在研究實施前對照醫(yī)學研究報告規(guī)范進行設計,有助于提升研究的科學性,如選擇適當?shù)难芯糠椒ā⒎桨负推性u估、統(tǒng)計方法等;對編輯和審稿人,則提供了醫(yī)學論文審讀的參照標準,是評價報告透明性、完整性的重要參考。
醫(yī)學期刊具有特殊的天然使命,承擔著為各類臨床實踐和衛(wèi)生政策提供證據(jù)的責任。[3]遵守醫(yī)學研究報告規(guī)范是提升臨床研究報告質(zhì)量的關鍵,也是循證醫(yī)學方法學體系中的關鍵環(huán)節(jié)。從醫(yī)學研究報告規(guī)范產(chǎn)生、完善和應用的歷史沿革來看,醫(yī)學期刊編輯在其中扮演了重要角色。國際上,醫(yī)學研究報告規(guī)范最早發(fā)布于1979 年,即《生物醫(yī)學期刊投稿的統(tǒng)一要求》(Uniform Requirements for Manuscripts Submitted to Biomedical Journals),在2013 年更改名稱為《ICMJE 推薦規(guī)范》(Recommendations for the Conduct,Reporting,Editing and Publication of Scholarly Work in Medical Journals),[4]制定該醫(yī)學研究報告規(guī)范的團隊后發(fā)展為國際醫(yī)學期刊編輯委員會(International Committee of Medical Journal Editors,英文簡稱ICMJE)。目前對于大多數(shù)國際醫(yī)學期刊而言,已普遍認可并遵守《ICMJE 推薦規(guī)范》。然而,隨著醫(yī)學研究的持續(xù)發(fā)展,不同的研究目的、問題(如治療和發(fā)病機制、病因和預后、診斷等)需采用不同類型的研究設計,普適性的《ICMJE推薦規(guī)范》僅提供了最低標準,不能滿足特定研究設計的要求。因此,2008 年“提高醫(yī)學研究質(zhì)量和透明度”(Enhancing the Quality and Transparency of Health Research,英文簡稱EQUATOR)協(xié)作網(wǎng)啟動,[5]陸續(xù)發(fā)布針對不同研究類型的醫(yī)學研究報告規(guī)范,供研究者使用。
醫(yī)學研究報告規(guī)范在我國的引入、應用離不開醫(yī)學期刊的宣傳推動。例如,應用最廣泛的隨機對照試驗報告規(guī)范(Consolidated Standards of Reporting Trials, 英文簡稱CONSORT)最早即由《中國循證醫(yī)學》[6]、《中華男科學》[7]在國內(nèi)首次刊登介紹,隨后《中國實用內(nèi)科雜志》[8]等醫(yī)學期刊陸續(xù)刊登文章對CONSORT 進行解讀。[9]29
與此同時,我國醫(yī)學期刊行業(yè)多年來對醫(yī)學研究報告規(guī)范的整體知曉率未得到有效提高。[10]358在建設世界一流科技期刊的時代背景下,更新觀念、了解并掌握國際上關于醫(yī)學研究報告規(guī)范的最新進展具有重要意義。
2019 年以來,中國科學技術協(xié)會指導所轄各學會面向各學科領域國內(nèi)外科技期刊,陸續(xù)發(fā)布了各領域高質(zhì)量科技期刊分級目錄,旨在引導更多優(yōu)秀論文發(fā)表在我國高質(zhì)量科技期刊,增強我國科技期刊競爭力。首批臨床醫(yī)學領域高質(zhì)量科技期刊分級目錄于2019年9 月發(fā)布,涉及心血管病學、內(nèi)分泌病學、兒科學及醫(yī)學影像學四個方向。其中,醫(yī)學影像學科技期刊分級目錄選定國內(nèi)外專業(yè)期刊共計47 種,北美放射學會會刊Radiology等12 種期刊歸為T1 級,是接近或具備學科領域國際頂級水平的期刊。
2020 年,Radiology:Artificial Intelligence(Radiology子刊)以社論形式刊登了《人工智能醫(yī)學影像研究報告檢查清單:作者與審稿人指南》(Checklist for Artificial Intelligence in Medical Imaging:A Guide for Authors and Reviewers,英文簡稱CLAIM),[11]對此類論文的規(guī)范化報告提出了詳盡具體的建議。2023 年3 月,CLAIM 由EQUATOR 協(xié)作網(wǎng)發(fā)布,成為受到國際公認的、具備行業(yè)權(quán)威性的人工智能醫(yī)學影像研究報告規(guī)范。國際上已有實證研究顯示,期刊論文的社會影響力指標與作者對CLAIM 的依從性呈正相關,且相對于預印本論文,同行評議論文具有更高的報告完整性。[12]
醫(yī)學影像作為重要的臨床診斷和研究數(shù)據(jù),占所有臨床數(shù)據(jù)的80%以上。人工智能技術在圖像處理、病變分類、輪廓描記等方面,具有快速、準確的特點,已應用于心血管[13]、呼吸系統(tǒng)、神經(jīng)系統(tǒng)疾病及腫瘤[14—15]等的輔助診斷。隨著人工智能技術迅速發(fā)展及其在醫(yī)學影像診斷效率上的出色表現(xiàn),人工智能醫(yī)學影像已成為醫(yī)學研究中發(fā)展最快的熱點方向之一。[16—17]國內(nèi)外人工智能醫(yī)學影像研究論文的發(fā)表數(shù)量迅速增長。[18]以權(quán)威期刊Radiology為例,2019 年創(chuàng)辦了人工智能方向子刊Radiology:Artificial Intelligence。在我國,人工智能醫(yī)學影像臨床研究已經(jīng)進入“彎道超車”階段,各高水平醫(yī)學影像中心積累了大量數(shù)據(jù),在世界范圍內(nèi)的學術貢獻比例持續(xù)提高。然而,與此態(tài)勢形成反差的是,長期以來我國醫(yī)學期刊刊載的臨床研究論文整體上存在報告質(zhì)量、方法學質(zhì)量不高等問題,包括作者對醫(yī)學研究報告規(guī)范的依從性較差,[19]論文的研究設計、數(shù)據(jù)分析方法和匯報完整性等亟待提高等。[20—22]
不完整、不清晰、不透明的報告會降低醫(yī)學研究論文的可重復性和整體質(zhì)量,并嚴重影響其二次研究和轉(zhuǎn)化。上述現(xiàn)象雖然由多種因素造成,但一定程度上暴露出我國醫(yī)學期刊編輯在認知和專業(yè)素養(yǎng)上的缺失。[10]361盡管人工智能醫(yī)學影像研究是當前發(fā)展最迅速的方向之一,但目前我國醫(yī)學期刊編輯對相關論文的關注,多集中在圖片鑒別、插圖加工等編輯校對層面,尚無針對其報告規(guī)范的調(diào)查與研究。
本文對標國際權(quán)威臨床影像期刊,跟蹤醫(yī)學研究報告規(guī)范在人工智能及醫(yī)學影像領域的最新進展,首次引入和介紹人工智能醫(yī)學影像診斷準確性研究報告規(guī)范,并對合理應用提出相關建議,為國內(nèi)醫(yī)學期刊編輯部和審稿人提高審讀質(zhì)量提供有價值的借鑒和參考,以期促進我國醫(yī)學研究論文報告質(zhì)量的提升,助力世界一流科技期刊建設。
CLAIM 自2020 年面世后,得到了權(quán)威醫(yī)學影像專業(yè)團體、期刊,如歐洲放射學會及其會刊等的支持和推薦。CLAIM 主要的文本內(nèi)容包含檢查清單和條目說明,整體以《診斷準確性研究報告規(guī)范》(Standards for Reporting Diagnostic Accuracy, 英 文 簡稱STARD)2015 版為基礎,[23]共包含42 項條目,主要適用于診斷準確性類型研究,也適用于疾病的篩查、治療決策、預后、療效評估等研究內(nèi)容。具體的應用包括圖形分類、圖像重建、文本分析和工作流程優(yōu)化等。
CLAIM 檢查清單的內(nèi)容如表1 所示。42項條目按科學論文的結(jié)構(gòu)進行分組,摘要、引言、討論和其他信息這四部分的條目與STARD 2015 版對應的條目基本一致。在方法部分,保留“研究設計”子主題,更新“分析”子主題并具體化為“數(shù)據(jù)”“真值”“數(shù)據(jù)分區(qū)”“模型”“訓練”和“評估”子主題。在結(jié)果部分,更新“研究對象”“試驗結(jié)果”為“數(shù)據(jù)”“模型性能”子主題。
表1 人工智能醫(yī)學影像診斷準確性研究報告檢查清單
CLAIM 在醫(yī)學期刊的應用正在起步。針對中國科學技術協(xié)會高質(zhì)量期刊目錄中的47種醫(yī)學影像學期刊在臨床研究報告方面的期刊政策的調(diào)研顯示,國內(nèi)13 種中文刊中,尚未有期刊在其“投稿須知”及官網(wǎng)對人工智能醫(yī)學影像方面稿件需遵守的報告指南進行說明。部分期刊提出了普適性的要求,如《磁共振成像》在“投稿須知”的“出版?zhèn)惱硪蟆毕嚓P內(nèi)容中提出:“本刊要求所有作者依照生物醫(yī)學研究報告標準撰寫論文。隨機對照試驗可參照CONSORT 聲明,系統(tǒng)評價參照PRISMA,觀察性研究的Meta 分析參照MOOSE,觀察性研究參照STROBE,診斷試驗參照STARD 聲明,定性研究參照RATS,經(jīng)濟學評估參照CHEERS?!痹趪H期刊方面,除Radiology最早在其領域子刊登相關要求外,迅速跟進的還有歐洲放射學會期刊European Radiology,其稿約在“材料與方法”相關內(nèi)容中明確指出“此部分內(nèi)容應提供足夠詳細的信息,以便他人重復實驗。強烈建議遵循適用的報告指南(請參考EQUATOR 協(xié)作網(wǎng)或CLAIM 指南)”。其他英文醫(yī)學期刊則在期刊政策的臨床研究報告規(guī)范方面,概括性地提出要求遵守ICMJE 和EQUATOR 協(xié)作網(wǎng)發(fā)布的醫(yī)學研究報告規(guī)范。這些現(xiàn)象與CLAIM發(fā)布時間短及期刊自身導向有一定關系。盡管調(diào)研的期刊樣本數(shù)量有限,但從一個側(cè)面反映出CLAIM 的廣泛應用尚需要時間以及行業(yè)內(nèi)循序漸進的推動。
與國內(nèi)期刊界的反應形成對照的是,我國已有學者對CLAIM 的使用效果進行研究,并在一項最新的綜述中指出,在深度學習影像組學研究論文的設計和報告指南方面,CLAIM 較優(yōu)于現(xiàn)有的影像組學質(zhì)量評分(radiomics quality score, 英文簡稱RQS)工具和《臨床預測模型報告規(guī)范》(Transparent Reporting of a Multivariable Prediction Model for Individual Prognosis or Diagnosis,英文簡稱TRIPOD),并在論文數(shù)據(jù)的去標識化和失效分析方面表現(xiàn)出額外的優(yōu)勢。[24]隨著深度學習等人工智能技術應用的增多,CLAIM將顯示更好的適用性。
為促進CLAIM 的應用和推廣,本文提出以下幾項建議,供醫(yī)學期刊編輯參考,以指導作者合理使用CLAIM。
“投稿須知”越來越多地受到醫(yī)學期刊編輯部的重視,已有研究者不斷呼吁推進我國醫(yī)學期刊“投稿須知”的規(guī)范化,并在“投稿須知”中明確醫(yī)學研究報告規(guī)范的相關要求。[9]32,[25]除了“投稿須知”這一途徑,編輯部可結(jié)合期刊設置的欄目,采取簡報、消息、動態(tài)以及舉辦講座等形式對CLAIM 進行系統(tǒng)介紹,還可利用新媒體手段加大該方面信息的傳播力度,推動作者、審稿人對人工智能醫(yī)學影像研究論文報告清單知曉率的提升。
同時,在實際工作中,由于目前國內(nèi)對CLAIM 了解尚少,編輯須引導作者在遵照期刊總體要求的基礎上參考清單的主要條目,以最大程度對稿件內(nèi)容進行完整說明,避免教條式的照搬。
編輯在指導作者使用CLAIM 時應注意提醒作者避免使用模糊的描述。真值標記或注釋提供了影像中不同結(jié)構(gòu)或特征的確切位置、性質(zhì)信息,作為算法或模型的參考標準,應予以明確、詳細地說明。例如,在《基于深度學習的口腔鱗狀細胞癌CT 增強圖像中頸部轉(zhuǎn)移淋巴結(jié)自動檢測模型的建立及臨床應用研究》一文中,作者在資料與方法部分詳細報告了“轉(zhuǎn)移淋巴結(jié)標注”相關內(nèi)容,包括CT 圖像的層厚、圖像分辨率,淋巴結(jié)勾畫方法和標注過程實施等,這樣的表述就比較清晰。[26]
在CLAIM 清單中,涉及模型描述的具體要求為第22 至24 項。稿件中易出現(xiàn)的主要問題包括模型結(jié)構(gòu)敘述不清晰或不完整、缺乏對模型參數(shù)初始化的描述等。另外,目前此類醫(yī)學影像研究論文中,較多的是直接利用已有模型或修改后加以應用,此時編輯應留意作者是否引用了相關文獻,或?qū)π薷那闆r詳細說明。若無,須請作者添加。這也是醫(yī)學研究報告規(guī)范中“論文材料/方法部分”的通用要求,目的是保證論文結(jié)果的可重復性和透明度。
編輯和審稿人在應用CLAIM 審理稿件過程中,應注意適用的研究設計類型,以及研究對象納入/排除標準、樣本量估算、盲法判定、可靠性分析等共性問題。
需要特別指出的是,盡管CLAIM 適用于多種人工智能醫(yī)學影像研究設計類型,但它僅提供了一種框架,并非所有條目都適用于每一篇稿件。編輯可將其視作稿件審讀和指導作者規(guī)范、完整地撰寫稿件的一種“最佳”實踐,但仍需結(jié)合期刊的具體要求和稿件內(nèi)容等來進行合理使用。例如,CLAIM 中將“減小變異和/或解決偏差的方法”置于方法部分,而在實際稿件處理時,一般也可在討論部分進行具體探討。換言之,論文不需要逐條照搬清單中的條目,可以將若干條目合并報告。但是,對于涉及醫(yī)學期刊出版?zhèn)惱淼挠嘘P項目則需嚴格遵守。例如,涉及人、實驗動物研究的稿件,編輯部應注意形式審查和相關信息的適當披露,如倫理審批、受試者的知情同意、臨床試驗注冊、研究方案儲存等情況。此外,對利益沖突、經(jīng)費資助、數(shù)據(jù)可用性的聲明也是出版?zhèn)惱砗脱芯客该餍陨婕暗闹匾矫妫庉嫼蛯徃迦嗽趯徖砀寮r應予以重視。
CLAIM 的應用不僅能使編輯和審稿人直觀地評估論文是否要素齊全恰當,使作者更加直觀清晰地了解如何對研究成果進行報告,還能使讀者全面了解研究過程,更好地評價其真實性。同時,推廣CLAIM 的應用對于提高相關醫(yī)學研究的報告質(zhì)量、促進臨床研究成果的轉(zhuǎn)化效率具有重要意義。因此,本文呼吁醫(yī)學期刊合理應用CLAIM 檢查清單,以促使作者對人工智能醫(yī)學影像研究成果進行詳細、全面的描述,提升相關醫(yī)學研究論文的報告質(zhì)量和學術質(zhì)量,最終推動醫(yī)學期刊高質(zhì)量發(fā)展,助力世界一流醫(yī)學期刊建設。