近30年來(lái),循證醫(yī)學(xué)從其最初關(guān)注點(diǎn)——教育臨床醫(yī)生如何理解并使用文獻(xiàn)以及系統(tǒng)綜述科學(xué),逐漸發(fā)展為強(qiáng)調(diào)證據(jù)評(píng)價(jià)與患者價(jià)值觀和意愿選擇相結(jié)合。其中,循證醫(yī)學(xué)證據(jù)的質(zhì)量對(duì)醫(yī)學(xué)決策成功與否起著決定性的作用。證據(jù)質(zhì)量越高,對(duì)診斷性質(zhì)、預(yù)后和健康干預(yù)效果的估計(jì)就越接近事實(shí)[1]。因此,如何對(duì)證據(jù)進(jìn)行評(píng)價(jià)和在爆炸式的醫(yī)學(xué)文獻(xiàn)中找出最佳臨床證據(jù),是醫(yī)務(wù)人員進(jìn)行循證醫(yī)學(xué)的關(guān)鍵步驟,能夠幫助醫(yī)務(wù)工作者更高效地進(jìn)行臨床決策。
循證醫(yī)學(xué)數(shù)據(jù)庫(kù)能夠有效幫助臨床醫(yī)務(wù)人員快速定位最佳臨床證據(jù),是獲取最佳臨床證據(jù)、更新臨床知識(shí)、解決臨床問(wèn)題的重要信息源,而且證據(jù)強(qiáng)度信息對(duì)臨床醫(yī)生快速獲取最有價(jià)值的信息至關(guān)重要。國(guó)外知名的循證醫(yī)學(xué)數(shù)據(jù)庫(kù)DynaMed不僅提供循證醫(yī)學(xué)證據(jù)信息,還對(duì)證據(jù)信息來(lái)源進(jìn)行分級(jí)評(píng)估。我國(guó)循證醫(yī)學(xué)數(shù)據(jù)庫(kù)建設(shè)尚處于起步階段,目前還未建立起一個(gè)權(quán)威的、可靠的循證醫(yī)學(xué)數(shù)據(jù)庫(kù)。根據(jù)筆者之前的研究結(jié)果[2],筆者認(rèn)為一個(gè)好的循證數(shù)據(jù)庫(kù)信息模型應(yīng)具備文獻(xiàn)特征、診療過(guò)程和證據(jù)強(qiáng)度3個(gè)頂層結(jié)構(gòu)模塊,并且能夠直接對(duì)證據(jù)進(jìn)行分級(jí)和推薦強(qiáng)度信息,能夠提供對(duì)證據(jù)強(qiáng)度方面的檢索或分類功能。在徐維的研究中[3]還探索建立了表達(dá)臨床證據(jù)的循證醫(yī)學(xué)數(shù)據(jù)元,但是研究中證據(jù)強(qiáng)度模塊的構(gòu)建依據(jù)和反映證據(jù)強(qiáng)度的數(shù)據(jù)元還比較單一。本文根據(jù)國(guó)際上已有的隨機(jī)對(duì)照試驗(yàn)報(bào)告撰寫標(biāo)準(zhǔn)及嚴(yán)格評(píng)價(jià)標(biāo)準(zhǔn),從循證醫(yī)學(xué)數(shù)據(jù)庫(kù)信息模型的證據(jù)強(qiáng)度模塊入手,進(jìn)一步細(xì)化該模塊的信息模型,并探討證據(jù)強(qiáng)度模塊中數(shù)據(jù)元反映文獻(xiàn)證據(jù)質(zhì)量的效果,對(duì)證據(jù)強(qiáng)度進(jìn)行初步判斷。
在蘇格蘭校際指南網(wǎng)(The Scottish Intercollegiate Guidelines Network,SIGN)標(biāo)準(zhǔn),牛津大學(xué)循證醫(yī)學(xué)中心(Center for Evidence-Based Medicine,CEBM)標(biāo)準(zhǔn),推薦分級(jí)的評(píng)估、制定與評(píng)價(jià)(Grading of Recommendations Assessment,Development and Evaluation,GRADE),以及中國(guó)循證醫(yī)學(xué)中心分級(jí)標(biāo)準(zhǔn)等國(guó)際上使用范圍較廣的循證醫(yī)學(xué)證據(jù)標(biāo)準(zhǔn)中,高質(zhì)量的隨機(jī)對(duì)照試驗(yàn)及與其相關(guān)的系統(tǒng)性綜述、Meta分析均屬于最高等級(jí)證據(jù)類型,被看作臨床證據(jù)的“金標(biāo)準(zhǔn)”[4-7]。因此,為更好地評(píng)價(jià)隨機(jī)對(duì)照試驗(yàn),幫助醫(yī)務(wù)人員判斷證據(jù)質(zhì)量,筆者對(duì)比分析了國(guó)際上權(quán)威的隨機(jī)對(duì)照試驗(yàn)報(bào)告質(zhì)量標(biāo)準(zhǔn)CONSORT 2010(CONsolidated Standards Of Reporting Trials)[8]以及部分權(quán)威的循證醫(yī)學(xué)網(wǎng)站提供的嚴(yán)格評(píng)價(jià)工具,包括牛津大學(xué)循證醫(yī)學(xué)中心制定的隨機(jī)對(duì)照試驗(yàn)嚴(yán)格評(píng)價(jià)工作表(CEBM)[9]、牛津大學(xué)所屬公司Better Value Healthcare Ltd(BVHC)開(kāi)發(fā)的嚴(yán)格評(píng)估技術(shù)項(xiàng)目(Critical Appraisal Skills Programme,CASP)[10]、蘇格蘭校際指南網(wǎng)制定的隨機(jī)對(duì)照試驗(yàn)嚴(yán)格評(píng)價(jià)說(shuō)明和工作表(SIGN)[11]、澳大利亞Joanna Briggs Institute(JBI)循證衛(wèi)生保健研究中心制定的隨機(jī)對(duì)照試驗(yàn)的嚴(yán)格評(píng)價(jià)工具(JBI)[12]。
對(duì)以上隨機(jī)對(duì)照試驗(yàn)的報(bào)告標(biāo)準(zhǔn)及嚴(yán)格評(píng)價(jià)工具進(jìn)行對(duì)比分析,統(tǒng)計(jì)其中共同出現(xiàn)的評(píng)價(jià)標(biāo)準(zhǔn)及其次數(shù),其結(jié)果如下。
在CONSORT、CEBM、CASP、JBI及SIGN中均提及隨機(jī)/順序產(chǎn)生、分配隱蔽機(jī)制,兩組樣本是否相似或基線資料,除被分配的治療外各組是否接受相同的處置、失訪比例,是否將失訪患者納入ITT(Intention To Treat)分析、盲法等評(píng)價(jià)項(xiàng)目。CEBM、CASP及SIGN中均出現(xiàn)了“PICO是否明確”這一要求,在CEBM、CASP及CONSORT中均出現(xiàn)了對(duì)于置信區(qū)間的要求,在JBI和SIGN中均出現(xiàn)了結(jié)果統(tǒng)計(jì)方法標(biāo)準(zhǔn)、合理、可信的要求。
因此,結(jié)合隨機(jī)對(duì)照試驗(yàn)報(bào)告質(zhì)量標(biāo)準(zhǔn)CONSORT 2010及以上嚴(yán)格評(píng)價(jià)標(biāo)準(zhǔn)等要求,并考慮證據(jù)的表達(dá)性、標(biāo)引和可讀性等因素后,選用了Patients/Problems-Intervention-Comparison-Outcome(PICO)、順序產(chǎn)生、分配隱蔽機(jī)制、樣本一致、干預(yù)一致、失訪比例、盲法、置信區(qū)間、結(jié)果、樣本量、流程圖等數(shù)據(jù)元,構(gòu)成了循證醫(yī)學(xué)數(shù)據(jù)庫(kù)證據(jù)強(qiáng)度模塊。其本體結(jié)構(gòu)如圖1所示。
將PICO這一元素細(xì)化為“疾病”“干預(yù)”“結(jié)局”3個(gè)數(shù)據(jù)組或數(shù)據(jù)元。其中“疾病”數(shù)據(jù)組可細(xì)化為“疾病名稱”和“疾病對(duì)象”2個(gè)數(shù)據(jù)元,“干預(yù)”數(shù)據(jù)組又可分為“干預(yù)(試驗(yàn))”和“干預(yù)(對(duì)比)”數(shù)據(jù)組并進(jìn)一步細(xì)化為“手術(shù)名稱”和“藥物名稱”2個(gè)數(shù)據(jù)元,“疾病”數(shù)據(jù)組和“干預(yù)”數(shù)據(jù)組均可復(fù)用在信息模型的診療過(guò)程模塊。另外將“樣本一致”和“干預(yù)一致”組成為“一致性”數(shù)據(jù)組。
圖1 循證醫(yī)學(xué)數(shù)據(jù)庫(kù)證據(jù)強(qiáng)度模塊的本體結(jié)構(gòu)
在證據(jù)強(qiáng)度數(shù)據(jù)元中選出順序產(chǎn)生、分配隱蔽機(jī)制、盲法、樣本一致、干預(yù)一致、失訪比例、ITT分析、置信區(qū)間、流程圖等元素,作為質(zhì)量評(píng)判以及排序的主要依據(jù)。雖然PICO、結(jié)果、樣本量等數(shù)據(jù)元重要,但不便于質(zhì)量評(píng)判,因此暫不評(píng)判。對(duì)選出的9個(gè)數(shù)據(jù)元進(jìn)行相應(yīng)的滿足度計(jì)算,滿足為1,不完全滿足為0.5,不滿足為0,共計(jì)9分。將該分值作為隨機(jī)對(duì)照試驗(yàn)的主要排序依據(jù),若分值相同則按照樣本量進(jìn)行降序。具體滿足度評(píng)判依據(jù)如表1所示。
表1 證據(jù)強(qiáng)度模塊各元素分值
為驗(yàn)證本文中證據(jù)強(qiáng)度模塊及其評(píng)分量表的可行性,由1名研究人員在知名循證醫(yī)學(xué)數(shù)據(jù)庫(kù)DynaMed中篩選合適的隨機(jī)對(duì)照試驗(yàn)文獻(xiàn),并由2名著錄人員按本證據(jù)強(qiáng)度模塊對(duì)其進(jìn)行標(biāo)引。本文選取了世界衛(wèi)生組織(WHO)全球健康觀察(GHO)數(shù)據(jù)中死亡原因前3位的疾病,即缺血性心臟病(Ischaemic heart disease)、中風(fēng)(stroke)、慢性阻塞性肺疾病(chronic obstructive lung disease)[13]。在DynaMed中查看對(duì)應(yīng)的主題“Coronary artery disease (CAD)”“stroke(acute management)”“COPD”,并選擇其中有明確證據(jù)分級(jí)和文獻(xiàn)鏈接的隨機(jī)對(duì)照試驗(yàn),篩選近10年來(lái)用手術(shù)或藥物治療以上疾病的相關(guān)文獻(xiàn)29篇。將這29篇文獻(xiàn)發(fā)給2名著錄人員進(jìn)行著錄和評(píng)分。為對(duì)滿足度分值與DynaMed的證據(jù)等級(jí)進(jìn)行對(duì)比,以90%、70%作為1、2、3級(jí)之間的區(qū)分比例,初步設(shè)定分值大于或等于8.1為1級(jí),分值大于或等于6.3且小于8.1為2級(jí),分值低于6.3為3級(jí)。以“Acute Effects of Acu-TENS on FEV1 andBlood β-endorphin Level in Chronic ObstructivePulmonary Disease”[14]一文為例,著錄結(jié)果如圖2所示。
結(jié)果顯示,22篇文獻(xiàn)中的證據(jù)等級(jí)與DynaMed一致,另7篇文獻(xiàn)與DynaMed不一致。具體評(píng)分結(jié)果如表2所示。通過(guò)SPSS軟件對(duì)兩組等級(jí)數(shù)據(jù)進(jìn)行kappa檢驗(yàn),結(jié)果為0.510,為一般一致性。
圖2著錄樣例
表2 29篇隨機(jī)對(duì)照試驗(yàn)的評(píng)分與比較
循證醫(yī)學(xué)數(shù)據(jù)庫(kù)信息模型的證據(jù)強(qiáng)度模塊由疾病名稱、疾病對(duì)象、手術(shù)名稱、藥物名稱、結(jié)局、順序產(chǎn)生、分配隱蔽機(jī)制、盲法、樣本一致、干預(yù)一致、失訪比例、ITT分析、置信區(qū)間、結(jié)果、樣本量、流程圖等數(shù)據(jù)元構(gòu)成。其中對(duì)部分與證據(jù)評(píng)價(jià)密切相關(guān)的數(shù)據(jù)元進(jìn)行滿足度評(píng)價(jià),如順序產(chǎn)生、分配隱蔽機(jī)制、盲法、樣本一致、干預(yù)一致、失訪比例、ITT分析、置信區(qū)間、流程圖,并通過(guò)DynaMed數(shù)據(jù)庫(kù)中的隨機(jī)對(duì)照試驗(yàn)進(jìn)行驗(yàn)證。由表2可知,該模塊中對(duì)于證據(jù)強(qiáng)度的評(píng)判與DynaMed基本一致,這些數(shù)據(jù)元的滿足度能夠在一定程度上反映證據(jù)質(zhì)量。在今后的循證醫(yī)學(xué)數(shù)據(jù)庫(kù)構(gòu)建中,可憑借隨機(jī)對(duì)照試驗(yàn)的滿足度對(duì)文獻(xiàn)進(jìn)行初步證據(jù)評(píng)價(jià),按滿足度由大到小的順序?qū)⒆罴炎C據(jù)推薦提供給醫(yī)務(wù)人員,幫助醫(yī)務(wù)人員用最少的時(shí)間獲取最有價(jià)值的證據(jù),支持臨床循證的實(shí)施。在驗(yàn)證過(guò)程中,有少數(shù)文獻(xiàn)的證據(jù)評(píng)價(jià)與DynaMed不完全一致。筆者分析后發(fā)現(xiàn),有以下原因。首先,本模塊評(píng)級(jí)只針對(duì)隨機(jī)對(duì)照試驗(yàn),而DynaMed的評(píng)級(jí)包括除隨機(jī)對(duì)照試驗(yàn)在內(nèi)的其他類型文獻(xiàn),因此在內(nèi)容及標(biāo)準(zhǔn)上存在一定偏差;其次,DynaMed評(píng)價(jià)中考慮到樣本量因素,多篇評(píng)價(jià)中提及“small sample size(小樣本)”。筆者認(rèn)為樣本量的計(jì)算及評(píng)價(jià)較為復(fù)雜,“樣本量”這一數(shù)據(jù)元暫不納入目前的質(zhì)量評(píng)價(jià)而是作為次要排序依據(jù),在滿足度相同時(shí)進(jìn)行二次排序。
由于已經(jīng)過(guò)評(píng)級(jí)的隨機(jī)對(duì)照試驗(yàn)全文較難獲取,本文中能夠獲取到的文章有限,進(jìn)行驗(yàn)證的樣本量不夠大。下一步的研究將增加著錄和評(píng)價(jià)的文獻(xiàn)數(shù)量,并進(jìn)一步使用更科學(xué)的統(tǒng)計(jì)學(xué)方法對(duì)該模塊進(jìn)行驗(yàn)證。在元素提取方面只針對(duì)隨機(jī)對(duì)照試驗(yàn)這類文獻(xiàn)不夠完善,今后可增加系統(tǒng)綜述的PRISMA標(biāo)準(zhǔn)與其他嚴(yán)格評(píng)價(jià)標(biāo)準(zhǔn),提取與系統(tǒng)綜述或Meta分析相對(duì)應(yīng)的數(shù)據(jù)元,對(duì)證據(jù)強(qiáng)度模型進(jìn)行補(bǔ)充和調(diào)整,并制定相應(yīng)的評(píng)判標(biāo)準(zhǔn),以充實(shí)和完善循證醫(yī)學(xué)數(shù)據(jù)庫(kù)的信息模型及其證據(jù)評(píng)價(jià)標(biāo)準(zhǔn)。
對(duì)于循證醫(yī)學(xué)證據(jù)的評(píng)價(jià)需要循證醫(yī)學(xué)實(shí)踐者通過(guò)各種嚴(yán)格評(píng)價(jià)工具進(jìn)行綜合判斷,這一點(diǎn)循證醫(yī)學(xué)數(shù)據(jù)庫(kù)本身還不能完全實(shí)現(xiàn)。希望本文的證據(jù)強(qiáng)度模塊能夠?yàn)檎麄€(gè)循證醫(yī)學(xué)數(shù)據(jù)庫(kù)的構(gòu)建打下基礎(chǔ),為醫(yī)務(wù)人員提供高質(zhì)量的證據(jù)。