谷鴻秋
近年來(lái),無(wú)論是從國(guó)家層面的臨床研究機(jī)構(gòu)體系建設(shè),還是從學(xué)術(shù)層面的臨床研究經(jīng)驗(yàn)交流來(lái)看,臨床研究都得到了前所未有的重視,但也存在著短板和不足[1,2],如專(zhuān)職臨床研究人員的匱乏、常用臨床研究方法和技能的欠缺、尤其是統(tǒng)計(jì)分析思路與方法的欠缺。本文將圍繞臨床研究統(tǒng)計(jì)分析思路及統(tǒng)計(jì)圖表做一概要介紹,以期為臨床研究提供相關(guān)借鑒。
臨床研究設(shè)計(jì)類(lèi)型不同,其統(tǒng)計(jì)分析思路與方法也不同,因此有諸如CONSORT、STROBE、TREND以及STARD等適用于不同研究類(lèi)型的報(bào)告規(guī)范[3-6]。多數(shù)臨床研究項(xiàng)目的統(tǒng)計(jì)分析思路基本可歸納為一個(gè)通用策略:描述基線信息;估計(jì)效應(yīng)大??;補(bǔ)充敏感性分析。
臨床研究論文的結(jié)果部分首先需呈現(xiàn)的是研究人群的基本信息。例如,多少人參與篩選?經(jīng)過(guò)入選排除標(biāo)準(zhǔn)篩選后,多少人納入研究?經(jīng)過(guò)數(shù)據(jù)清理后,多少人納入統(tǒng)計(jì)分析?研究人群基線特征信息如何?納入統(tǒng)計(jì)分析的人群與排除的人群特征差異如何? 諸如此類(lèi)信息可在研究結(jié)果的第一部分交代清楚。對(duì)于基線信息的描述,常用工具無(wú)非研究流程圖和基線信息表。由于這些圖表常最先出現(xiàn)在論文結(jié)果中,因此常被命名為“圖1”、“表1”。
圖1是臨床研究中“圖1”的一個(gè)最為簡(jiǎn)易的通用模板?!皥D1”將提供從最初篩選到最終納入統(tǒng)計(jì)分析各階段人數(shù)。不同研究設(shè)計(jì)類(lèi)型在具體的階段和流程上有所不同:對(duì)于臨床試驗(yàn),從篩選、隨機(jī)化、隨訪、方案遵循情況等階段進(jìn)行例數(shù)統(tǒng)計(jì),例如評(píng)估強(qiáng)化血糖控制對(duì)2型糖尿病患者血管結(jié)局的ADVANCE隨機(jī)對(duì)照研究[7],強(qiáng)化降壓對(duì)心血管病結(jié)局的SPRINT研究[8]等;對(duì)于抽樣調(diào)查研究,則從各階段的抽樣人數(shù)、應(yīng)答情況等方面進(jìn)行描述,如PURE研究中,對(duì)心血管病患者健康生活方式的調(diào)查研究[9];對(duì)于基于已有登記注冊(cè)庫(kù)的研究,則從研究的亞人群、變量的缺失情況等方面篩選,例如基于GWTG數(shù)據(jù)庫(kù)的ST段抬高的心?;颊叩募本柔t(yī)療服務(wù)使用現(xiàn)況的研究[10];而Meta分析中,“圖1”則是對(duì)檢索的文獻(xiàn)進(jìn)行剔除,Meta分析的報(bào)告規(guī)范PRISMA甚至還提供了相應(yīng)流程模板[11]。如果研究人群的篩選流程較簡(jiǎn)單,可直接在正文方法學(xué)或結(jié)果部分用文字直接描述,如針對(duì)心源性急性腦缺血患者抗凝效果和時(shí)機(jī)的RAF研究[12]。相反,如果文章中圖表過(guò)多,為節(jié)約版面,可將此圖置于附件圖中,如NEJM上諸如CHANCE、DAWN等一些著名的隨機(jī)對(duì)照研究[13,14]。
圖1 臨床研究常用流程圖模板
表1 臨床研究常用基線信息表格模板
表1給出了臨床研究中“表1”的一個(gè)較為通用的模板?!氨?”中,通常將各組及組間比較的P值作為單獨(dú)的列項(xiàng)列出,而將需要描述的重要變量作為行條目列出。至于分組變量、描述變量、統(tǒng)計(jì)量和P值的選擇,則需依據(jù)研究類(lèi)型,研究目的及數(shù)據(jù)屬性做綜合考量?!氨?”中的列,除了各分組和P值外,有時(shí)還會(huì)增加一個(gè)合并的總體列[15],或是需展示的其它統(tǒng)計(jì)量,如標(biāo)化的組間差值[10]。棄用P值,轉(zhuǎn)用標(biāo)化的組間差值,常見(jiàn)于大樣本的觀察性研究[16,17]。P值評(píng)價(jià)組間差異,有兩個(gè)缺陷:一是P值只給出定性結(jié)論,無(wú)法給量化差異大??;二是大樣本時(shí),P值過(guò)于敏感[18],假陽(yáng)性過(guò)高。因此,在大樣本的隨機(jī)對(duì)照研究中[7,13,14],僅報(bào)告描述性統(tǒng)計(jì)量,不報(bào)告P值。“表1”中描述的變量常包含社會(huì)人口學(xué)特征、疾病史、用藥史、實(shí)驗(yàn)室檢查指標(biāo)及臨床特征等方面的內(nèi)容。當(dāng)所描述的變量過(guò)多時(shí),可按一定邏輯層次展示,甚至拆分成多個(gè)表格[19]。若不分組描述,可將所有研究人群作為整體直接描述,如GWTG的臺(tái)灣登記研究[20]。
一篇臨床研究論文旨在回答某干預(yù)措施的效果如何?某暴露因素與結(jié)局的關(guān)聯(lián)強(qiáng)度如何? 此即效應(yīng)估計(jì)。估計(jì)效應(yīng)計(jì)時(shí),結(jié)局變量的類(lèi)型不同,其效應(yīng)評(píng)價(jià)指標(biāo)也不同。例如,連續(xù)性結(jié)局變量的效應(yīng)評(píng)價(jià)指標(biāo)通常為均數(shù)差;分類(lèi)結(jié)局變量的效應(yīng)指標(biāo)略微復(fù)雜,依據(jù)研究類(lèi)型,常用指標(biāo)有率差、危險(xiǎn)度比(RR)以及優(yōu)勢(shì)比(OR);生存結(jié)局?jǐn)?shù)據(jù)的效應(yīng)評(píng)價(jià)指標(biāo)為生存率和風(fēng)險(xiǎn)比(HR)。無(wú)論采用哪種效應(yīng)評(píng)價(jià)指標(biāo),通常都需進(jìn)行兩類(lèi)的效應(yīng)估計(jì):粗略的效應(yīng)估計(jì);校正的效應(yīng)估計(jì)。粗略的效應(yīng)估計(jì)是指未經(jīng)協(xié)變量校正的,單變量分析結(jié)果;而校正的效應(yīng)估計(jì)則是在多因素回歸模型中校正潛在的混雜變量后的效應(yīng)估計(jì)。在觀察性研究中,由于缺乏隨機(jī)分配過(guò)程,組間可能存在大量不均衡的混雜因素,因此必需報(bào)告多因素校正的效應(yīng)估計(jì)。
效應(yīng)估計(jì)的統(tǒng)計(jì)圖形可依據(jù)不同的效應(yīng)指標(biāo)而做不同的選擇,常用的效應(yīng)估計(jì)統(tǒng)計(jì)圖形如圖2所示。連續(xù)變量可用帶誤差限的條圖(如評(píng)估阿利吉倫與氨氯地平片降壓的臨床試驗(yàn)中的Figure 3[21])、散點(diǎn)圖與箱線圖或類(lèi)似圖形的組合圖展示(如在經(jīng)皮冠狀動(dòng)脈介入術(shù)后,具有氯吡格雷高血小板反應(yīng)性的急性冠脈綜合征患者中,比較替格瑞洛和普拉格雷的血小板反應(yīng)性研究的Figure 3[22]);分類(lèi)變量,若效應(yīng)指標(biāo)是率,則可將率做成條圖(如阿利吉倫與氨氯地平片降壓的臨床試驗(yàn)中的Figure 5[21]),若效應(yīng)指標(biāo)是OR,RR或HR,則可采用帶置信區(qū)間的點(diǎn)圖,橫向或是縱向均有大量研究實(shí)例(如吸煙、戒煙對(duì)體重及肥胖的影響研究,及院外心臟驟停的發(fā)病及生存情況的時(shí)間變化趨勢(shì)研究中的Figure 2[23,24]);生存數(shù)據(jù)最適合的圖形當(dāng)然是展示整個(gè)研究時(shí)期內(nèi)生存經(jīng)歷的Kaplan-Meier生存曲線,這在此前提及的隨機(jī)對(duì)照研究中已很常見(jiàn)[7,14]。
圖2 臨床研究常用效應(yīng)估計(jì)統(tǒng)計(jì)圖形模板
表2 臨床研究常用效應(yīng)估計(jì)統(tǒng)計(jì)表格模板
效應(yīng)估計(jì)的表格可以用一個(gè)較為通用的模板展示,具體如表2所示。此表對(duì)于連續(xù)變量、分類(lèi)變量以及生存數(shù)據(jù)均適用,只需依據(jù)變量類(lèi)型替換相應(yīng)的效應(yīng)指標(biāo)即可。例如,連續(xù)性結(jié)局變量的均數(shù)差(如急性缺血性卒中患者強(qiáng)化降壓的CATIS研究中的Table 2[25]),分類(lèi)結(jié)局變量的率差(如評(píng)估安定類(lèi)藥物是否增加老年癡呆患者死亡率研究的Table 2[26])、OR(如急性缺血卒中患者的動(dòng)脈內(nèi)治療的隨機(jī)對(duì)照MR CLEAN研究的Table 2[27])或RR(如SWIFT PRIME研究[28]中比較卒中患者靜脈t-PA溶栓后支架取栓與單純靜脈t-PA溶栓的Table 2),以及生存數(shù)據(jù)的HR(此前提及的PLATO[29]中的Table 3和CHANCE研究[14]里的Table 2)。
除了單純的統(tǒng)計(jì)圖形和表格,也可將統(tǒng)計(jì)圖表進(jìn)行結(jié)合,此即用“森林圖” 展示研究結(jié)果。嚴(yán)格來(lái)說(shuō),森林圖是一種以無(wú)效線(橫坐標(biāo)刻度為0或1)為中心,結(jié)合了數(shù)字、文本、圖形,同時(shí)展示各研究及匯總研究結(jié)果的綜合圖形。不過(guò)在單個(gè)研究中,森林圖里并無(wú)匯總結(jié)果,展示的是各終點(diǎn)指標(biāo)或各暴露因素相應(yīng)的效應(yīng)估計(jì)值。具體實(shí)例如FREEDOM[30],CHANCE[14]等研究。
一篇臨床研究文章在報(bào)告完基線信息和效應(yīng)估計(jì)后,基本已是完整的分析結(jié)果。很多情況下,研究者們通常會(huì)進(jìn)行“敏感性分析”,以獲得更為穩(wěn)健的結(jié)論。所謂“敏感性”是指當(dāng)分析方法、統(tǒng)計(jì)模型、變量定義及研究假定發(fā)生變化時(shí),研究結(jié)果和結(jié)論的穩(wěn)健性[31,32]。當(dāng)敏感性分析的結(jié)論與主要分析結(jié)論一致時(shí),可提升研究結(jié)論的可信度,若不一致,則需進(jìn)一步討論,并給出合理解釋。敏感性分析適用的場(chǎng)景非常廣泛,從數(shù)據(jù)的缺失值、離群值的不同處理策略,研究結(jié)局的不同定義,到不同統(tǒng)計(jì)模型,以及相同統(tǒng)計(jì)模型里的不同層次的協(xié)變量校正,研究人群劃分,亞組分析等均屬于敏感性分析的范疇[32]。
敏感性分析的結(jié)果沒(méi)有普遍統(tǒng)一的展現(xiàn)形式,基本上是變換不同的條件重復(fù)效應(yīng)估計(jì)的步驟。例如在CHANCE研究1年隨訪結(jié)果中,作者依據(jù)不同的缺失值填補(bǔ)策略采用了三個(gè)統(tǒng)計(jì)模型,并依據(jù)不同亞組人群的劃分,分別估計(jì)氯吡格雷+阿司匹林對(duì)比單用阿司匹林預(yù)防卒中復(fù)發(fā)的效果[33]。有時(shí)也用森林圖展示,尤其是進(jìn)行亞組分析的時(shí)候,森林圖是最為普遍的展現(xiàn)方式,如此前提及的ADVANCE研究[7]中的Figure 5及CHANCE研究中[14]的Figure 2。
本文是臨床研究統(tǒng)計(jì)分析思路與統(tǒng)計(jì)圖表系列文章的首篇,對(duì)臨床研究統(tǒng)計(jì)分析思路與統(tǒng)計(jì)圖表做了一個(gè)概述。不同的臨床研究設(shè)計(jì)類(lèi)型,其統(tǒng)計(jì)分析思路與方法不同。本文并非企圖提供一個(gè)完全普適的臨床研究統(tǒng)計(jì)分析策略,而是旨在提供一種在通常情況下均可借鑒的、典型的統(tǒng)計(jì)分析思路,并嘗試通過(guò)模板化的統(tǒng)計(jì)圖表來(lái)體現(xiàn)、實(shí)現(xiàn)此思路。
目前傳統(tǒng)的衛(wèi)生/生物統(tǒng)計(jì)教學(xué)中,統(tǒng)計(jì)方法與臨床研究實(shí)例的銜接不夠,各統(tǒng)計(jì)方法間欠貫通,易局限于“一招一式”的教學(xué)模式中,難以形成一套簡(jiǎn)約、實(shí)用的“組合拳法”。希望借此系列文章,貫通各統(tǒng)計(jì)方法,并將統(tǒng)計(jì)方法與臨床研究實(shí)例無(wú)縫對(duì)接。本系列后續(xù)文章將對(duì)基線信息的描述、效應(yīng)大小的估計(jì)以及敏感性分析各部分,及其涉及的統(tǒng)計(jì)分析方法進(jìn)行詳細(xì)介紹。