谷鴻秋
在臨床研究統(tǒng)計分析思路與統(tǒng)計圖表系列的前兩篇文章中[1,2],我們將臨床研究的統(tǒng)計分析思路歸納為描述基線信息、估計效應(yīng)大小及補充敏感性分析三部分,并對基線信息的統(tǒng)計分析與圖表做了詳細(xì)論述。基線信息是研究結(jié)果的重要部分,基線組間均衡性的比較是多因素校正的效應(yīng)估計的基礎(chǔ),但臨床研究的核心目的還需通過效應(yīng)估計來實現(xiàn)。本文將結(jié)合研究實例闡述效應(yīng)估計所涉及的統(tǒng)計方法和統(tǒng)計圖表。
臨床研究的核心目的是回答某干預(yù)措施的效果如何,某暴露因素與結(jié)局的關(guān)聯(lián)強(qiáng)度如何。估計某干預(yù)措施的效果,估算暴露因素與結(jié)局的關(guān)聯(lián)強(qiáng)度,此即臨床研究的效應(yīng)估計。對隨機(jī)對照臨床試驗,國際人用藥品注冊技術(shù)協(xié)調(diào)會(International Conference on Harmonization of Technical Requirements for Registration of Pharmaceuticals for Human Use,ICH)在其統(tǒng)計指導(dǎo)原則《ICH Harmonised Tripartite Guideline Statistical Principles Clinical Trails E9》的增補文件ICH E9(R1)中總結(jié)和強(qiáng)調(diào)了“估計目標(biāo)(estimand)”的概念,從目標(biāo)人群、目標(biāo)變量、伴發(fā)事件、以及目標(biāo)變量在目標(biāo)人群層面的效應(yīng)量四個方面對效應(yīng)估計給出了更嚴(yán)格清晰的界定[3]。
依據(jù)結(jié)局變量的類型,臨床研究中的效應(yīng)估計可分為三大類:①連續(xù)性結(jié)局變量的均數(shù)差(MD);②分類結(jié)局變量的率差(RD)、危險度比(RR)以及優(yōu)勢比(OR);③生存結(jié)局?jǐn)?shù)據(jù)的生存率和風(fēng)險比(HR)。不同的效應(yīng)指標(biāo),含義不同、適用的研究類型和數(shù)據(jù)類型也不同:如MD適用于有對照研究設(shè)計的連續(xù)性結(jié)局變量;RD適合前瞻性研究設(shè)計的二分類結(jié)局變量;OR最適合病例對照研究的二分類結(jié)局變量;RR和HR最適合隨機(jī)對照研究和隊列研究的二分類結(jié)局變量,具體見表1。其它效應(yīng)指標(biāo)如中位數(shù)、回歸系數(shù)、相關(guān)系數(shù)以及RRR、APR、NNT等使用較少,不在本文討論的范圍之內(nèi)。靈敏度、特異度、一致率、陰性預(yù)測值以及陽性預(yù)測值等屬于診斷研究中專用的效應(yīng)指標(biāo),也不納入本文討論的范疇。
此外,依據(jù)是否進(jìn)行多因素模型的校正,效應(yīng)估計分為粗略的效應(yīng)估計和校正的效應(yīng)估計。常用的多因素模型包括線性回歸、Logistic回歸以及Cox比例風(fēng)險模型。不同的模型適用的結(jié)局變量類型不同,采用的效應(yīng)指標(biāo)也不同,具體見表2。
效應(yīng)估計結(jié)果的展示可借助統(tǒng)計圖形或者統(tǒng)計表格。統(tǒng)計表格因其制作方便,且可提供精確數(shù)據(jù),在學(xué)術(shù)期刊中使用更為普遍。統(tǒng)計圖形因其形式豐富、色彩多樣,更有“一圖勝千言”的視覺優(yōu)勢,在學(xué)術(shù)壁報和幻燈中使用更為普遍。此外,也可將統(tǒng)計圖表合為一體,充分利用二者的優(yōu)勢,如Meta分析中普遍使用的森林圖即是此類。統(tǒng)計表格與統(tǒng)計圖形各有優(yōu)劣,如何選擇效應(yīng)估計的統(tǒng)計圖表應(yīng)結(jié)合項目數(shù)據(jù)的特點、目的以及具體的使用場景綜合考量。
表1 臨床研究常用效應(yīng)指標(biāo)的特征比較
表2 不同結(jié)局類型的效應(yīng)估計指標(biāo)與統(tǒng)計圖形
圖1 急性腦出血患者強(qiáng)化降壓的ATACH-2研究的效應(yīng)估計表格
圖2 PLATO研究中替格瑞洛與氯毗格雷療效與安全性的效應(yīng)估計表格
效應(yīng)估計統(tǒng)計表格的具體形式變化多樣,但基本遵循一個通用的范式,具體形式可參考本系列首篇文章中的“表2”[1],典型案例見圖1,急性腦出血患者強(qiáng)化降壓的ATACH-2研究的效應(yīng)估計表格[4]。隨機(jī)對照臨床試驗由于組間均衡性可由隨機(jī)分配機(jī)制保證,因此常不報告多因素校正的效應(yīng)估計,如在急性冠狀動脈綜合征患者中比較替格瑞洛與氯毗格雷療效與安全性的PLATO研究[5],見圖2。效應(yīng)估計表格中應(yīng)針對每個結(jié)局的類別(連續(xù)變量、二分類變量、生存數(shù)據(jù))分別做不同的統(tǒng)計描述和效應(yīng)估計(表2)。結(jié)局為連續(xù)變量時,統(tǒng)計描述使用均數(shù)和標(biāo)準(zhǔn)差,效應(yīng)估計采用多因素模型計算校正前后的MD及其95% CI和P值(如急性缺血性卒中患者強(qiáng)化降壓的CATIS研究[6]);結(jié)局為二分類變量時,統(tǒng)計描述使用頻數(shù)(百分比),效應(yīng)估計中依據(jù)研究類型計算多因素模型校正前后的RD(如評估安定類藥物是否增加老年癡呆患者死亡率研究[7])、OR(如急性缺血卒中患者動脈內(nèi)治療的隨機(jī)對照MR CLEAN研究[8])或者RR(如比較卒中患者靜脈t-PA溶栓后支架取栓與單純靜脈t-PA溶栓的SWIFT PRIME研究[9])及其95%CI和P值;生存數(shù)據(jù),統(tǒng)計描述可直接使用事件數(shù)(百分比)(如比較氯毗格雷和阿司匹林治療急性小卒中和短暫性腦缺血發(fā)作患者CHANCE研究[10]),為充分利用生存數(shù)據(jù)的特點,研究者常增加Kaplan-Meier估計的生存率(如PLATO研究[5],SAVOR研究[11]及SOCRATES[12]等研究),或者發(fā)病密度,即每人年的事件率(如2型糖尿病的強(qiáng)化降糖ACCORD研究[13,14]、伴心血管病高危因素的強(qiáng)化降壓SPIRNT研究[15]),效應(yīng)估計中計算多因素模型校正前后的HR值及95%CI和P值。
效應(yīng)估計統(tǒng)計圖形在本系列的首篇文章已有論述,具體參見表2的總結(jié)。典型案例如阿利吉倫與氨氯地平片降壓試驗中帶誤差限的條圖[16],氯吡格雷高血小板反應(yīng)性的急性冠脈綜合征患者中,比較替格瑞洛和普拉格雷的血小板反應(yīng)性研究的散點圖與箱線圖的組合圖[17],阿利吉倫與氨氯地平片降壓研究的條圖[16],吸煙、戒煙對體重及肥胖的影響研究[18]和院外心臟驟停的發(fā)病及生存情況的時間變化趨勢研究[19]中的帶置信區(qū)間的點圖,以及此前提及的CHANCE研究[10]的Kaplan-Meier生存曲線及ACCROD研究[13,14]的累積事件率曲線,見圖3。
圖3 臨床研究常用效應(yīng)估計統(tǒng)計圖形實例
臨床研究常用的效應(yīng)指標(biāo)中,MD和RD的含義直觀、易于理解和計算,而RR和OR的含義則需要借助列聯(lián)表來說明。如下,假定由暴露和疾病兩個屬性定義的四種狀態(tài)的人數(shù)分別為a,b,c,d。
RR表示暴露組與非暴露組疾病發(fā)病率之比,。OR最常見的含義是病例組的暴露比與非病例組的暴露比之比RR適合于前瞻性的研究設(shè)計,OR適合病例對照研究設(shè)計。當(dāng)疾病的發(fā)生率很低時,RR≈OR,此時前瞻性的研究設(shè)計也可采用OR作為效應(yīng)指標(biāo),如評價瑞舒伐他汀預(yù)防心臟外科圍手術(shù)期并發(fā)癥的隨機(jī)對照臨床試驗中,效應(yīng)指標(biāo)即采用OR值[20]。HR則是暴露組與非暴露組在各時點的瞬時風(fēng)險之比,其計算需要借助Cox比例風(fēng)險模型。
校正的效應(yīng)指標(biāo)需要借助多因素回歸模型估算。臨床研究中常用的三種多因素回歸模型為線性回歸、Logistic回歸以及Cox比例風(fēng)險回歸[21]。
線性回歸適用于結(jié)局變量為連續(xù)變量的情形,模型通式如下:
其中x1,x2,…xm即為校正的協(xié)變量,b1,b2,…bm為m個自變量的回歸系數(shù)。對于某一回歸系數(shù)bk,其含義是控制了其它協(xié)變量(保持其它協(xié)變量不變的情況下),xk每增加一個單位所致的y的平均改變量。臨床研究通常比較的是組間的效應(yīng)差異,因此回歸系數(shù)作為效應(yīng)指標(biāo)的可解釋性要遠(yuǎn)低于校正的均數(shù)差,故研究者通常借助多因素線性回歸計算組間校正的均數(shù)差,即LS-Means Differences。
Logistic回歸模型適用于結(jié)局變量為二分類變量的情形。其模型通式如下:
②與①的區(qū)別僅在于等式左邊的變換。由于分類反應(yīng)變量的取值為離散的點,轉(zhuǎn)而用出現(xiàn)某結(jié)局的概率P的logit變換即做為應(yīng)變量,如此應(yīng)變量的取值范圍從單純的幾個點擴(kuò)展到(-∞,+∞)。恰巧是流行病學(xué)研究中的比值(odds)的概念。當(dāng)某影響因素xk取值1,0時(即有無此影響因素,或此影響因素增加一個單位),分別代入②式相減便可得回歸系數(shù),即,其中為流行病學(xué)研究中的比值比(OR)。當(dāng)疾病發(fā)生率較低時,OR≈RR,而RR是流行病學(xué)研究里的危險度比。自變量xk每增加一個單位(如從0到1),則出現(xiàn)結(jié)局的危險是原來的ebk倍,如此,原本看似牽強(qiáng)的數(shù)學(xué)變換與有實際解釋意義的流行病學(xué)關(guān)聯(lián)指(OR和RR)就此巧妙地結(jié)合起來。不過需留意,Logistic回歸直接得出的是校正的OR值,如需計算校正的RR,需采用相對危險度回歸[22-24](Relative risk regression)或者基于Logistic、Log-Binomial、Poisson或者Cox回歸改造而得[25,26]。
Cox比例風(fēng)險回歸模型適用于結(jié)局為時間-事件變量的情形,所謂比例風(fēng)險是指要比較的組間出現(xiàn)某生存結(jié)局的風(fēng)險比恒定,即不隨時間而變化。Cox比例風(fēng)險回歸模型通??蓪懗扇缦峦ㄊ剑?/p>
其中h0(t)表示基礎(chǔ)風(fēng)險,即所有協(xié)變量為0時的風(fēng)險,h(t)表示t時刻的風(fēng)險。與logistic回歸類似,當(dāng)某影響因素xk取值1,0時,分別代入④式相減便可得回歸系數(shù)而流行病學(xué)研究中的風(fēng)險比HR,表示自變量xk每增加一個單位,出現(xiàn)結(jié)局的風(fēng)險變?yōu)樵瓉淼膃bk倍。由于Cox比例風(fēng)險模型對基礎(chǔ)風(fēng)險h0(t)并無假定,限制條件少,使用廣,因此在醫(yī)學(xué)研究領(lǐng)域應(yīng)用廣泛。多因素Cox比例風(fēng)險回歸模型可直接獲得校正的HR,但在應(yīng)用時需留意時依協(xié)變量[27]及競爭風(fēng)險[28]。
臨床研究常用的效應(yīng)指標(biāo)及統(tǒng)計圖形的SAS實現(xiàn),具體見表3。SAS的繪圖模塊SAS/GRAPH在語法的一致性,編程的簡便性上不如9.2版本推出的新繪圖工具ODS Graphics,因此表3推薦ODS Graphics的SGPLOT過程。其它的繪圖工具如R的ggplot2包[29],以及專門用于生存分析的survminer包[30]均可方便實現(xiàn)上述圖形。
表3 臨床研究常用效應(yīng)估計及統(tǒng)計圖形的SAS實現(xiàn)