閆俊紅 楊紫荊 侯雅文 陳 征?
【提 要】 目的 當(dāng)復(fù)合終點(diǎn)(事件)中組分結(jié)局事件的臨床優(yōu)先級(jí)問題存在時(shí),傳統(tǒng)基于風(fēng)險(xiǎn)比的方法常出現(xiàn)一定的估計(jì)誤差。本文以急性淋巴細(xì)胞白血病患者預(yù)后研究為背景,討論能解決該問題的統(tǒng)計(jì)方法。方法 介紹在組分事件之間的優(yōu)先級(jí)非常重要時(shí),一種新的指標(biāo)贏率的概念和分析方法;隨后將該方法應(yīng)用于急性淋巴細(xì)胞白血病的預(yù)后研究,比較風(fēng)險(xiǎn)比和基于贏率的匹配、不匹配和加權(quán)贏率法的差異。結(jié)果 研究發(fā)現(xiàn),贏率法顯示GvHD預(yù)防是急性淋巴細(xì)胞白血病患者預(yù)后的危害因素,而風(fēng)險(xiǎn)比的結(jié)果與之相反,這是由于在含有多個(gè)優(yōu)先級(jí)結(jié)局事件的研究中,風(fēng)險(xiǎn)比受第一結(jié)局事件的影響,結(jié)果往往存在一定的偏差,而贏率能更好的反映實(shí)際情況。結(jié)論 當(dāng)組分事件之間的優(yōu)先級(jí)很重要時(shí),相對(duì)于風(fēng)險(xiǎn)比,贏率是一個(gè)更好的統(tǒng)計(jì)評(píng)價(jià)指標(biāo)。
急性淋巴細(xì)胞白血病是一類造血干細(xì)胞惡性克隆性疾病,其主要表現(xiàn)為外周血中出現(xiàn)異常的白細(xì)胞,失去控制后在骨髓和其他造血組織中大量增殖,導(dǎo)致正常紅細(xì)胞和血小板的生成減少。急性淋巴細(xì)胞白血病自然病程較短,若不治療,一般多在6個(gè)月內(nèi)死亡。但經(jīng)過骨髓移植治療后的患者,也會(huì)出現(xiàn)復(fù)發(fā)、發(fā)生不良事件、死亡等結(jié)局事件[1]。這種由多個(gè)結(jié)局事件組合而成的終點(diǎn)稱為復(fù)合終點(diǎn)(composite endpoints),常被用作隨機(jī)臨床試驗(yàn)的主要終點(diǎn),以提高試驗(yàn)的效率[2~3]。由于復(fù)合終點(diǎn)的事件發(fā)生率相對(duì)較高,較易發(fā)現(xiàn)組間差異,從而可以降低試驗(yàn)所需的樣本量,減少研究時(shí)間和成本。另外,以復(fù)合終點(diǎn)作為主要終點(diǎn),也可以避免多重性問題和競(jìng)爭(zhēng)風(fēng)險(xiǎn)問題[4-5]。但傳統(tǒng)復(fù)合終點(diǎn)的應(yīng)用也存在一定的局限,它通常將所有結(jié)局事件視為同等重要,并且只考慮最先發(fā)生的結(jié)局事件,如在急性淋巴細(xì)胞白血病的臨床研究中,復(fù)合終點(diǎn)定義為患者死亡和發(fā)生不良事件,若患者首先發(fā)生不良事件,之后更為重要的該患者是否死亡就被忽略了,也就是說,早期發(fā)生的非致命事件比后來發(fā)生的更嚴(yán)重的事件具有更高的優(yōu)先級(jí)。因此,當(dāng)各終點(diǎn)事件對(duì)患者的重要性不一致時(shí),對(duì)結(jié)果的解釋變得尤為困難[6-7]。
為了解決上述問題,Pocock等人[8]提出了“贏率”(win ratio)這一新指標(biāo)或方法,它在傳統(tǒng)復(fù)合終點(diǎn)的基礎(chǔ)上將復(fù)合終點(diǎn)組成事件的臨床優(yōu)先級(jí)加以考慮,即根據(jù)研究目的及臨床意義對(duì)組分結(jié)局事件的重要性進(jìn)行排序,優(yōu)先考慮重要性高的事件。本文將基于急性淋巴細(xì)胞白血病患者預(yù)后研究的實(shí)際數(shù)據(jù),介紹贏率的定義、估計(jì)以及相應(yīng)的統(tǒng)計(jì)推斷方法,并將其與傳統(tǒng)的風(fēng)險(xiǎn)比(hazard ratio,HR)進(jìn)行比較。
1.研究對(duì)象
選用1985年至1998年在歐洲血液和骨髓移植學(xué)會(huì)(EBMT)注冊(cè)的2279例急性淋巴細(xì)胞白血病患者數(shù)據(jù),所有患者均在初次完全緩解時(shí)進(jìn)行親緣供者異基因骨髓移植術(shù)。隨訪期間記錄的事件包括:發(fā)生不良事件、血小板恢復(fù)、復(fù)發(fā)和死亡。這里的不良事件定義為在移植后100天內(nèi)出現(xiàn)2級(jí)及其以上的移植物抗宿主病。預(yù)后信息包括:供受者性別匹配、GvHD預(yù)防、移植年份和移植年齡。
2.調(diào)查內(nèi)容
對(duì)GvHD預(yù)防的臨床益處的進(jìn)行評(píng)估,復(fù)合終點(diǎn)定義為患者死亡和發(fā)生不良事件,其中死亡具有較大的優(yōu)先級(jí),而其他狀態(tài)作為右刪失。
3.數(shù)據(jù)整理及分析
應(yīng)用R 3.4.3進(jìn)行數(shù)據(jù)整理、基線信息描述以及模型建立和估計(jì)。
4.研究方法
本研究運(yùn)用3種贏率法來評(píng)估GvHD預(yù)防對(duì)急性淋巴細(xì)胞白血病治療的臨床益處。將進(jìn)行GvHD預(yù)防的患者設(shè)為試驗(yàn)組,對(duì)照組由未進(jìn)行GvHD預(yù)防的患者組成,根據(jù)患者的風(fēng)險(xiǎn)情況將兩組患者進(jìn)行兩兩配對(duì),對(duì)于任一患者對(duì)(試驗(yàn)和對(duì)照組患者各一名),若試驗(yàn)組患者先發(fā)生終點(diǎn)事件,則該患者稱為“失敗者(loser)”,反之則這個(gè)試驗(yàn)組患者為“獲勝者(winner)”。所有配對(duì)中獲勝者總數(shù)與失敗者總數(shù)之比即為贏率。若贏率等于1,則認(rèn)為是平局,即兩組療效無差異;大于1時(shí),認(rèn)為試驗(yàn)組獲勝,即試驗(yàn)組療效更好,如贏率等于1.8,其含義是與對(duì)照組相比,試驗(yàn)組的獲勝者多了80%。贏率包括未加權(quán)贏率(unweighted win ratio)和加權(quán)贏率(weighted win ratio),其中未加權(quán)贏率有兩種計(jì)算方法,分別是匹配贏率法(matched win ratio)和不匹配贏率法(unmatched win ratio)。同時(shí)也應(yīng)用傳統(tǒng)HR的方法,與上述贏率的方法結(jié)果進(jìn)行對(duì)比分析。
(1)匹配贏率
匹配贏率法考慮到患者個(gè)體風(fēng)險(xiǎn),根據(jù)試驗(yàn)組和對(duì)照組患者的風(fēng)險(xiǎn)值進(jìn)行匹配。這里風(fēng)險(xiǎn)值的計(jì)算基于Cox比例風(fēng)險(xiǎn)模型h(t|X)=h0(t)exp(β1X1+β2X2+…+βkXk),其中h(t|X)是具有協(xié)變量X的個(gè)體在t時(shí)刻的風(fēng)險(xiǎn)函數(shù),t為生存時(shí)間,X=(X1,X2,…,Xk)′是可能影響生存時(shí)間的有關(guān)因素,也稱協(xié)變量。h0(t)是基線風(fēng)險(xiǎn)函數(shù),β=(β1,β2,…,βk)′為模型的回歸系數(shù)。根據(jù)該模型,計(jì)算出每個(gè)患者的個(gè)體風(fēng)險(xiǎn)值(=β1X1+β2X2+…+βkXk)。若兩組患者數(shù)量不等,則首先將樣本量較大的組別的患者隨機(jī)剔除,保證兩組患者數(shù)相同。然后分別對(duì)試驗(yàn)組和對(duì)照組的患者進(jìn)行風(fēng)險(xiǎn)值排序,兩組中排序數(shù)相同的患者兩兩匹配。對(duì)每對(duì)患者首先研究優(yōu)先重要事件(這里是患者死亡),主要觀察誰最先發(fā)生該事件,若該結(jié)果無從得知,則觀察誰先發(fā)生不良事件。圖1說明了在每對(duì)患者中進(jìn)行這種比較所涉及的步驟,可能有以下5種情況:
①試驗(yàn)組患者先死亡;
②對(duì)照組患者先死亡;
③試驗(yàn)組患者先發(fā)生不良事件;
④對(duì)照組患者先發(fā)生不良事件;
⑤以上情況均未出現(xiàn)。
圖1 試驗(yàn)組和對(duì)照組患者的比較
上述5種情況的對(duì)子數(shù)分別定義為N1、N2、N3、N4和N5,則試驗(yàn)組的“獲勝者”數(shù)量Nw為Nw=N2+N4,“失敗者”的數(shù)量Nl為Nl=N1+N3。所以,贏率RW定義為
此時(shí),試驗(yàn)組“獲勝者”所占的比率PW為
該比率PW的95%可信區(qū)間是
所以贏率的95%可信區(qū)間是
兩組比較時(shí),對(duì)于原假設(shè)H0:RW=1(試驗(yàn)組與對(duì)照組不存在差異),檢驗(yàn)統(tǒng)計(jì)量Z服從漸近正態(tài)分布。
(2)不匹配贏率
(3)加權(quán)贏率
設(shè)TH和TD是表示發(fā)生不良事件和死亡時(shí)間的兩個(gè)隨機(jī)變量,TC代表刪失的時(shí)間。Y1=TH^TD^TC和Y2=TD^TC(^表示求最小值)。δ1和δ2分別為Y1和Y2的指示變量,如分別觀察到不良事件或死亡,則對(duì)應(yīng)δ1=1或δ2=1;否則,分別為δ1=0或δ2=0。觀測(cè)數(shù)據(jù)(Y1i,Y2i,δ1i,δ2i,Mi),i=1,2…n,是(Y1,Y2,δ1,δ2,M)的獨(dú)立同分布樣本,其中M=1代表試驗(yàn)組,M=0代表對(duì)照組;y1,y2分別是該分布上Y1,Y2對(duì)應(yīng)點(diǎn)的期望值。
對(duì)于某一患者對(duì),假設(shè)患者j來自對(duì)照組,患者i來自試驗(yàn)組。定義W2ij=δ2jI(Y2i≥Y2j)以及W1ij=δ1jI(Y1i≥Y1j)分別表示患者i在死亡事件和發(fā)生不良事件上“獲勝”,L2ij=δ2iI(Y2j≥Y2i)以及L1ij=δ1iI(Y1j≥Y1i)則為“失敗”的情況,因此“平局”分別為Ω2ij=(1-W2ij)(1-L2ij)以及Ω1ij=(1-W1ij)(1-L1ij)。表1給出了該指標(biāo)變量組合的9種情況。其中,情況W2ijW1ij、W2ijΩ1ij、W2ijL1ij以及Ω2ijW1ij屬于“獲勝”,Ω2ijΩ1ij屬于平局,其余為“失敗”。
表1 輸贏指標(biāo)變量圖
設(shè)G2(·)和G1(·)分別是死亡與不良事件的加權(quán)函數(shù),該加權(quán)函數(shù)可根據(jù)研究者的需要定義,通常取
則圖1中①②③④的加權(quán)數(shù)分別為
所以,加權(quán)贏差(weightedwin difference)WD[12]為
WD(G1,G2)={W2(G2)+W1(G1)}-{L2(G2)+
然后,加權(quán)贏率為
假設(shè)(TH,TD)的聯(lián)合分布是連續(xù)的,λDk(y2)=pr(TD=y2|TD≥y2,M=k)為第k組的TD的風(fēng)險(xiǎn)函數(shù),λHk(y2|y2)=pr(TH=y1|TH≥y1,TD≥y2,M=k)為第k組TH的條件風(fēng)險(xiǎn)函數(shù),λCk(y2)=pr(TC=y2|TC≥y2,M=k)為第k組TC的風(fēng)險(xiǎn)函數(shù),其中k=0,1。定義λCT(y2)=λC0(y2)+λC1(y2)為刪失的總風(fēng)險(xiǎn)函數(shù)。統(tǒng)計(jì)量WD(G1,G2)可用于檢驗(yàn)原假設(shè)H0:WR(G1,G2)=1。這里原假設(shè)可分為兩小部分H0=H01∩H02
H01:對(duì)于所有的y2,λD1(y2)=λD0(y2),
H02:對(duì)于所有的y1≤y2,λH1(y1|y2)=λH0(y1|y2)。
在納入研究的2279例急性淋巴細(xì)胞白血病患者中,1496例患者在移植后發(fā)生復(fù)合終點(diǎn)事件,這其中有838例患者死亡。發(fā)生死亡事件的患者中位生存時(shí)間為3.64年,刪失率約為63.2%;而發(fā)生復(fù)合終點(diǎn)事件的患者中位生存時(shí)間為0.14年,刪失率約為34.4%。結(jié)合各變量的生存曲線圖(圖2)可發(fā)現(xiàn),對(duì)于死亡事件(圖2左側(cè)),患者的累積生存率的下降相對(duì)較平緩;而對(duì)于復(fù)合終點(diǎn)事件(圖2右側(cè)),患者的累積生存率在隨訪開始階段急劇下降,且最終都已小于50%。因?yàn)橄噍^于死亡事件,患者不良事件的發(fā)生一般在隨訪前期。
對(duì)于GvHD預(yù)防變量進(jìn)行l(wèi)og-rank檢驗(yàn),死亡事件(圖2E)下顯示未進(jìn)行GvHD預(yù)防的患者生存率較高(χ2=11.8,P<0.001),而復(fù)合終點(diǎn)(圖2F)給出相反的結(jié)論(χ2=4.6,P=0.03)。為探究該現(xiàn)象的原因,對(duì)GvHD預(yù)防進(jìn)行臨床益處的評(píng)估,見表2。對(duì)于匹配贏率法,在549對(duì)匹配患者對(duì)中,“獲勝者”為未預(yù)防組的患者先死亡106對(duì)或者先發(fā)生不良事件100對(duì),“失敗者”則為預(yù)防組的患者先死亡211對(duì)或者先發(fā)生不良事件56對(duì),共473對(duì)(86.16%)患者發(fā)生復(fù)合終點(diǎn)事件,這反映進(jìn)行GvHD預(yù)防的患者可能有相對(duì)較差的預(yù)后。相應(yīng)的贏率值為0.772(Z=2.829,P=0.002),這表示接受GvHD預(yù)防的患者的預(yù)后情況不如未接受GvHD預(yù)防的患者。不匹配贏率法比較每位接受GvHD預(yù)防與未接受GvHD預(yù)防的患者,所以共有1730×549 = 949770個(gè)患者對(duì),其中825108對(duì)(86.87%)患者發(fā)生復(fù)合終點(diǎn)事件,復(fù)合終點(diǎn)的不匹配贏率為0.938(Z=0.994,P=0.320),雖小于1,但無統(tǒng)計(jì)學(xué)意義(Z=0.994,P=0.320),95%置信區(qū)間也包含1。加權(quán)贏率法通過對(duì)圖1中①~④四種情況的患者數(shù)進(jìn)行加權(quán),所得數(shù)量均比未匹配贏率法大,其復(fù)合終點(diǎn)的贏率為0.792,有統(tǒng)計(jì)學(xué)意義(Z=3.390,P<0.001),且P值較前兩種贏率更小,即更有把握認(rèn)為GvHD預(yù)防是有害因素。對(duì)于風(fēng)險(xiǎn)比指標(biāo),當(dāng)僅對(duì)死亡事件分析時(shí),HR大于1(Z=11.710,P<0.001)表示GvHD預(yù)防是危險(xiǎn)因素;而復(fù)合終點(diǎn)的HR小于1(Z=4.550,P=0.033),表明GvHD預(yù)防是保護(hù)因素。因不良事件往往先發(fā)生,所以GvHD預(yù)防對(duì)死亡率的影響會(huì)在復(fù)合終點(diǎn)的分析中部分喪失。
圖2 各變量生存曲線圖
匹配贏率不匹配贏率加權(quán)贏率HR?HR?①預(yù)防組先死亡211317970416261.78/ /②未預(yù)防組先死亡106246454320357.62/ /③預(yù)防組先發(fā)生嚴(yán)重不良事件5610776236596.18//④未預(yù)防組先發(fā)生嚴(yán)重不良事件10015292238073.29//⑤以上均不是76124662///總對(duì)數(shù)549949770///點(diǎn)估計(jì)0.7720.9380.7921.3000.87895% CI(0.642,0.924)(0.827,1.064)(0.667,0.939)(1.118,1.51)(0.779,0.990)統(tǒng)計(jì)量Z2.8290.9943.390 11.7104.550P值0.0020.320<0.001<0.0010.033
?:死亡事件的風(fēng)險(xiǎn)比;*:復(fù)合事件的風(fēng)險(xiǎn)比。
隨機(jī)對(duì)照臨床試驗(yàn)是目前測(cè)試治療策略是否會(huì)改變特定結(jié)局事件的金標(biāo)準(zhǔn)。為了測(cè)試這一假設(shè),研究人員需要建立一個(gè)詳細(xì)的統(tǒng)計(jì)分析計(jì)劃,以測(cè)定兩種(或更多)治療策略之間觀察到的差異是否歸因于偶然性[13]。當(dāng)主要終點(diǎn)是死亡,而且問題的關(guān)注點(diǎn)在于干預(yù)是否改變了患者的生存時(shí)間時(shí),傳統(tǒng)的統(tǒng)計(jì)框架提供了一個(gè)較好的處理方式。但除非目標(biāo)人群限于那些預(yù)后極差的患者,否則主要終點(diǎn)為死亡的試驗(yàn)很少進(jìn)行。一個(gè)設(shè)計(jì)良好的臨床試驗(yàn)前瞻性地將復(fù)合終點(diǎn)植入其主要分析計(jì)劃中,以便觀測(cè)到干預(yù)措施極小的影響。然而在隨機(jī)試驗(yàn)中,復(fù)合終點(diǎn)的廣泛使用引發(fā)了關(guān)于其適用性和結(jié)果解釋的爭(zhēng)議[14~16]。
本文共介紹了3種贏率法,當(dāng)兩組患者數(shù)量均衡時(shí),匹配贏率法考慮患者自身的風(fēng)險(xiǎn)因素,能較好的估計(jì)干預(yù)因素對(duì)復(fù)合終點(diǎn)的作用,但是若兩組患者的數(shù)量相差較大,會(huì)導(dǎo)致一大部分的患者被剔除,喪失生存信息,不匹配贏率法以及加權(quán)贏率法能彌補(bǔ)這一缺點(diǎn)。當(dāng)樣本量很大時(shí),不匹配贏率法可信區(qū)間的估計(jì)較為費(fèi)時(shí),加權(quán)贏率法能較快的給出結(jié)果。
結(jié)合本文實(shí)例分析結(jié)果,復(fù)合終點(diǎn)的3種贏率均小于1,顯示GvHD預(yù)防是危害因素(雖不匹配贏率法無統(tǒng)計(jì)學(xué)意義),這是因?yàn)镚vHD預(yù)防通常是采用去除T細(xì)胞(TCD)的方法,該法雖可減輕GvHD,但卻減弱了移植物的抗白血病作用,可增加感染和死亡率。當(dāng)采用贏率法進(jìn)行分析時(shí),該法給予死亡事件更大的優(yōu)先級(jí),因此“GvHD預(yù)防增加死亡率”這一弊端被展現(xiàn)出來。而傳統(tǒng)方法分析的HR將復(fù)合終點(diǎn)中的組分事件予以相同的重要性,但不良事件往往發(fā)生于死亡事件之前,因此死亡事件往往被忽略,這就導(dǎo)致復(fù)合終點(diǎn)的HR=0.878(Z=4.550,P=0.033),給出GvHD預(yù)防是保護(hù)因素的錯(cuò)誤結(jié)論。因此,建議在非致命事件較常見的臨床研究中,當(dāng)組分事件之間的優(yōu)先級(jí)很重要時(shí),使用加權(quán)贏率法來進(jìn)行分析,而不是采用風(fēng)險(xiǎn)比的方法。