宋佳麗 孫鳳宇 盧宇紅 王 策 王 萌 李 康 侯 艷△
【提 要】 目的 本文介紹一種新的處理臨床試驗轉(zhuǎn)組數(shù)據(jù)的統(tǒng)計學(xué)方法——校正迭代參數(shù)法(MIPE),并通過模擬試驗在不同情形下比較MIPE、IPE、意向性分析(ITT)三種方法對治療效果估計的準(zhǔn)確性。方法 通過模擬數(shù)據(jù)探討不同的治療效應(yīng)真值、潛在預(yù)后、轉(zhuǎn)組率等24個假設(shè)場景中試驗藥療效估計值的差異,并將MIPE、IPE、ITT方法應(yīng)用于每個場景下進行效果比較。結(jié)果 當(dāng)試驗藥與安慰劑組療效存在差異時,ITT和IPE方法得出的治療效應(yīng)估計均有偏,這種有偏估計與不同的治療效應(yīng)真值、潛在預(yù)后和轉(zhuǎn)組率等因素相關(guān),而MIPE方法不受上述因素影響,估計結(jié)果較為準(zhǔn)確且穩(wěn)定。結(jié)論 MIPE方法不受實際治療效應(yīng)、潛在預(yù)后、轉(zhuǎn)組率等因素的影響,在各場景中治療效應(yīng)估計值的均值較為穩(wěn)定,與其他方法相比,更接近真實值,在臨床試驗評價中使用更為可靠。
在腫瘤安慰劑對照設(shè)計臨床試驗中,當(dāng)被分配到安慰劑組的受試者疾病進展時,讓其仍然接受無效措施顯然不符合倫理,因此有研究者提出這種情況下應(yīng)該允許受試者轉(zhuǎn)到試驗組接受治療[1-2]。這種策略不僅僅讓研究更符合倫理,而且降低了試驗過程中的脫落率,充分利用已經(jīng)入組的受試者信息。例如,在舒尼替尼治療伊馬替尼失敗的晚期胃腸道間質(zhì)瘤患者的安全性和有效性臨床試驗研究中,當(dāng)接受安慰劑的病人疾病進展時,若滿足合格標(biāo)準(zhǔn),可以轉(zhuǎn)組到開放標(biāo)簽的舒尼替尼治療組[3]。但帶來的問題是使用傳統(tǒng)方法對這種存在轉(zhuǎn)組情況的研究療效進行估計時,可能會存在偏倚。例如按照意向性分析原則(intention-to-treat,ITT)會將轉(zhuǎn)組者計入對照組,可能會影響對照組療效的估計值,從而影響兩組療效的評價[4];如果按照符合方案原則(per-protocol,PP)則會剔除轉(zhuǎn)組的受試者,這樣可能會破壞隨機化,造成兩組間基線情況不均衡,使得兩組療效的可比性差。因此,急需準(zhǔn)確估計具有轉(zhuǎn)組情況的臨床試驗療效估計方法。
由于腫瘤療效評價指標(biāo)常與總生存期、無進展生存期等時間變量密切相關(guān),所以,目前針對轉(zhuǎn)組問題進行臨床試驗療效估計的方法主要圍繞在生存數(shù)據(jù)方面[5]。例如英國國家健康與臨床評價研究所(national institute for health and clinical excellence,NICE)認(rèn)可的等級結(jié)構(gòu)保留失效時間算法(rank-persevering structural failure time,RPSFT)[6],但這種方法的計算速度十分緩慢。而迭代參數(shù)估計算法(iterative parameter estimation,IPE)[7]相較于RPSFT,大大提高了計算的速度,但IPE在估計療效時會產(chǎn)生偏倚[8-9]。因此,我們提出校正IPE方法(modified IPE,MIPE)。本文將通過統(tǒng)計學(xué)模擬試驗探索MIPE方法在各種場景下試驗藥療效的估計值是否準(zhǔn)確。
IPE和MIPE方法通過建立加速失效時間(accelerated failure time,AFT)模型[10]來估計特定處理的真正效應(yīng),因此首先介紹AFT模型的基本概念和結(jié)構(gòu)。
1.AFT模型
在一個隨機、平行、雙盲、安慰劑對照試驗中,某一轉(zhuǎn)組受試者i觀察到的生存時間Ti(observed time)由其在對照組(C)和試驗組(T)中的生存時間組成,即
Ti=TCi+TTi
(1)
假設(shè)該受試者i一直在對照組中并未轉(zhuǎn)組接受試驗藥物,其相應(yīng)的生存時間稱為反事實生存時間(counterfactual event time)Ui,表示為
Ui=TCi+eβTTi
(2)
其中e-β代表加速因子,表示受試者接受試驗藥治療的生存時間是接受對照藥治療的e-β倍。若e-β>1,則相較于對照組,試驗藥使受試者生命延長,其療效優(yōu)于對照藥;若e-β<1,則表示試驗藥縮短了受試者的生命,其療效劣于對照藥;若e-β=1,則兩種藥物的效果并無差異。
將等式(1)代入等式(2)可得
Ui=TCi+eβ(Ti-TCi)
(3)
由于轉(zhuǎn)組患者i在對照組的生存時間TCi即為轉(zhuǎn)組時間(switching time)Yi,則算式(3)可表達為
Ui=Yi+eβ(Ti-Yi)
(4)
整理等式(4)得到下式
Ti=Yi+e-β(Ui-Yi)
(5)
(6)
2.MIPE方法原理和步驟
MIPE通過ITT原則分析獲得β初始值,根據(jù)初始的β值計算對照組轉(zhuǎn)組患者的反事實生存時間,再將計算得到的對照組的反事實生存時間和試驗組的實際生存時間進行比較,更新β值,如此反復(fù)迭代,直到兩次迭代獲得的參數(shù)之差小于10-4,此時得到的參數(shù)即為所求。IPE方法通過公式(4)和公式(6)計算得到的反事實生存時間和反事實刪失時間都和轉(zhuǎn)組時間相關(guān),這種非隨機刪失可能使得療效估計值偏離真值。因此,MIPE方法參考RPSFT中的校正思想[6],對IPE校正再刪失規(guī)則進行改進,使得反事實刪失時間與轉(zhuǎn)組時間無關(guān),避免了IPE方法中可能產(chǎn)生的偏倚。具體規(guī)則如下:
(7)
整理后可得
(8)
(9)
MIPE方法應(yīng)用步驟如下,設(shè)第k次迭代估計獲得參數(shù)βk。
(3)根據(jù)步驟(2)估計模型參數(shù)βk+1;
(4)當(dāng)|βk+1-βk|<10-4時達到收斂,此時的βk+1即為β的點估計;否則,k=k+1,從步驟(1)起重復(fù)上述循環(huán)。
臨床試驗過程中受試者轉(zhuǎn)組與疾病潛在預(yù)后的關(guān)系十分密切,所以本模擬試驗主要考慮不同的潛在預(yù)后結(jié)局比例,即在一批治療患者中預(yù)后好的病人所占比例不同的場景;不同潛在預(yù)后結(jié)局下的不同轉(zhuǎn)組發(fā)生率;相同潛在預(yù)后結(jié)局對生存的不同影響,例如對于不同的疾病,預(yù)后好的病人比預(yù)后差的病人延長的生存時間會不相同;試驗藥物不同的實際治療效果等情況,共模擬24種不同的場景組合。模擬的生存數(shù)據(jù)服從Weibull分布,故采用Weibull參數(shù)回歸模型,應(yīng)用MIPE、IPE、ITT三種方法估計治療效應(yīng),并通過計算各個場景組合下的均值、95%置信區(qū)間,以及重抽樣方法獲得的區(qū)間覆蓋率來對三種方法進行評估。模擬數(shù)據(jù)產(chǎn)生和數(shù)據(jù)分析過程利用SAS 9.4和R 3.6.1軟件。本部分主要介紹模擬試驗設(shè)計下各名詞的含義以及條件設(shè)定。
1.初始反事實生存時間
初始反事實生存時間u是指模擬試驗最開始生成的、不受預(yù)后影響的反事實生存時間。初始反事實生存時間服從Weibull分布[11],其形狀參數(shù)γ設(shè)置為0.5;比例參數(shù)λ設(shè)置為1.33。利用這些參數(shù)生成的u的中位生存時間約為0.639年;病人死亡率隨時間降低;未接受治療的患者90%在隨訪3年內(nèi)死亡。
2.入組和出組時間
利用均勻分布函數(shù)產(chǎn)生0~1間的隨機數(shù),假設(shè)病人在試驗開始1年內(nèi)的任意時間均可入組;設(shè)定試驗周期為3年,則根據(jù)不同的入組時間,每名患者的服藥刪失時間Ci為2~3年不等。
3.病人潛在預(yù)后
根據(jù)實際情況,相比于預(yù)后差的病人,預(yù)后好的病人的反事實生存時間Ui更長,因此產(chǎn)生模擬數(shù)據(jù)時,將數(shù)據(jù)分成預(yù)后好和預(yù)后差兩組,病人預(yù)后好的概率分別設(shè)定為0.3或0.75。預(yù)后好的病人的反事實生存時間相應(yīng)延長,可用初始反事實生存時間u乘以膨脹因子,膨脹因子分別設(shè)為1.2或3,由此模擬合出預(yù)后好和差的病人不同程度的生存差異。同時,生成模擬數(shù)據(jù)時應(yīng)該保證試驗組和對照組中預(yù)后好和差者的比例均衡。
4.轉(zhuǎn)組率和轉(zhuǎn)組時間
如前文所述,預(yù)后差的病人在對照組中治療效果差,更容易轉(zhuǎn)至試驗組以尋求好的治療。因此,根據(jù)病人潛在預(yù)后情況設(shè)定其不同的轉(zhuǎn)組率,預(yù)后好和預(yù)后差的患者的轉(zhuǎn)組率分別設(shè)為:低轉(zhuǎn)組率(0.1和0.25)和高轉(zhuǎn)組率(0.5和0.75)。
假設(shè)病人轉(zhuǎn)組時間服從Beta(a,b)分布,則轉(zhuǎn)組時間Yi=反事實生存時間Ui×Beta(a,b),將分布參數(shù)設(shè)置為Beta(1,2)可以使轉(zhuǎn)組者平均在其1/3Ui左右時轉(zhuǎn)組,符合很多腫瘤試驗發(fā)生疾病進展的情況[3,12]。
5.實際生存時間和刪失情況
對照組轉(zhuǎn)組和隨機分配至試驗組的受試者的實際生存時間Ti均在反事實生存時間Ui的基礎(chǔ)上進行計算。試驗組受試者的Ti=Ui×e-β;轉(zhuǎn)組受試者Ti則通過公式(5)計算。如果病人在試驗截止時仍存活,則設(shè)定病人生存結(jié)局為刪失。
6.治療效應(yīng)真值
實際治療效應(yīng)分別考慮治療有益、無益和無作用三種情況。當(dāng)治療有益時,常見試驗藥治療效果是對照藥的2倍左右,故取β=-0.8;若治療無益,假設(shè)服用試驗藥的生存時間是對照藥的一半,取β=0.8;如果試驗組和對照組患者生存時間相同,則說明治療無作用,β=0。
7.樣本量和重復(fù)
樣本量為500,按1∶1隨機分配到試驗組和對照組各250人,本文并不探討不同樣本量對方法的影響,因此充足的樣本量可以保證模型的穩(wěn)健性,從而僅探討上述影響因素對模型估計結(jié)果的影響。
根據(jù)影響因素不同水平的組合,共模擬24種不同場景,每種場景重復(fù)1000次。影響因素設(shè)置情況及其對應(yīng)的實際意義見表1,各影響因素組合情況見表2。
表1 影響因素總結(jié)
表2 各影響因素組合情況
1.試驗藥物效果優(yōu)于對照組情況(β=-0.8)
模擬試驗結(jié)果發(fā)現(xiàn)當(dāng)試驗組病人生存時間約是對照組2倍時,ITT方法低估了試驗組藥物真正治療效果。這種低估現(xiàn)象和轉(zhuǎn)組率、人群中潛在預(yù)后效果好的病人比例及預(yù)后好者相較于預(yù)后差者增加的反事實生存時間程度有關(guān)(圖1)。轉(zhuǎn)組率越高,低估情況越明顯,此因素對療效估計的影響最大;人群中預(yù)后好的病人比例越低,這種低估情況越嚴(yán)重;預(yù)后好病人相較于預(yù)后差的病人提高反事實生存時間程度越大,對預(yù)測治療效應(yīng)的影響越大。對于IPE方法,也同樣受上述3個因素的影響。而MIPE方法幾乎不受上述因素的影響,在各種場景中估計結(jié)果較為準(zhǔn)確且穩(wěn)定。
圖1 β=-0.8時估計值的均值及其95%置信區(qū)間
2.試驗組和對照組治療效應(yīng)無差異(β=0)
試驗組和對照組治療效應(yīng)無差異時,按照ITT分析并不會高估或低估對照組療效,因而對試驗組療效的估計準(zhǔn)確。從圖2可以看到,使用ITT估計的治療效應(yīng)均在0附近,優(yōu)于MIPE和IPE方法,從側(cè)面反映了本模擬的合理性。
圖2 β=0時估計值的均值及其置信區(qū)間
3.試驗藥物效果差于對照組情況(β=0.8)
當(dāng)對照組病人生存時間是試驗組的2倍左右時,ITT和IPE均高估試驗藥物療效,即低估了試驗藥物縮短患者生存時間的作用,而MIPE則一直穩(wěn)定在真值附近。
我們同時計算了每種場景下,各個方法的區(qū)間覆蓋率,區(qū)間覆蓋率為利用重抽樣方法求得的95%置信區(qū)間包含真值的比例。區(qū)間覆蓋率應(yīng)約等于95%,表示95%左右的置信區(qū)間包含真值。各場景區(qū)間覆蓋率值見表3,MIPE的覆蓋率值在94.3%~96.1%之間,表明該方法的準(zhǔn)確性和穩(wěn)健性。
表3 各因素組合場景下區(qū)間覆蓋率(%)
圖3 β=0.8時估計值的均值及其置信區(qū)間
目前常用的RPSFT方法同時計算試驗組和對照組受試者的反事實生存時間,并通過網(wǎng)格搜索來估計模型參數(shù),計算速度十分緩慢;IPE方法僅計算對照組中轉(zhuǎn)組患者的反事實生存時間,并使用迭代算法估計參數(shù),可以大大提高計算的速度。但是,其計算的反事實生存時間和反事實刪失時間都與轉(zhuǎn)組時間密切相關(guān),這不屬于隨機刪失,因此該方法在估計療效時會產(chǎn)生偏倚;本文提出的MIPE方法在IPE方法的基礎(chǔ)上對其反事實刪失時間的計算進行了改進,使得反事實刪失時間與轉(zhuǎn)組時間無關(guān),可以有效避免偏倚的產(chǎn)生。
由于MIPE對于IPE進行了部分改進,因此對于可以使用IPE方法進行分析的臨床實例,MIPE方法同樣適用。如Branson等人使用IPE方法分析一項非小細(xì)胞肺癌隨機臨床試驗,比較不能手術(shù)的非小細(xì)胞肺癌患者立即放療和延遲放療的臨床益處[7],以及干預(yù)性研究[13]、Concorde臨床試驗研究[8]、成本效果分析[14]等。并且使用MIPE方法進行分析時,并不需要考慮潛在預(yù)后結(jié)局、轉(zhuǎn)組率等因素,因為該方法在各種情況下得到的分析結(jié)果均穩(wěn)定。
MIPE方法不僅可以用于腫瘤安慰劑對照設(shè)計臨床試驗轉(zhuǎn)組情況,也適用于其他疾病的安慰劑對照臨床試驗設(shè)計或統(tǒng)一接受標(biāo)準(zhǔn)治療的加載試驗設(shè)計發(fā)生轉(zhuǎn)組情況時。不過,需要注意的是,當(dāng)受試者轉(zhuǎn)用其他非試驗藥物或由對照組轉(zhuǎn)至試驗組的患者療效與初始隨機化分配至對照組患者的療效不同時,MIPE方法則并不適用。
本文中模擬試驗僅探究了潛在真實治療效應(yīng)、預(yù)后結(jié)局和轉(zhuǎn)組率等因素對試驗藥療效估計值的影響,仍然有很多因素未考慮,如患者的反事實生存時間不服從Weibull分布;潛在預(yù)后好和預(yù)后差患者轉(zhuǎn)組率差異很大等。未來將繼續(xù)尋找可能影響治療效應(yīng)估計的其他因素,使得模擬場景更貼近實際,探索MIPE方法穩(wěn)健性。
通過模擬試驗結(jié)果可以看出,當(dāng)試驗藥和對照藥療效存在差異時,ITT和IPE方法估計的治療效應(yīng)均有偏,這種有偏估計與不同的潛在預(yù)后結(jié)局比例、潛在預(yù)后對生存的影響、轉(zhuǎn)組率、真實治療效應(yīng)等因素相關(guān),而MIPE方法不受這些因素的影響,在各場景中對療效的估計均穩(wěn)定在真值附近,由于實際臨床試驗過程中,并不清楚人群的具體情況,故MIPE更適合在臨床實際過程中使用。