秦 飛 柏建嶺△ 陳夢(mèng)鍇 陳 峰,2 魏永越 趙 楊,2 蔡晶晶 劉 晉 于 浩△
【提 要】 目的 探討臨床試驗(yàn)中序貫安慰劑平行對(duì)照設(shè)計(jì)和雙向富集設(shè)計(jì)的樣本量計(jì)算方法。方法 在不同參數(shù)設(shè)置條件下,計(jì)算序貫安慰劑平行對(duì)照設(shè)計(jì)和雙向富集設(shè)計(jì)所需要的樣本量,并與傳統(tǒng)的平行組設(shè)計(jì)、交叉設(shè)計(jì)等進(jìn)行比較。結(jié)果 序貫安慰劑平行對(duì)照設(shè)計(jì)和雙向富集設(shè)計(jì)相比于傳統(tǒng)的平行組設(shè)計(jì)、交叉設(shè)計(jì)需要的樣本量更少,其中,雙向富集設(shè)計(jì)的優(yōu)勢(shì)更為明顯。對(duì)于連續(xù)性結(jié)局變量,第二階段的療效越大,第一階段的權(quán)重越小,需要的樣本量越小。對(duì)于二分類(lèi)結(jié)局變量,得分檢驗(yàn)參數(shù)取9.8和6.2時(shí),SPCD和TED分別需要的樣本量最少。假定兩階段療效相同時(shí),第一階段分配到安慰劑組的比例取0.57和0.50時(shí),SPCD和TED需要的樣本量最少。結(jié)論 在安慰劑效應(yīng)較高或是沒(méi)有徹底治愈方案的慢性疾病試驗(yàn)中,序貫安慰劑平行對(duì)照設(shè)計(jì)和雙向富集設(shè)計(jì)相比于傳統(tǒng)設(shè)計(jì)有很大的優(yōu)勢(shì)。
在精神類(lèi)藥物的臨床試驗(yàn)中,一個(gè)很普遍的問(wèn)題就是高安慰劑效應(yīng)[1-2]。為解決這一問(wèn)題,有人提出在試驗(yàn)中加入了一個(gè)安慰劑導(dǎo)入期(run-in phase),導(dǎo)入期內(nèi)所有受試者均接受安慰劑的治療。然后將安慰劑無(wú)效者進(jìn)行隨機(jī)分組,分別接受試驗(yàn)藥和安慰劑,從而有效地排除了安慰劑效應(yīng)。然而,Trivedi等人[3]在meta分析中綜合了101項(xiàng)研究結(jié)果之后得出結(jié)論,并沒(méi)有直接證據(jù)表明安慰劑導(dǎo)入期有助于檢驗(yàn)試驗(yàn)藥的療效??紤]原因是研究者和受試者在該類(lèi)試驗(yàn)中很難再維持盲態(tài),從而對(duì)研究結(jié)果產(chǎn)生了很大的干擾。后續(xù)也有人提出了隨機(jī)撤藥試驗(yàn)(randomized withdrawal design)的概念[4],試驗(yàn)初,所有受試者都接受試驗(yàn)藥的治療,從而把對(duì)試驗(yàn)藥易感的群體提前篩選出來(lái)。當(dāng)單純使用安慰劑對(duì)照試驗(yàn)存在倫理問(wèn)題時(shí),使用隨機(jī)撤藥試驗(yàn)更容易被接受。但其估計(jì)的療效一般是有偏的,由于滯后效應(yīng)的存在可能會(huì)高估第二階段安慰劑的效應(yīng),同時(shí)隨機(jī)分組的群體只是全部受試者的一個(gè)子集,因而缺乏代表性[5]。
考慮到以上兩種方法的弊端,序貫安慰劑平行對(duì)照設(shè)計(jì)(sequential parallel comparison design,SPCD)在2003年被正式提出[1]。SPCD在第一階段對(duì)所有受試者都會(huì)進(jìn)行隨機(jī)分組,只有安慰劑無(wú)應(yīng)答者會(huì)進(jìn)入第二階段,再次進(jìn)行隨機(jī)分組。后來(lái)又有人在此基礎(chǔ)上提出了雙向富集設(shè)計(jì)(two-way enriched design,TED)[6],不同于前者,第一階段中的試驗(yàn)組有效者也會(huì)進(jìn)入第二階段,并進(jìn)行隨機(jī)分組。在這兩種設(shè)計(jì)中,我們會(huì)綜合第一階段和第二階段的療效差值,并結(jié)合權(quán)重進(jìn)行評(píng)價(jià),從而得出更為可靠的結(jié)論。
目前,針對(duì)序貫安慰劑平行對(duì)照設(shè)計(jì)和雙向富集設(shè)計(jì)中樣本量估計(jì)問(wèn)題的探討還很有限,因而本文的主要目的就是將這兩種設(shè)計(jì)與我們臨床試驗(yàn)中傳統(tǒng)的幾種設(shè)計(jì)在樣本量估計(jì)方面進(jìn)行比較,為今后臨床試驗(yàn)設(shè)定樣本量提供參考意見(jiàn)。
篩選合格的受試者在第一階段隨機(jī)分成試驗(yàn)藥組和安慰劑組,安慰劑組占總受試者的比例會(huì)事先確定。第一階段的安慰劑無(wú)應(yīng)答者進(jìn)入第二階段,并再次隨機(jī)分為試驗(yàn)藥組和安慰劑組(圖1)。實(shí)際試驗(yàn)中,為了維持盲態(tài),第一階段安慰劑有效組和試驗(yàn)藥組還是會(huì)進(jìn)入第二階段,分別服用安慰劑和試驗(yàn)藥,其結(jié)果不會(huì)納入最終分析。計(jì)算藥物療效時(shí)會(huì)拿第一階段的療效加權(quán)第一階段安慰劑無(wú)效者在第二階段的表現(xiàn),綜合分析得出結(jié)論。
圖1 序貫安慰劑平行對(duì)照設(shè)計(jì)流程圖
2.雙向富集設(shè)計(jì)概述
不同于序貫安慰劑平行對(duì)照設(shè)計(jì),雙向富集設(shè)計(jì)會(huì)有兩個(gè)子集進(jìn)入第二階段,第一階段的安慰劑無(wú)效者和試驗(yàn)藥有效者均被隨機(jī)分為試驗(yàn)藥組和安慰劑組(圖2)。此時(shí)再進(jìn)行分析時(shí),就是把三個(gè)亞組的療效加權(quán)進(jìn)行分析。同樣,第一階段安慰劑有效組和第一階段試驗(yàn)藥無(wú)效組還是會(huì)在第二階段進(jìn)行服藥,只是結(jié)果不會(huì)納入最終分析。
圖2 雙向富集設(shè)計(jì)流程圖
依據(jù)最小二乘法,Chen等[7]推導(dǎo)出了SPCD中連續(xù)性結(jié)局變量的樣本量計(jì)算公式,此后,我們?cè)诖嘶A(chǔ)上變換得到了適用于TED和SPCD的樣本量計(jì)算公式,具體為:
式中:b:第一階段分配到安慰劑組的比例(第二階段的分配比例常定為1:1)
θ1:第一階段試驗(yàn)組和安慰劑組的療效差值
θ2:第一階段安慰劑無(wú)效者在第二階段的療效差值
θ3:第一階段試驗(yàn)組有效者在第二階段的療效差值
1-q1:第一階段安慰劑組無(wú)效者的比例
p1:第一階段試驗(yàn)組有效者的比例(只針對(duì)TED)
w1:第一階段療效的權(quán)重
w2:第一階段安慰劑無(wú)效者在第二階段療效的權(quán)重
w3:第一階段試驗(yàn)組有效者在第二階段療效的權(quán)重(SPCD:w3=0,w1+w2=1;TED:w1+w2+w3=1)
Ivanova等人[8]在2011年基于得分檢驗(yàn)(score test)的方法推導(dǎo)出了二分類(lèi)結(jié)局變量的樣本量計(jì)算公式,具體為:
n=(z1-β+z1-α/2)2/γ1
η1=(1-b)p1+bq1
η2=0.5p2+0.5q2
η3=0.5p3+0.5q3
式中:b:第一階段分配到安慰劑組的比例(第二階段的分配比例常定為1:1)
p1:第一階段試驗(yàn)組的有效率
q1:第一階段安慰劑組的有效率
p2:第一階段安慰劑無(wú)效者在第二階段試驗(yàn)組的有效率
q2:第一階段安慰劑無(wú)效者在第二階段安慰劑組的有效率
p3:第一階段試驗(yàn)組有效者在第二階段試驗(yàn)組的有效率
q3:第一階段試驗(yàn)組有效者在第二階段安慰劑組的有效率
s2:第一階段中的安慰劑組無(wú)效者完成第二階段試驗(yàn)的比例
s3:第一階段中的試驗(yàn)組有效者完成第二階段試驗(yàn)的比例
r2、r3:得分檢驗(yàn)中的檢驗(yàn)參數(shù),推薦設(shè)定為1,應(yīng)用SPCD時(shí)取r3=0
連續(xù)性結(jié)局變量的樣本量估計(jì)中,考慮到?jīng)]有現(xiàn)有的參數(shù)信息,我們依據(jù)Ivanova等[9]提供的一個(gè)評(píng)價(jià)振動(dòng)性?xún)x器對(duì)緩解疼痛功效的試驗(yàn)來(lái)幫助確定參數(shù)。由于第二階段比第一階段療效低的可能性很小,最終我們?cè)O(shè)定的第一階段試驗(yàn)組和安慰劑組的療效差值θ1=0.87,各階段的方差均為7.37。TED第一階段分配到安慰劑組的比例b設(shè)為0.50,SPCD設(shè)為0.67。 針對(duì)兩階段的療效權(quán)重,我們?nèi)×藘煞N情況,對(duì)于TED設(shè)計(jì),一種是w1=w2=w3=0.33,即三個(gè)亞組權(quán)重相同;另一種是w1=0.5,w2=w3=0.25,保證第二階段的兩個(gè)亞組權(quán)重一致。對(duì)于SPCD設(shè)計(jì),一種是w1=w2=0.5,另一種是w1=0.75,w2=0.25。一類(lèi)錯(cuò)誤和檢驗(yàn)效能分別設(shè)定為0.05和0.8。我們比較了不同參數(shù)設(shè)置下SPCD、TED、傳統(tǒng)的單階段隨機(jī)對(duì)照設(shè)計(jì)和交叉設(shè)計(jì)所需的樣本量。二分類(lèi)結(jié)局變量中,我們根據(jù)一個(gè)隨機(jī)、雙盲、安慰劑對(duì)照的兩階段交叉設(shè)計(jì)試驗(yàn)來(lái)幫助參數(shù)設(shè)置。這是一個(gè)用來(lái)評(píng)價(jià)高頻刺激止痛效果的試驗(yàn)[10],高頻刺激作為試驗(yàn)組。分兩種情況進(jìn)行討論:(1)假定在兩階段療效不相同時(shí),探討得分檢驗(yàn)參數(shù)r2、r3和樣本量之間的關(guān)系,r2、r3是用來(lái)估計(jì)第二階段療效與第一階段療效的比值,一般在一次試驗(yàn)中需要事先確定[8];(2)假定兩階段療效相同時(shí),探討第一階段分配到安慰劑組的比例b與樣本量之間的關(guān)系,此時(shí)r2、r3選擇推薦值,即r2=r3=1。具體參數(shù)設(shè)置見(jiàn)表1。一類(lèi)錯(cuò)誤和檢驗(yàn)效能分別設(shè)定為0.05和0.80。
表1 二分類(lèi)結(jié)局變量樣本量估計(jì)參數(shù)設(shè)置
我們比較了不同參數(shù)設(shè)置條件下SPCD、TED、經(jīng)典的單階段安慰劑隨機(jī)對(duì)照設(shè)計(jì)、安慰劑導(dǎo)入期設(shè)計(jì)、隨機(jī)撤藥設(shè)計(jì)和交叉設(shè)計(jì)的樣本量。其中,TED和SPCD又分為最佳參數(shù)設(shè)置和推薦參數(shù)設(shè)置兩種情況,最佳參數(shù)設(shè)置是指依據(jù)估計(jì)的各階段各組有效率來(lái)設(shè)置r2和r3,同時(shí)求出最佳的分配比例b,以達(dá)到樣本量最小。推薦參數(shù)設(shè)置中,SPCD的b取0.67,r2=1,r3=0,TED的b取0.50,r2=r3=1。本次試驗(yàn)中假定數(shù)據(jù)的缺失率為0,故s2=s3=1。本次研究均采用SAS 9.4來(lái)進(jìn)行分析。
當(dāng)結(jié)局變量為連續(xù)性時(shí),在不同參數(shù)條件下需要的樣本量見(jiàn)表2,此外單階段設(shè)計(jì)需要的樣本量為2253,交叉設(shè)計(jì)需要的樣本量為1130。顯然,當(dāng)?shù)诙A段的療效優(yōu)勢(shì)越明顯,SPCD和TED需要的樣本量就越少。相同參數(shù)條件下,TED相比于SPCD需要的樣本量更少,但兩者均顯著優(yōu)于單階段設(shè)計(jì)和交叉設(shè)計(jì)。第一階段療效的權(quán)重設(shè)置的越大,總體療效越差,因而需要的樣本量越大。此外,第一階段安慰劑組無(wú)效者和試驗(yàn)組有效者的比例越大,相當(dāng)于有更多的受試者進(jìn)入了第二階段,最終需要的樣本量更少。
二分類(lèi)變量樣本量和r2、b的關(guān)系可見(jiàn)圖3。圖3(a)是假定兩階段療效(試驗(yàn)組有效率-安慰劑組有效率)不同時(shí)樣本量與r2的關(guān)系,可見(jiàn)隨著r2的增加,SPCD和TED的樣本量急劇下降,SPCD中,當(dāng)r2到達(dá)9.8時(shí),樣本量變化趨于穩(wěn)定,并在此后緩慢升高。TED中,當(dāng)r2到達(dá)6.2時(shí),樣本量趨于穩(wěn)定,并在此后緩慢回升。總體來(lái)看,TED比SPCD需要的樣本量要多,主要原因應(yīng)該是SPCD分配到安慰劑組的比例更大。圖3(b)是假定兩階段療效相同時(shí)樣本量與第一階段安慰劑組分配比例b的關(guān)系,隨著b的增加,SPCD和TED的樣本量都經(jīng)歷了先下降再升高的過(guò)程,SPCD的最低點(diǎn)位于b=0.57的時(shí)候,TED是當(dāng)b=0.50時(shí)需要的樣本量最小。總體來(lái)看,TED比SPCD需要的樣本量少。
表2 連續(xù)型結(jié)局變量?jī)煞N設(shè)計(jì)的樣本量估計(jì)
此外,表3還列出各種參數(shù)設(shè)定條件下常見(jiàn)幾種設(shè)計(jì)需要的樣本量??梢?jiàn),交叉設(shè)計(jì)優(yōu)勢(shì)最明顯,只有在p1=0.50,q1=0.40,p2=0.50,q2=0.40,p3=0.50,q3=0.30時(shí),需要的樣本量略多于雙向富集設(shè)計(jì)和隨機(jī)撤藥設(shè)計(jì)。當(dāng)安慰劑無(wú)效組的療效有限時(shí),安慰劑導(dǎo)入設(shè)計(jì)需要的樣本量較大。當(dāng)試驗(yàn)藥有效組的療效有限時(shí),隨機(jī)撤藥設(shè)計(jì)需要的樣本量較大。SPCD需要的樣本量要略大于TED設(shè)計(jì)。單階段安慰劑對(duì)照設(shè)計(jì)的樣本量主要取決于第一階段的療效,療效越大,需要的樣本量越小,考慮到我們主要針對(duì)的是有高安慰劑效應(yīng)的精神類(lèi)疾病,因而單純用單階段設(shè)計(jì)沒(méi)有優(yōu)勢(shì)。
圖3 二分類(lèi)變量樣本量和r2、b的關(guān)系
p1q1p2q2p3q3TEDSPCD(b,r2,r3)*(b,r2,r3)(b,r2,r3)*(b,r2,r3)One stageRun-inRWithdrCrossover0.500.400.500.400.500.40(0.51,1,1)*501(0.5,1,1)501(0.57,1,0)*589(0.67,1,0)538777129515533920.600.400.500.300.500.40(0.55,1,0.5)*140(0.5,1,1)148(0.57,1,0)*147(0.67,1,0)1521963121295980.600.400.500.200.500.40(0.66,1.5,0.5)*100(0.5,1,1)117(0.68,1.5,0)*103(0.67,1,0)1081961271295980.500.400.500.400.500.30(0.32,1,2)*314(0.5,1,1)367(0.57,1,0)*589(0.67,1,0)60877712953743920.600.400.500.300.500.30(0.5,1,1)*120(0.5,1,1)120(0.57,1,0)*147(0.67,1,0)152196312312980.600.400.500.200.500.30(0.6,1.5,1)*92(0.5,1,1)98(0.68,1.5,0)*103(0.67,1,0)10819612731298
*One stage:經(jīng)典的單階段安慰劑對(duì)照設(shè)計(jì);Crossover :2×2交叉設(shè)計(jì);Run-in:安慰劑導(dǎo)入期;RWithdr:隨機(jī)撤藥設(shè)計(jì);*表示最佳參數(shù)設(shè)置,未加*表示一般推薦的參數(shù)設(shè)定
為了驗(yàn)證我們樣本量計(jì)算公式的可靠性,我們進(jìn)行了模擬研究來(lái)檢驗(yàn)把握度。連續(xù)性變量中,現(xiàn)設(shè)定α=0.05,β=0.20,其它參數(shù)設(shè)置見(jiàn)表4。最終計(jì)算得到SPCD需要的樣本量為450,TED需要的樣本量為296。 根據(jù)設(shè)定的參數(shù)進(jìn)行模擬分析,分析方法采用的是Chen等[11]提出的最小二乘法,模擬循環(huán)1000次,最終計(jì)算得到的SPCD的檢驗(yàn)效能為0.870,TED的檢驗(yàn)效能為0.769。
二分類(lèi)變量中,設(shè)定一類(lèi)錯(cuò)誤α=0.05,二類(lèi)錯(cuò)誤β=0.20,其它參數(shù)設(shè)置見(jiàn)表5。最終計(jì)算得到SPCD需要的樣本量為388,TED需要的樣本量為267。統(tǒng)計(jì)分析采用的Ivanova和Tamura[6]提出的得分檢驗(yàn),自由度為1。模擬循環(huán)1000次,最終計(jì)算得到的SPCD的檢驗(yàn)效能為0.821,TED的檢驗(yàn)效能為0.760。
表4 連續(xù)性變量模擬研究參數(shù)設(shè)置
表5 二分類(lèi)變量模擬研究參數(shù)設(shè)置
相比于傳統(tǒng)的單階段隨機(jī)對(duì)照設(shè)計(jì),序貫安慰劑平行對(duì)照設(shè)計(jì)和雙向富集設(shè)計(jì)在第二階段利用了更多受試者的信息,因而在相同參數(shù)設(shè)置條件下,無(wú)論是連續(xù)型結(jié)局變量還是二分類(lèi)結(jié)局變量,它們需要的樣本量都更少。其中,TED的優(yōu)勢(shì)又格外明顯。當(dāng)然,在二分類(lèi)的結(jié)果中,交叉設(shè)計(jì)在部分參數(shù)條件下需要的樣本量比TED還要少,但交叉設(shè)計(jì)的樣本量估計(jì)是基于兩階段療效相同的前提下進(jìn)行的,但在試驗(yàn)的開(kāi)始階段,我們是沒(méi)法得出這樣的結(jié)論的,而本文介紹的這兩種設(shè)計(jì)是沒(méi)有這樣的假設(shè)前提的,因此適用性更強(qiáng)。在交叉設(shè)計(jì)中,很大比例的受試者要在服用試驗(yàn)藥之后再服用安慰劑,有可能存在遲滯效應(yīng),從而高估安慰劑的療效,影響最終的試驗(yàn)結(jié)論。相比于安慰劑導(dǎo)入設(shè)計(jì)以及隨機(jī)撤藥設(shè)計(jì),SPCD和TED除了在樣本量上的優(yōu)勢(shì)外,還減輕了前面兩種方法在試驗(yàn)中維持盲態(tài)的困難,因而值得推薦。
結(jié)果顯示,兩階段療效相同時(shí),對(duì)于SPCD,當(dāng)?shù)谝浑A段安慰劑組的比例b=0.57時(shí),樣本量最小,實(shí)際試驗(yàn)中,一般第二階段的療效要明顯優(yōu)于第一階段,因而我們會(huì)盡量取較大的b值,使更大比例的受試者進(jìn)入第二階段,從而更易得到有統(tǒng)計(jì)學(xué)意義的結(jié)論。但一般,我們不會(huì)將此比例設(shè)置超過(guò)3:1[12],否則會(huì)對(duì)維持盲態(tài)帶來(lái)困難,從而影響整個(gè)試驗(yàn)的療效,所以推薦將b取為2/3~3/4之間。對(duì)于TED,我們一般推薦b=0.5。兩階段療效不同時(shí),本文在r2=9.8和6.2時(shí),SPCD和TED需要的樣本量最小,但實(shí)際試驗(yàn)中,一般實(shí)際有效率事先是未知的,因而很多時(shí)候還是推薦r2=r3=1[6]。通過(guò)模擬研究我們得到了相應(yīng)樣本量下的檢驗(yàn)效能,連續(xù)型變量和二分類(lèi)變量SPCD的Power均達(dá)到了80%以上,另外兩組TED的Power也達(dá)到了76%以上,稍有損失。
由于序貫安慰劑平行對(duì)照設(shè)計(jì)和雙向富集設(shè)計(jì)都是兩階段,因而相比于傳統(tǒng)的單階段隨機(jī)對(duì)照設(shè)計(jì)受試者經(jīng)歷的藥物暴露時(shí)間會(huì)更長(zhǎng)。但由于兩階段設(shè)計(jì)需要的樣本量更少,整個(gè)試驗(yàn)的周期還是會(huì)縮短,這就為藥物的早日上市以及患者早日得到有效的治療贏得了寶貴的時(shí)間。然而,兩階段試驗(yàn)還是有部分缺點(diǎn),由于它們需要在第二階段重新進(jìn)行隨機(jī)分組,這就可能給整個(gè)試驗(yàn)維持盲態(tài)帶來(lái)困難。首先第一階段使用安慰劑的受試者,如果在第二階段分配到了試驗(yàn)藥組,可能會(huì)明顯察覺(jué)到療效的提升而意識(shí)到自己的用藥情況,即使病人覺(jué)察不出來(lái),醫(yī)生也有可能因?yàn)椴∪税Y狀在第二階段的改善而發(fā)現(xiàn)用藥的變化。其次,第一階段的安慰劑無(wú)效者,如果在第二階段依舊分配到了安慰劑組,受試者的疾病癥狀可能會(huì)一直得到不到改善,甚至越來(lái)越惡化,從而懷疑自己用的是安慰劑,病情嚴(yán)重的話(huà)也難以得到倫理委員會(huì)的同意。
對(duì)于統(tǒng)計(jì)分析,近年來(lái),陸續(xù)有人已經(jīng)提出了SPCD和TED的分析方法,針對(duì)二分類(lèi)結(jié)局變量,主要是得分檢驗(yàn)[6]的方法。針對(duì)連續(xù)性變量,有似不相關(guān)回歸[13]、最小二乘法[7]和重復(fù)測(cè)量的混合效應(yīng)效應(yīng)模型[14]。使用SPCD或TED時(shí),會(huì)存在較大比例的缺失,前兩種方法對(duì)于缺失數(shù)據(jù)的處理一般是忽略或是判為缺失,這在很大程度上影響了整個(gè)試驗(yàn)的檢驗(yàn)效能,而重復(fù)測(cè)量混合效應(yīng)模型在處理缺失數(shù)據(jù)時(shí)有很大的優(yōu)勢(shì),所以一般還是推薦用混合效應(yīng)模型來(lái)處理該類(lèi)數(shù)據(jù)。SPCD和TED雖然都是二階段的,但考慮到一階段結(jié)束后沒(méi)有進(jìn)行假設(shè)檢驗(yàn),同時(shí)也不存在因療效顯著而提前終止試驗(yàn)的情況,因而不要校正一類(lèi)錯(cuò)誤[5]。
綜上所述,在安慰劑效應(yīng)較高或是沒(méi)有徹底治愈方案的慢性疾病試驗(yàn)中,序貫安慰劑平行對(duì)照設(shè)計(jì)和雙向富集設(shè)計(jì)相比于傳統(tǒng)設(shè)計(jì)有很大的優(yōu)勢(shì),但如果是某些病情嚴(yán)重或是治愈方案明確的疾病,還是不推薦使用。