王瑞平
(上海市皮膚病醫(yī)院臨床研究與創(chuàng)新轉(zhuǎn)化中心 上海 200443)
臨床試驗(yàn)研究的首要環(huán)節(jié)是撰寫一份規(guī)范臨床研究 計(jì)劃方案,用于明確整個(gè)研究的目的、指導(dǎo)臨床試驗(yàn)的規(guī)范開(kāi)展。臨床研究方案的設(shè)計(jì)需滿足臨床診療需求,其規(guī)范性需遵從統(tǒng)計(jì)學(xué)要求,同時(shí)需要具有豐富臨床經(jīng)驗(yàn)的臨床醫(yī)生、流行病學(xué)家、統(tǒng)計(jì)師等共同參與,是一項(xiàng)科學(xué)、嚴(yán)謹(jǐn)?shù)墓ぷ?。根?jù)隨機(jī)對(duì)照試驗(yàn)報(bào)告統(tǒng)一標(biāo)準(zhǔn)(CONSORT)聲明、PICO原則和我國(guó)《藥物臨床研究質(zhì)量管理規(guī)范》,試驗(yàn)方案通常包括基本信息、研究背景資料、試驗(yàn)?zāi)康?、試?yàn)設(shè)計(jì)、實(shí)施計(jì)劃等內(nèi)容。本文重點(diǎn)介紹臨床研究方案設(shè)計(jì)中須注意的統(tǒng)計(jì)學(xué)要素問(wèn)題。
臨床試驗(yàn)設(shè)計(jì)類型的選擇至關(guān)重要,研究者應(yīng)根據(jù)研究目的和研究條件的不同,選擇合適的臨床研究設(shè)計(jì)類型。最常見(jiàn)的研究設(shè)計(jì)包括平行設(shè)計(jì)、交叉設(shè)計(jì)、析因設(shè)計(jì)和成組序貫設(shè)計(jì)。
1)平行設(shè)計(jì):是指根據(jù)研究目的為試驗(yàn)藥設(shè)置一個(gè)或多個(gè)對(duì)照組,試驗(yàn)藥也可設(shè)置多個(gè)劑量組,研究者將受試者隨機(jī)地分配到試驗(yàn)的各組,各組同時(shí)進(jìn)行、平行推進(jìn)。
2)交叉設(shè)計(jì):是將自身比較和組間比較設(shè)計(jì)思路綜合應(yīng)用的一種設(shè)計(jì)方法,它可以較好地控制個(gè)體間的差異,以減少受試者人數(shù)。最簡(jiǎn)單的交叉設(shè)計(jì)是2×2交叉設(shè)計(jì),指將每個(gè)受試者隨機(jī)分配到2種不同的試驗(yàn)順序組中,AB或BA兩種治療順序組。其中,AB順序組的受試者在第一階段接受A處理,在第二階段接受B處理;而BA順序組與AB順序組相反,而在2種處理之間要設(shè)置洗脫期以消除其延滯效應(yīng)。
3)析因設(shè)計(jì):是一種多因素的交叉分組試驗(yàn)設(shè)計(jì),通過(guò)不同的組合,對(duì)2個(gè)或多個(gè)處理同時(shí)進(jìn)行評(píng)價(jià)。它不僅可檢驗(yàn)每個(gè)因素各水平間的差異,而且可以檢驗(yàn)各因素之間的交互作用。最簡(jiǎn)單的析因設(shè)計(jì)是2×2析因設(shè)計(jì),有因素A和因素B這2個(gè)處理因素,每個(gè)處理因素設(shè)為“有”和“無(wú)”2個(gè)水平,此時(shí),兩因素各水平組合后即有4組:A0B0、A1B0、A0B1和A1B1。析因分析臨床研究中可將受試者隨機(jī)分配到這4組。在很多情況下,該設(shè)計(jì)主要是為了檢驗(yàn)A和B的交互作用,或用于探索2種藥物不同劑量的適當(dāng)組合,以評(píng)估由2種藥物組合成的復(fù)方藥的治療效果。
4)成組序貫設(shè)計(jì):是指每一批受試者完成試驗(yàn)后,及時(shí)揭盲對(duì)主要指標(biāo)進(jìn)行分析,一旦可以做出結(jié)論即提前有效/無(wú)效停止試驗(yàn)。成組序貫設(shè)計(jì)包含成組和序貫2個(gè)要素,成組是指每個(gè)分析階段試驗(yàn)組與對(duì)照組的病例數(shù)比例與總樣本中的比例相同,序貫是指把整個(gè)試驗(yàn)分成若干個(gè)連貫的分析段,每個(gè)分析段病例數(shù)可以相等也可以不等。成組序貫設(shè)計(jì)常用于有期中分析的臨床研究中,適用于下列3種情況:①懷疑試驗(yàn)藥物有較高的不良反應(yīng)發(fā)生率,采用成組序貫設(shè)計(jì)可以較早終止試驗(yàn);②試驗(yàn)藥療效較差,采用成組序貫設(shè)計(jì)可以因無(wú)效較早終止試驗(yàn);③試驗(yàn)藥與對(duì)照藥的療效相差較大,但病例稀少,或臨床觀察時(shí)間過(guò)長(zhǎng)。成組序貫設(shè)計(jì)的優(yōu)點(diǎn)是當(dāng)試驗(yàn)藥與對(duì)照藥間確實(shí)存在差異時(shí),或試驗(yàn)藥與對(duì)照藥不可能達(dá)到統(tǒng)計(jì)學(xué)意義時(shí),可較早地得到結(jié)論,從而縮短試驗(yàn)周期。
5)主方案設(shè)計(jì):是一類在單一方案下同時(shí)檢測(cè)多種試驗(yàn)藥物和/或多個(gè)腫瘤適應(yīng)證,且無(wú)需為每次試驗(yàn)制定新方案的新穎試驗(yàn)設(shè)計(jì)。常見(jiàn)的主方案設(shè)計(jì)包括3種類型:籃式設(shè)計(jì)、傘式設(shè)計(jì)和平臺(tái)試驗(yàn)設(shè)計(jì)。主方案設(shè)計(jì)常用于腫瘤研究設(shè)計(jì),不同的設(shè)計(jì)方案可參考相關(guān)文獻(xiàn)材料。
隨機(jī)化是指臨床研究中的每位受試者均有同等的概率被分配到試驗(yàn)組或?qū)φ战M,使各種已知和未知的影響因素在試驗(yàn)組和對(duì)照組間的分布保持均衡,也是臨床研究進(jìn)行有效性和安全性評(píng)價(jià)的前提,其過(guò)程不受研究者和受試者主觀意愿的影響。常見(jiàn)的隨機(jī)化方案包括:①固定區(qū)組隨機(jī):是指在一個(gè)固定區(qū)組內(nèi)保證試驗(yàn)組和對(duì)照組之間的均衡。區(qū)組過(guò)大易造成組間不均衡,過(guò)小則易造成同一區(qū)組內(nèi)受試者分組的可猜測(cè)性,最常見(jiàn)的區(qū)組數(shù)為4或6。②可變區(qū)組隨機(jī):在單盲或開(kāi)放性研究選擇固定區(qū)組隨機(jī),研究者會(huì)根據(jù)已有分組去猜測(cè)接下來(lái)受試者的分組,因此常常采用可變區(qū)組隨機(jī),設(shè)定2個(gè)或多個(gè)區(qū)組長(zhǎng)度,在限制組間可能的不平衡的同時(shí)又能保證較低的可預(yù)測(cè)性。③分層隨機(jī)化:是臨床研究中最常見(jiàn)的隨機(jī)方法,分層因素可以根據(jù)試驗(yàn)?zāi)康幕蛴绊懺囼?yàn)結(jié)果的因素來(lái)確定,通常由臨床研究者和統(tǒng)計(jì)師共同決定,常見(jiàn)的分層因素有中心、年齡、基礎(chǔ)疾病、疾病亞型等,在每層內(nèi)分別進(jìn)行隨機(jī)以保持層內(nèi)的組間均衡性。④動(dòng)態(tài)隨機(jī):當(dāng)考慮的分層因素較多時(shí),分層隨機(jī)化可能會(huì)導(dǎo)致每層樣本量不足,此時(shí)可采用“動(dòng)態(tài)隨機(jī)”。動(dòng)態(tài)隨機(jī)化是指通過(guò)考慮分層因素的數(shù)量及權(quán)重和入組個(gè)體在這些分層因素上的分布,調(diào)整入組個(gè)體的分組,從而保證兩組間的均衡可比。⑤中央隨機(jī)化系統(tǒng):在跨地域的多中心臨床研究中,各中心在受試者招募、隨機(jī)入組和藥物消耗等方面的進(jìn)度不同,傳統(tǒng)的人工管理由于溝通不及時(shí),很容易造成資源的浪費(fèi),因此可以采用基于信息化技術(shù)的多中心臨床研究中央隨機(jī)系統(tǒng)。
對(duì)照是臨床研究的基本原則之一,設(shè)置對(duì)照組的目的在于將待測(cè)試干預(yù)引起的患者結(jié)果(如癥狀、體征或其他發(fā)病率的變化)與其他因素(如疾病的自然發(fā)展、觀察者或患者的期望或其他治療)引起的結(jié)果進(jìn)行區(qū)分。干預(yù)的選擇往往是設(shè)計(jì)隨機(jī)對(duì)照試驗(yàn)第一優(yōu)先考慮的問(wèn)題,而對(duì)于對(duì)照的選擇,很多研究者卻忽略其重要性[1]。常見(jiàn)的對(duì)照類型包括:①安慰劑對(duì)照:在安慰劑對(duì)照試驗(yàn)中,安慰劑是一種“假”治療,在顏色、重量、味道和氣味等物理特征方面與試驗(yàn)藥物盡可能相同,但不含試驗(yàn)藥物。例如試驗(yàn)藥物以輸液的形式給藥,安慰劑對(duì)照則可以為生理鹽水。②空白對(duì)照:空白對(duì)照在概念上與安慰劑對(duì)照類似,一般用在安慰劑對(duì)照由于特定原因無(wú)法實(shí)施的情況下。比如,研究干預(yù)措施是某種手術(shù)方式,但對(duì)照組使用“假”手術(shù)作為安慰劑對(duì)照往往違背倫理,研究者要慎用。③劑量對(duì)照:是指將受試者隨機(jī)分配到兩個(gè)或多個(gè)劑量組,其中可以有或沒(méi)有安慰劑組,從而確定劑量和療效與不良反應(yīng)之間的關(guān)系。比如一項(xiàng)三臂的藥物臨床研究,一組人群接受高劑量的藥物,一組人群接受低劑量的藥物,剩下一組人群接受零劑量的安慰劑。④陽(yáng)性對(duì)照:是指將一種研究性藥物與已知的活性藥物進(jìn)行比較的試驗(yàn),這種試驗(yàn)通常是隨機(jī)雙盲試驗(yàn)。⑤外部對(duì)照:是指對(duì)照組的患者并非屬于受試組所在的同一隨機(jī)試驗(yàn),即不存在平行隨機(jī)對(duì)照組。因此,對(duì)照組與接受治療者并不完全來(lái)自同一人群。通常,對(duì)照組是先前所觀察且有完善記錄的患者群,可以是在另一機(jī)構(gòu)同期觀察的一組人群,或是同一機(jī)構(gòu)研究之外的人群。
重復(fù)是臨床研究的基本原則之一,是指接受相同處理的受試對(duì)象不止一個(gè),即每個(gè)處理組都要有一定的樣本含量。ICH指導(dǎo)原則E9:《臨床試驗(yàn)統(tǒng)計(jì)原則》中指出,臨床研究的樣本量必須足夠大,以可靠地回答研究假設(shè)所提出的相關(guān)問(wèn)題;同時(shí)又不至于太大而造成浪費(fèi)。樣本量的計(jì)算方法請(qǐng)參考《上海醫(yī)藥》2022年第43卷第7期《隨機(jī)對(duì)照臨床試驗(yàn)設(shè)計(jì)要點(diǎn)和規(guī)范》[2]中的介紹。
在臨床研究中的隨機(jī)分配階段,若研究者已知隨機(jī)化分組信息,則可能選擇性入組受試者,導(dǎo)致兩組之間基線不均衡。若受試者已知隨機(jī)化分組信息,則可能受到主觀因素的影響,產(chǎn)生療效與安全性的評(píng)價(jià)偏倚。而盲法是控制臨床研究中因“知曉隨機(jī)化分組信息”而產(chǎn)生偏倚的重要措施,簡(jiǎn)單來(lái)說(shuō)就是使研究者和/或受試者不清楚接受的是何種處理。根據(jù)針對(duì)的是研究者(對(duì)受試者進(jìn)行篩選的人員、終點(diǎn)評(píng)價(jià)人員以及對(duì)方案依從性評(píng)價(jià)人員)和受試者的設(shè)盲程度,臨床研究分為雙盲、單盲和開(kāi)放試驗(yàn)。評(píng)價(jià)者在任何情況下都應(yīng)處于盲狀態(tài)。
揭盲:雙盲臨床研究中,通常采用二次揭盲,即數(shù)據(jù)庫(kù)鎖定后進(jìn)行第一次揭盲,可以獲知每個(gè)受試者對(duì)應(yīng)A組或者B組,以便對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析;當(dāng)分析結(jié)束時(shí),在臨床研究總結(jié)會(huì)上再進(jìn)行第二次揭盲,可以獲知AB兩組分別對(duì)應(yīng)試驗(yàn)組和對(duì)照組。
緊急揭盲:為了保證受試者的安全,在雙盲臨床研究中,申辦者須為每個(gè)受試者準(zhǔn)備一份應(yīng)急信件,其內(nèi)容為該編號(hào)的受試者所分入的組別及用藥情況。非必要時(shí)不得拆閱,一旦被拆閱,該編號(hào)病例將被中止試驗(yàn),按脫落處理。若受試者出現(xiàn)嚴(yán)重不良事件,須知道該受試者的分組情況,以便于搶救時(shí)才拆開(kāi)應(yīng)急信件。
每個(gè)臨床研究通常有一個(gè)主要目的,通過(guò)試驗(yàn)來(lái)回答一個(gè)科學(xué)問(wèn)題,例如人體對(duì)藥物的耐受性、藥物是否延長(zhǎng)腫瘤患者的生存時(shí)間、藥物是否可以控制疾病的復(fù)發(fā)等。這就需要用相應(yīng)的指標(biāo)來(lái)回答臨床研究提出的科學(xué)問(wèn)題,這種與臨床研究目的相關(guān)的指標(biāo)稱為終點(diǎn)指標(biāo)。終點(diǎn)指標(biāo)可以是臨床終點(diǎn)(痊愈、有效、死亡、心血管事件等)、替代終點(diǎn)(生物標(biāo)志物、短期效應(yīng)指標(biāo))、安全性指標(biāo)、某個(gè)特定的不良反應(yīng)。終點(diǎn)指標(biāo)的選擇應(yīng)該基于臨床實(shí)際和研究目的確切反映藥物有效性或安全性。選擇原則為易于量化、客觀性強(qiáng)、重復(fù)性高且為相關(guān)研究領(lǐng)域公認(rèn)的指標(biāo)。主要指標(biāo)不宜太多,一般只有一個(gè),當(dāng)主要指標(biāo)有多個(gè)時(shí),樣本量估計(jì)要考慮假設(shè)檢驗(yàn)的多重性問(wèn)題。在定義主要指標(biāo)過(guò)程中,不僅要說(shuō)明指標(biāo)的含義,其測(cè)量時(shí)點(diǎn)、測(cè)量手段以及計(jì)算方法都應(yīng)注明。此外,在關(guān)注主要終點(diǎn)和次要終點(diǎn)的基礎(chǔ)上,研究者還應(yīng)了解有效性終點(diǎn)、安全性終點(diǎn)、衛(wèi)生經(jīng)濟(jì)學(xué)終點(diǎn)等。
1)有效性終點(diǎn):是反映受試藥物用于患者所表現(xiàn)出臨床獲益的主要觀測(cè)和評(píng)價(jià)工具。有效性指標(biāo)又稱為療效指標(biāo),是反映受試藥物用于患者所表現(xiàn)出臨床獲益的主要觀測(cè)和評(píng)價(jià)工具,療效指標(biāo)的選擇、測(cè)量和比較是藥物有效性評(píng)價(jià)中的關(guān)鍵因素。療效指標(biāo)主要包括療效觀測(cè)指標(biāo)和以療效觀測(cè)指標(biāo)為基礎(chǔ)確定藥物效應(yīng)大小比較與評(píng)價(jià)的方法和標(biāo)準(zhǔn),即療效評(píng)價(jià)指標(biāo)。反映疾病變化的療效指標(biāo)可以是疾病臨床終點(diǎn),影響疾病進(jìn)程的重要臨床事件,也可以是評(píng)價(jià)社會(huì)參與能力,生活能力,臨床癥狀或體征,心理狀態(tài)等內(nèi)容的相關(guān)量表或其他形式的定量、半定量或定性的指標(biāo),也可以是通過(guò)某些儀器和實(shí)驗(yàn)室檢查等手段獲得的某些客觀數(shù)據(jù)或檢查結(jié)果,比如病理生化等指標(biāo)。
2)安全性終點(diǎn):安全性評(píng)價(jià)是藥物或醫(yī)療器械上市前臨床研究的核心問(wèn)題之一,也是藥物或醫(yī)療器械上市后安全廣泛應(yīng)用的最重要的保障,主要是從暴露情況(強(qiáng)度、時(shí)間)、臨床不良事件(疾病、體征、癥狀)、實(shí)驗(yàn)室檢查數(shù)據(jù)(包括生化學(xué)和血液學(xué)指標(biāo)等)、生命體征等4個(gè)方面對(duì)與產(chǎn)品安全性相關(guān)的信息進(jìn)行描述與評(píng)價(jià)。
3)衛(wèi)生經(jīng)濟(jì)學(xué)終點(diǎn):主要有成本-效果分析(costeffectiveness analysis, CEA)、成本-效用分析(cost-utility analysis, CUA)和成本-效益分析(cost-benefit analysis,CBA)。
4)臨床終點(diǎn):是指能夠反映患者感覺(jué)、功能變化的特征性指標(biāo)、與生存狀態(tài)相關(guān)的疾病臨床終點(diǎn)(如死亡、殘疾、功能喪失)或某些重要的臨床事件(如腦卒中、骨折發(fā)生)等指標(biāo)。臨床終點(diǎn)能直接評(píng)價(jià)藥物真實(shí)的效應(yīng),如癥狀緩解率、疾病病死率或者嚴(yán)重臨床事件發(fā)生率等,但由于其中的疾病臨床終點(diǎn)指標(biāo)的評(píng)價(jià)往往需要的時(shí)間長(zhǎng)、樣本量大、研究成本高,有時(shí)還存在倫理學(xué)風(fēng)險(xiǎn),導(dǎo)致疾病臨床終點(diǎn)指標(biāo)觀測(cè)存在困難或不合理,因此臨床研究常以易于觀察和測(cè)量的指標(biāo)來(lái)替代臨床終點(diǎn)。
5)替代終點(diǎn):是指直接終點(diǎn)不可能得到或短期內(nèi)不能直接評(píng)價(jià)臨床獲益時(shí),用于間接反映臨床獲益的觀察指標(biāo)。根據(jù)替代終點(diǎn)與臨床效果的相關(guān)性和證據(jù)積累,F(xiàn)DA將替代終點(diǎn)分為3類,分別為經(jīng)過(guò)驗(yàn)證的替代終點(diǎn)、可能有效的替代終點(diǎn)、候選的替代終點(diǎn)。合理應(yīng)用替代終點(diǎn)的前提是替代指標(biāo)的改善也將會(huì)相應(yīng)改善疾病的終點(diǎn)結(jié)局,即研究者必須有足夠證據(jù)支持其與臨床終點(diǎn)的關(guān)系,并可預(yù)測(cè)疾病結(jié)局。針對(duì)罕見(jiàn)病、進(jìn)展緩慢或須長(zhǎng)期觀察臨床終點(diǎn)的疾病、危及生命但又無(wú)藥可治的疾病,常常使用經(jīng)過(guò)驗(yàn)證的替代終點(diǎn),會(huì)大大縮短臨床研究時(shí)間。
6)復(fù)合終點(diǎn):如果根據(jù)主要研究目的,在多個(gè)指標(biāo)中很難選出其中一個(gè)作為主要變量,則可用預(yù)先確定的算法來(lái)整合或組合多個(gè)值,組合構(gòu)成一個(gè)復(fù)合變量作為主要終點(diǎn)。復(fù)合終點(diǎn)一般有2種類型:一種是臨床上經(jīng)常采用的量表,例如在臨床研究中常用到的漢密爾頓量表就是由若干項(xiàng)目組成的復(fù)合終點(diǎn);另一種復(fù)合終點(diǎn)是將幾種事件合并定義為一個(gè)復(fù)合終點(diǎn),這種情況在心血管藥物的臨床研究中最為常見(jiàn)。須注意的是,將多種測(cè)量結(jié)果綜合成復(fù)合變量,其計(jì)算方法應(yīng)在試驗(yàn)方案中制定,并解釋其臨床意義。
7)全局性終點(diǎn):是指把客觀指標(biāo)和研究者對(duì)患者治療后的臨床結(jié)局狀態(tài)或其改善程度總體印象結(jié)合起來(lái)制定的一種療效評(píng)價(jià)指標(biāo),用于評(píng)估某項(xiàng)治療總的安全性、優(yōu)效性和實(shí)用性。它通常是等級(jí)指標(biāo),其判斷等級(jí)的依據(jù)和理由應(yīng)在臨床研究方案中明確。全局評(píng)價(jià)指標(biāo)在神經(jīng)病學(xué)和精神病學(xué)治療領(lǐng)域用得比較好,如精神疾病治療的臨床總體印象量表。
意向性治療的原則(intention to treat principle, ITT)是指主要分析應(yīng)包括所有隨機(jī)化的受試者,這種保持初始的隨機(jī)化的做法對(duì)于防止偏倚是有益的,并且為統(tǒng)計(jì)學(xué)檢驗(yàn)提供了可靠的基礎(chǔ),這一基于所有隨機(jī)化受試者的分析集通常被稱為ITT分析集。ITT分析集是對(duì)所有隨機(jī)化受試者的研究結(jié)局進(jìn)行完整的隨訪,但在實(shí)際中這種理想很難實(shí)現(xiàn),因而也常采用全分析集(full analysis set, FAS)來(lái)代替ITT分析集。FAS包括所有隨機(jī)化的受試者,但違反重要入組標(biāo)準(zhǔn)、受試者未接受試驗(yàn)用藥物的治療、隨機(jī)化后無(wú)任何觀測(cè)數(shù)據(jù)的受試者不進(jìn)入FAS。符合方案集(per protocol set, PPS)是FAS的一個(gè)子集,是對(duì)方案依從性高的受試者集合。安全集(safety set, SS)用于安全性分析,通常應(yīng)包括所有隨機(jī)化后至少接受一次治療且有安全性評(píng)價(jià)的受試者。
在統(tǒng)計(jì)分析的過(guò)程中,可以同時(shí)采用FAS和PPS進(jìn)行統(tǒng)計(jì)分析。若2種數(shù)據(jù)集的分析結(jié)論一致時(shí),可以增強(qiáng)試驗(yàn)結(jié)果的可信性,若不一致時(shí),應(yīng)對(duì)結(jié)果差異進(jìn)行討論和解釋。在不同的設(shè)計(jì)類型中關(guān)注的分析集也不同。在優(yōu)效性試驗(yàn)中,應(yīng)采用FAS作為主要分析集,因?yàn)樗艘缽男圆畹氖茉囌叨赡艿凸懒睡熜?,基于FAS的分析結(jié)果是保守的。在等效性或非劣效性試驗(yàn)中,用FAS所得的結(jié)果并不一定保守,可以用PPS和FAS作為分析人群,2個(gè)分析集所得出的結(jié)論通常應(yīng)一致,否則應(yīng)分析并合理解釋導(dǎo)致不一致的原因。
期中分析是指在正式完成臨床研究前,根據(jù)事先制定的統(tǒng)計(jì)分析計(jì)劃,在處理組間進(jìn)行分析。常見(jiàn)的期中分析目的包括監(jiān)測(cè)藥物的安全性、確認(rèn)藥物的有效性、樣本量重新估計(jì),分別對(duì)應(yīng)期中分析的4種結(jié)果:依據(jù)安全性終止試驗(yàn)、依據(jù)無(wú)效性終止試驗(yàn)、依據(jù)有效性終止試驗(yàn)和繼續(xù)試驗(yàn)。當(dāng)期中分析的目的是監(jiān)測(cè)藥物的安全性時(shí),若在實(shí)施過(guò)程中安全性出現(xiàn)問(wèn)題,則可以做出終止試驗(yàn)的結(jié)論;當(dāng)期中分析的目的是確認(rèn)藥物的有效性時(shí),若試驗(yàn)藥物有效并達(dá)到預(yù)期設(shè)定的標(biāo)準(zhǔn),則可以做出依據(jù)有效性終止試驗(yàn)的結(jié)論,若試驗(yàn)藥物無(wú)效且低于預(yù)期設(shè)定的標(biāo)準(zhǔn),則可以做出依據(jù)無(wú)效性終止試驗(yàn)的結(jié)論;當(dāng)方案設(shè)計(jì)時(shí)信息不足導(dǎo)致對(duì)試驗(yàn)藥物的有效性和安全性估計(jì)不準(zhǔn)確,期中分析可以進(jìn)行樣本量重新估計(jì),重新估算之后決定下一步工作。方案中若有期中分析,則須說(shuō)明期中分析的時(shí)點(diǎn)(包括日歷時(shí)點(diǎn)或信息時(shí)點(diǎn))、次數(shù)、Ⅰ類錯(cuò)誤調(diào)整方法、具體的假設(shè)檢驗(yàn)或參數(shù)估計(jì)方法、提前終止臨床研究的標(biāo)準(zhǔn)。
獨(dú)立數(shù)據(jù)監(jiān)查委員會(huì)(Independent Data Monitoring Committee, IDMC),或稱數(shù)據(jù)和安全監(jiān)查委員會(huì)(Data and Safety Monitoring Board, DSMB)由申辦者組織相關(guān)領(lǐng)域的杰出專家組成,成員獨(dú)立于研究者和申辦者,通常包括所研究疾病的臨床專家、生物統(tǒng)計(jì)學(xué)家、臨床研究方法學(xué)專家、生物倫理學(xué)家等,主要負(fù)責(zé)對(duì)期中分析的安全性數(shù)據(jù)以及關(guān)鍵療效指標(biāo)進(jìn)行解讀、判斷,并向申辦者建議是否繼續(xù)、修改或停止試驗(yàn)。大多數(shù)的臨床研究不要求或無(wú)需使用IDMC,而以延長(zhǎng)生命或減少重大健康結(jié)局風(fēng)險(xiǎn)為目的的大規(guī)模多中心臨床研究則使用IDMC。
缺失數(shù)據(jù)是指按照研究方案要求收集但未能觀測(cè)到的數(shù)據(jù)。缺失機(jī)制主要分為3類:完全隨機(jī)缺失、隨機(jī)缺失和非隨機(jī)缺失。缺失數(shù)據(jù)的填補(bǔ)常常針對(duì)方案中的主要終點(diǎn),并且填補(bǔ)方法應(yīng)在方案中進(jìn)行說(shuō)明。但須要注意的是,研究者無(wú)法通過(guò)已有數(shù)據(jù)對(duì)缺失機(jī)制進(jìn)行判斷,且不同的填補(bǔ)方法得到的結(jié)果也不一樣,因此處理缺失數(shù)據(jù)本身可能是潛在的一種偏倚。研究者可以在不同的假設(shè)下進(jìn)行數(shù)據(jù)填補(bǔ),然后進(jìn)行敏感性分析,從而比較所得結(jié)論是否一致。常見(jiàn)的數(shù)據(jù)處理方法有以下幾種:①忽視缺失值。在完全隨機(jī)缺失機(jī)制下可以忽視缺失數(shù)據(jù),但忽視缺失值會(huì)犯前文中所提到的問(wèn)題,因此不建議作為確證性研究的主要療效指標(biāo)分析填補(bǔ)方法??梢杂糜谔剿餍匝芯炕蛘叽_證性研究的次要療效指標(biāo)分析。②簡(jiǎn)單填補(bǔ)。是將缺失數(shù)據(jù)按某個(gè)填補(bǔ)方法結(jié)轉(zhuǎn)一次,常見(jiàn)的填補(bǔ)方法包括末次訪視結(jié)轉(zhuǎn)、基線訪視結(jié)轉(zhuǎn)、最差病例填補(bǔ)、最好病例填補(bǔ)、均數(shù)填補(bǔ)、回歸填補(bǔ)等。③多重填補(bǔ)。主要包括以下步驟:首先為每個(gè)缺失值產(chǎn)生一套可能的填補(bǔ)值,這些值反映了無(wú)響應(yīng)模型的不確定性。每一個(gè)值都被用來(lái)填補(bǔ)數(shù)據(jù)集中的缺失值,產(chǎn)生若干個(gè)完整數(shù)據(jù)集。其次,每一個(gè)填補(bǔ)數(shù)據(jù)集都用針對(duì)完整數(shù)據(jù)集的統(tǒng)計(jì)方法進(jìn)行統(tǒng)計(jì)分析。最后,對(duì)來(lái)自于各個(gè)填補(bǔ)數(shù)據(jù)集的結(jié)果進(jìn)行綜合,產(chǎn)生最終的統(tǒng)計(jì)推斷,最終得到對(duì)目標(biāo)變量的估計(jì)。常見(jiàn)的多重填補(bǔ)方法包括聯(lián)合模型法、全條件定義法、馬爾科夫鏈蒙特卡羅法、逐步回歸多變量填補(bǔ)法等。
統(tǒng)計(jì)分析方法應(yīng)根據(jù)研究目的、試驗(yàn)方案和觀察指標(biāo)進(jìn)行適當(dāng)選擇。統(tǒng)計(jì)分析應(yīng)說(shuō)明統(tǒng)計(jì)方法、假設(shè)檢驗(yàn)、單側(cè)檢驗(yàn)還是雙側(cè)檢驗(yàn)以及檢驗(yàn)水準(zhǔn)進(jìn)行說(shuō)明(傳統(tǒng)差異性檢驗(yàn)通常為雙側(cè)檢驗(yàn),α通常不大于0.05),同時(shí)選擇國(guó)內(nèi)外公認(rèn)的統(tǒng)計(jì)軟件,包括SPSS、SAS、R、MedCalc、GraphPad等。關(guān)于統(tǒng)計(jì)分析涉及到的統(tǒng)計(jì)學(xué)描述和統(tǒng)計(jì)學(xué)檢驗(yàn)可以參考《上海醫(yī)藥》2022年第43卷7期《隨機(jī)對(duì)照臨床試驗(yàn)設(shè)計(jì)要點(diǎn)和規(guī)范》[2]中的詳細(xì)介紹。
亞組分析是對(duì)具有某種基線特征的亞組進(jìn)行統(tǒng)計(jì)學(xué)分析,這些基線變量通常包括人口學(xué)特征(如年齡、性別等)、實(shí)驗(yàn)室檢查指標(biāo)、基因組相關(guān)標(biāo)志物、疾病的嚴(yán)重程度或分型、臨床狀況(如合并癥、伴隨用藥)、地區(qū)(如國(guó)家、試驗(yàn)中心)和環(huán)境因素等。亞組分析可以分為探索性亞組分析、支持性亞組分析和確證性亞組分析。①探索性亞組分析,主要用于早期臨床研究或在確證性臨床研究的事后分析中,因此可以事先確定,也可以事后定義。其目的是發(fā)現(xiàn)藥物在不同亞組間療效和/或安全性方面的差異,進(jìn)而提出研究假設(shè),以待在后續(xù)的臨床研究中進(jìn)一步探索和驗(yàn)證。②支持性亞組分析,在以考察試驗(yàn)藥物在全人群中的療效為目的的確證性臨床研究中,當(dāng)全人群的主要終點(diǎn)同時(shí)具有統(tǒng)計(jì)學(xué)意義和臨床意義時(shí),通常還應(yīng)進(jìn)行支持性亞組分析,目的是進(jìn)一步考察試驗(yàn)藥物在各個(gè)亞組中療效的一致性,通常須事先定義。如果試驗(yàn)藥物在各亞組間的療效一致,可為藥物適用于全人群提供進(jìn)一步支持性證據(jù);如果各亞組間的療效不一致,特別是方向相反時(shí),則亞組分析結(jié)果的解釋可能會(huì)出現(xiàn)困難,須對(duì)其做進(jìn)一步的分析和研究。當(dāng)全人群的主要終點(diǎn)沒(méi)有統(tǒng)計(jì)學(xué)意義或臨床意義時(shí),亞組分析結(jié)果只能為進(jìn)一步研究提供線索。③確證性亞組分析,在確證性臨床研究中,按照臨床研究方案和/或統(tǒng)計(jì)分析計(jì)劃中預(yù)先規(guī)定的亞組和多重性調(diào)整方法,考察試驗(yàn)藥物在目標(biāo)亞組和/或全人群中的療效,其結(jié)果應(yīng)同時(shí)具有臨床意義和統(tǒng)計(jì)學(xué)意義,以支持藥物說(shuō)明書的撰寫,但須事先定義。確證性臨床研究也可以對(duì)目標(biāo)亞組進(jìn)行確證性亞組分析,而對(duì)其它(非目標(biāo))亞組進(jìn)行支持性或探索性亞組分析,以支持試驗(yàn)藥物在目標(biāo)亞組中的有效性和安全性的結(jié)論,并為非目標(biāo)亞組的進(jìn)一步研究提供線索。
當(dāng)亞組分析過(guò)多,可以使用森林圖將所有亞組分析結(jié)果使用圖形進(jìn)行清晰的表達(dá)。如圖1所示,在一項(xiàng)“心血管疾病與癡呆亞型之間的性別差異:對(duì)464 616名英國(guó)生物銀行參與者的前瞻性分析”[3]的臨床研究中,研究者采用森林圖展示了不同癡呆亞型中的性別、年齡因素對(duì)癡呆與心血管疾病之間的關(guān)系,使結(jié)果的呈現(xiàn)更加直觀。
圖1 亞組分析森林圖示意