劉青松,王黎明,瞿穎秋,邱世芳
(重慶理工大學(xué) 理學(xué)院,重慶 400054)
在生物醫(yī)學(xué)研究中,人們常常需要處理大量的相關(guān)數(shù)據(jù),例如,在眼科(耳科)研究中,每個(gè)個(gè)體可以得到2只眼睛(耳朵)中每1只眼睛(耳朵)的重要信息,而得到的這些數(shù)據(jù)往往是高度相關(guān)的。研究表明:忽視這些成對(duì)數(shù)據(jù)之間的相關(guān)性往往會(huì)得到錯(cuò)誤的統(tǒng)計(jì)推斷[1]。如在治療兒童中耳炎時(shí),Mantel等[2-3]在雙盲臨床試驗(yàn)中比較2種抗生素(Cefaclor和Amoxicillin)的治愈率。既有1只耳朵患病又有2只耳朵都患病的兒童,被隨機(jī)分配到使用不同抗生素的治療組中,每個(gè)兒童都接受為期14 d的治療。2只耳朵都患病的兒童經(jīng)過(guò)14 d治療后,治療的結(jié)果被分為3類:一是兒童的2只耳朵都被治愈;二是兒童僅僅只有1只耳朵被治愈;三是兒童沒(méi)有1只耳朵被治愈。只有1只耳朵患病的兒童治療后,結(jié)果有被治愈和沒(méi)有治愈2種情況。試驗(yàn)數(shù)據(jù)見表1所示。
表1 接受14 d治療后兒童的中耳炎數(shù)據(jù)
針對(duì)此類研究,人們常常想要檢驗(yàn)的是Cefaclor和Amoxicillin的治愈率是否相同。近年來(lái),對(duì)于此類組內(nèi)相關(guān)數(shù)據(jù)的研究備受關(guān)注。Rosner[1]在樣本量很大的情況下,基于大樣本理論討論了雙邊數(shù)據(jù)的統(tǒng)計(jì)假設(shè)檢驗(yàn),提出了該檢驗(yàn)假設(shè)的2種檢驗(yàn)統(tǒng)計(jì)量。隨后,Tang等[4]針對(duì)這種成對(duì)器官的雙邊治療數(shù)據(jù),提出了獨(dú)立性假設(shè)和非獨(dú)立性假設(shè)下的漸近和近似非條件的檢驗(yàn)過(guò)程,Tang等[5]基于2種藥物治療率之差提出了其置信區(qū)間的構(gòu)造方法。對(duì)于混合單雙邊試驗(yàn)數(shù)據(jù),Pei等[6]基于治愈率之比研究了2種治療的等價(jià)性檢驗(yàn)問(wèn)題,覃愿等[7]研究了單雙邊混合試驗(yàn)設(shè)計(jì)下,2種治療的治愈率之比的漸近置信區(qū)間。
然而,在臨床試驗(yàn)研究中,對(duì)樣本量的研究也是至關(guān)重要的。對(duì)于具有組內(nèi)相關(guān)的雙邊試驗(yàn)數(shù)據(jù),邱世芳等[8-9]基于比例差分別從顯著性檢驗(yàn)的角度和區(qū)間估計(jì)的角度,推導(dǎo)了近似樣本量的公式和有效算法。然而,對(duì)單雙邊混合試驗(yàn)設(shè)計(jì)下基于比例差的區(qū)間估計(jì)所需要的樣本量的確定還未有文獻(xiàn)研究,本文將就此問(wèn)題進(jìn)行研究,提出幾種有效的樣本量的確定公式或有效算法。
假設(shè)i=0表示使用Cefaclor的治療組,i=1表示使用Amoxicillin的治療組。假設(shè)(i=0,1;q=1,2)表示個(gè)體接受第i種治療后,有h只耳朵被完全治愈的患者的個(gè)數(shù)。當(dāng)q=1時(shí),代表單邊數(shù)據(jù),此時(shí)h=0,1;當(dāng)q=2時(shí),代表雙邊數(shù)據(jù),此時(shí)h=0,1,2代表其相應(yīng)的概率。單雙邊混合試驗(yàn)設(shè)計(jì)下的數(shù)據(jù)結(jié)構(gòu)如表2所示。
表2 單雙邊混合試驗(yàn)數(shù)據(jù)的觀測(cè)頻數(shù)及相應(yīng)的概率
其中,R是用來(lái)衡量患者2只耳朵相關(guān)性的指標(biāo)。顯然,當(dāng)R=1時(shí),表示2只耳朵完全獨(dú)立,即1只耳朵治愈與另外1只耳朵治愈情況完全無(wú)關(guān)?;谝陨霞僭O(shè),易得到:
令Δ表示2種藥物治療的治愈率之差,即Δ=λ0-λ1。因此,在此模型下,對(duì)于觀測(cè)頻數(shù)m=的對(duì)數(shù)似然函數(shù)為:
式中:C是1個(gè)常數(shù)。本文所感興趣的參數(shù)是Δ,λ1和R是當(dāng)前問(wèn)題的討厭參數(shù)。
因此,Δ的100(1-α)%置信區(qū)間為
式中:zα/2是標(biāo)準(zhǔn)正態(tài)分布的上α/2分位數(shù)。簡(jiǎn)單計(jì)算可以得到Δ的100(1-α)%置信區(qū)間寬度控制在2ω內(nèi)的樣本量為
2.2.1 基于限制性極大似然估計(jì)的Wald統(tǒng)計(jì)量的置信區(qū)間
在給定的原假設(shè)Δ=Δ0下,λ1和R的限制性極大似然估計(jì)和可以通過(guò)如下的方程組求得:
這個(gè)方程組是沒(méi)有顯示解的,因此可以通過(guò)一種迭代的方法(如Fisher-Score迭代)求解。的方差中的參數(shù)可以使用其限制性極大似然估計(jì),從而得到的方差的估計(jì)為:
此方程沒(méi)有顯示解,可通過(guò)迭代法求出此方程的解。
2.2.2 基于Score檢驗(yàn)統(tǒng)計(jì)量的置信區(qū)間
在Rosner模型下,假設(shè)檢驗(yàn)H0∶Δ=Δ0的Score檢驗(yàn)統(tǒng)計(jì)量為:
下限和上限分別是方程Ts(Δ)=zα/2和Ts(Δ)=-zα/2的解。
2.2.3 基于似然比檢驗(yàn)統(tǒng)計(jì)量的置信區(qū)間
當(dāng)樣本量足夠大時(shí),Rosner模型下,對(duì)于假設(shè)檢驗(yàn)H0∶Δ=Δ0的似然比檢驗(yàn)統(tǒng)計(jì)量為:
在大樣本下Tl服從自由度為1的卡方分布。因此,基于似然比統(tǒng)計(jì)量關(guān)于Δ的100(1-α)%置信區(qū)間上下限可通過(guò)迭代方法求解關(guān)于Δ的方程得到:
2.2.4 樣本量的數(shù)值解法
由于基于限制性極大似然估計(jì)的Wald檢驗(yàn)統(tǒng)計(jì)量、Score檢驗(yàn)統(tǒng)計(jì)量和似然比檢驗(yàn)統(tǒng)計(jì)量的置信區(qū)間都沒(méi)有顯表達(dá)式,因而本文采用如下的近似算法來(lái)計(jì)算區(qū)間寬度控制在2ω內(nèi)的樣本量:
步驟1給定m+1、R、λ1、Δ、κ和s的值,產(chǎn)生K組樣本其中服從二項(xiàng)分布服從三項(xiàng)分布
步驟2基于步驟1產(chǎn)生的隨機(jī)樣本,分別通過(guò)式(9)(11)(13)得到Δ的100(1-α)%置信區(qū)間,從而得到在樣本量m+1下Δ的經(jīng)驗(yàn)區(qū)間寬度,記為c*(m+1)。
步驟3如果c*(m+1)大于(小于)2ω,則增大(減小)m+1的值,重復(fù)步驟1、2,直到區(qū)間寬度c*(m+1)非常接近于給定的區(qū)間寬度2ω,即滿足min{m+1:|c(diǎn)*(m+1)-2ω≤0.001}的m+1即為所求的樣本量。
通過(guò)以上算法獲得的基于限制性極大似然估計(jì)的Wald、Score和似然比置信區(qū)間的樣本量分別記為Nw2,Ns和Nl。
為了檢驗(yàn)所提出方法的準(zhǔn)確性,考慮參數(shù)設(shè)置:Δ=-0.1,0.0,0.1;λ1=0.3,0.5;R=1.0,1.2以及κ=1.0,1.2,s=0.5,1.0;置信水平為1-α=0.95,置信區(qū)間寬度的一半控制在ω=0.05,0.1下的樣本量的確定。通過(guò)式(6)和樣本量的數(shù)值算法,可得到近似的樣本量Nw1、Nw2、Ns和Nl,為了考察樣本量公式的準(zhǔn)確性,基于估計(jì)的樣本量,隨機(jī)模擬計(jì)算了各種置信區(qū)間的經(jīng)驗(yàn)覆蓋概率(ECP)和經(jīng)驗(yàn)覆蓋寬度(ECW),結(jié)果見表3~6。
表3 置信區(qū)間寬度控制在2ω下的近似樣本量、經(jīng)驗(yàn)覆蓋概率和區(qū)間寬度(κ=1.0,s=0.5)
模擬研究表明:
1)基于Wald置信區(qū)間、Score置信區(qū)間和似然比置信區(qū)間確定的樣本量都很準(zhǔn)確,因?yàn)樵诠烙?jì)的樣本量下,各種置信區(qū)間的經(jīng)驗(yàn)覆蓋概率接近于事先給定的置信水平,且半?yún)^(qū)間寬度也很接近預(yù)先設(shè)定的寬度ω。
2)在文中所提出的4種方法中,基于似然比置信區(qū)間得到的樣本量是最大的,基于非限制性極大似然估計(jì)的Wald置信區(qū)間得到的樣本量是最小的,基于限制性極大似然估計(jì)的Wald置信區(qū)間和基于Score置信區(qū)間所得到的樣本量差別不大。
3)隨著Δ、λ1、R的增大,要使95%的置信區(qū)間寬度控制在2ω以內(nèi),所需要的樣本量就越大。
表4 置信區(qū)間寬度控制在2ω下的近似樣本量、經(jīng)驗(yàn)覆蓋概率和區(qū)間寬度(κ=1.0,s=1.0)
續(xù)表(表4)
表5 置信區(qū)間寬度控制在2ω下的近似樣本量、經(jīng)驗(yàn)覆蓋概率和區(qū)間寬度(κ=1.2,s=0.5)
表6 置信區(qū)間寬度控制在2ω下的近似樣本量、經(jīng)驗(yàn)覆蓋概率和區(qū)間寬度(κ=1.2,s=1.0)
對(duì)于表1中的兒童中耳炎數(shù)據(jù),采用所提出的方法研究樣本量。從表1的數(shù)據(jù)易知:=-0.203 7,=0.537,R^=1.517 1。因此,可認(rèn)為此數(shù)據(jù)是高度組內(nèi)相關(guān)的。假設(shè)κ=1.0,s=0.5,當(dāng)ω=0.05時(shí),利用提出的方法,可得到基于非限制性極大似然估計(jì)的Wald、限制性極大似然估計(jì)的Wald、Score和似然比置信區(qū)間確定的樣本量(m+1)分別為:587、588、577、736。它們所對(duì)應(yīng)的經(jīng)驗(yàn)覆蓋概率(經(jīng)驗(yàn)覆蓋寬度)分別為:95.45(0.099 9)、95.20(0.099 7)、94.80(0.090 1)、96.60(0.090 0)。當(dāng)ω=0.1時(shí)、基于非限制性極大似然估計(jì)的Wald、限制性極大似然估計(jì)的Wald、Score和似然比置信區(qū)間方法確定的樣本量(m+1)分別為:147、157、137、169。它們所對(duì)應(yīng)的經(jīng)驗(yàn)覆蓋概率(經(jīng)驗(yàn)覆蓋寬度)分別為:94.60(0.198 6)、94.35(0.192 1)、94.95(0.184 8)、96.95(0.191 9)。
基于單雙邊混合試驗(yàn)設(shè)計(jì)下治愈率之差,考慮了基于2種Wald型置信區(qū)間、Score置信區(qū)間和似然比置信區(qū)間的寬度控制在給定長(zhǎng)度內(nèi)的樣本量計(jì)算公式和近似樣本量的數(shù)值算法。通過(guò)研究表明:
1)基于Wald置信區(qū)間、Score置信區(qū)間和似然比置信區(qū)間所得到的近似樣本量的置信區(qū)間的經(jīng)驗(yàn)覆蓋概率與給定的置信水平十分接近,且區(qū)間寬度也很接近設(shè)定的寬度,因此在實(shí)際中這4種方法應(yīng)被推薦使用。
2)所需樣本的大小與參數(shù)取值有關(guān),參數(shù)Δ、λ1、R的值越大,所需要的樣本量就越大。綜上所述,文中提出的樣本量的估計(jì)公式和數(shù)值算法都是有效的。
附錄:
在Rosner模型下,檢驗(yàn)H0′:Δ=Δ0的Score檢驗(yàn)統(tǒng)計(jì)量為:
其中:
且