李 天 驕
(重慶理工大學(xué) 理學(xué)院,重慶 400054)
疾病患病率(二項(xiàng)比例)的估計是臨床試驗(yàn)和醫(yī)學(xué)研究中的一個重要課題,可以從特定的群體中抽取受試者進(jìn)行診斷并分類為患有或不患有疾病,以此來估計疾病的患病率。篩檢方法通常用于診斷過程的第一階段,其優(yōu)點(diǎn)是價格相對便宜、能夠快速獲得結(jié)果,并且對受試者通常是無害的。然而,篩檢方法的結(jié)果往往是存在誤判的,使用這些被錯誤分類的數(shù)據(jù)研究疾病流行率會導(dǎo)致估計有偏差[1]。另一方面,完全無誤判的檢測方法(金標(biāo)準(zhǔn))往往價格昂貴且耗時,因而不能對所有個體使用。Tenenbein[2]為了解決這個問題,提出了二重抽樣的方法。在二重抽樣中,所有的受試者都將接受篩檢方法的檢測,但只有其中n個人接受了金標(biāo)準(zhǔn)的檢測,因而有部分個體只接受了篩檢方法的檢測。Tang等[3]將通過這樣的方法得到的數(shù)據(jù)稱之為部分核實(shí)數(shù)據(jù)。
二重抽樣的設(shè)計和分析一直是統(tǒng)計研究中的重要課題。國內(nèi)外已有大量學(xué)者進(jìn)行了研究。例如,Espland和Odoroff[4]提出了對數(shù)線性模型,并通過EM算法的最大似然估計導(dǎo)出了參數(shù)估計和參數(shù)函數(shù)的協(xié)方差的表達(dá)式;Geng和Asano[5]提出了用于二重抽樣下有誤判的分類數(shù)據(jù)的貝葉斯估計方法;Alonzo[6]對各種疾病患病率的形式和屬性進(jìn)行了對比,并提出了半?yún)?shù)有效方法是二階段研究中患病率估計的首選方法;Tang等[7]提出了12種構(gòu)建患病率置信區(qū)間的方法;Qiu等[8]分別考慮了根據(jù)顯著性檢驗(yàn)和置信區(qū)間寬度的樣本量確定;邱等[9]基于兩種模型提出了在給定置信水平下的樣本量的近似公式;邱和何[10]在無金標(biāo)準(zhǔn)情況下對2組疾病流行率進(jìn)行了比較研究;Lui[11]提出了3個簡單的統(tǒng)計量,用于在有患者不配合的情況下的分層隨機(jī)臨床試驗(yàn)中風(fēng)險比的齊性檢驗(yàn)。然而在大多數(shù)情況下,當(dāng)年齡不同或生活環(huán)境等其他因素不相同時,人群中的患病率總是不相同的。這時就需要對受試者進(jìn)行分層歸類,探究分層情況下的疾病流行率問題?,F(xiàn)研究在金標(biāo)準(zhǔn)存在時,基于分層設(shè)計下的部分核實(shí)數(shù)據(jù),考慮了各層的敏感度和特異度不同時二項(xiàng)比例(疾病流行率)的齊性檢驗(yàn)過程。
假設(shè)有Nj個個體是從第j個總體中隨機(jī)抽取的,這Nj個個體每個都接受篩選檢測,檢測的結(jié)果為Tj。設(shè)Tj=0表示個體檢測呈陰性,否則,Tj=1;從Nj個個體中隨機(jī)抽取nj(nj 表1 第j組的數(shù)據(jù)結(jié)構(gòu)Table 1 Data structure of Jth group 令πj=P(Dj=1)表示第j個總體的疾病流行率,ηj=P(Tj=1|Dj=1)和θj=P(Tj=0|Dj=0)分別表示第j個總體的篩檢檢測的敏感度和特異度。pj表示第j個總體中用篩檢方法判斷為陽性的概率,顯然,pj=ηjπj+(1-θj)(1-πj),1-pj=πj(1-ηj)+ θj(1-πj)。 對如下的假設(shè)檢驗(yàn)感興趣: H0:π1=π2=…πj=π?H1:π1,…,πj 不全相等。令: m={(n11j,n10j,n01j,n00j,xj,yj)′,j=1,…,J}, 則對數(shù)似然函數(shù)為 (1) 以上對數(shù)似然函數(shù)分別對πj,ηj,θj(j=1,…,J)求偏導(dǎo),并令式子等于零,得到非限制性極大似然估計: (2) (3) 在原假設(shè)H0:π1=π2=…πj=π下,對數(shù)似然函數(shù)為 其中,pj1=ηjπ+(1-θj)(1-π),以上對數(shù)似然函數(shù)分別對π,ηj,θj(j=1,…,J)求偏導(dǎo)并令式子等于零,可得π的限制性極大似然估計為 此方程組沒有顯式解,可通過迭代法如牛頓迭代法求解。 對于齊性檢驗(yàn)H0:π1=π2=…πj=π?H1:π1,…,πj至少有一個不相等??紤]了以下統(tǒng)計量: 1.2.1 加權(quán)最小二乘統(tǒng)計量 根據(jù)Fleiss等[12]可得,當(dāng)原假設(shè)成立,在Nj趨于無窮大時,Twls漸近服從自由度為J-1的卡方分布。 1.2.2Twls的對數(shù)變換統(tǒng)計量 根據(jù)Fisher等[13],對數(shù)變換后的Twls檢驗(yàn)統(tǒng)計量將更加接近正態(tài)分布。因此,基于Twls統(tǒng)計量考慮如下的檢驗(yàn)統(tǒng)計量: Tlwls={log(Twls/(J-1))/2+ 當(dāng)原假設(shè)成立,在Nj趨于無窮大時,統(tǒng)計量漸近服從標(biāo)準(zhǔn)正態(tài)分布。即當(dāng)Tlwls≥z1-α,則拒絕原假設(shè),其中z1-α為標(biāo)準(zhǔn)正態(tài)分布的上α分位數(shù)。 1.2.3 基于對數(shù)變換的檢驗(yàn)統(tǒng)計量 1.2.4 基于logit變換的檢驗(yàn)統(tǒng)計量 其中 當(dāng)原假設(shè)成立,在Nj趨于無窮大時,Tlogit漸近服從自由度為J-1的卡方分布。 1.2.5 基于雙對數(shù)變換的檢驗(yàn)統(tǒng)計量 其中, 當(dāng)原假設(shè)成立,在Nj趨于無窮大時,Tdlog漸近服從自由度為J-1的卡方分布。 1.2.6 Score檢驗(yàn)統(tǒng)計量 根據(jù)Rao[14]的score檢驗(yàn)的一般理論,由對數(shù)似然函數(shù)l1可得到原假設(shè)H0下第j層的Fisher信息陣為 其中,pj1=ηjπ+(1-θj)(1-π),1-pj1=π(1-ηj)+θj(1-π) 根據(jù)Tang等[3],第j層的score統(tǒng)計量為 1.2.7 似然比檢驗(yàn)統(tǒng)計量 根據(jù)式(1)和式(2),對于假設(shè)檢驗(yàn)H0:π1=π2=…πj=π?H1:π1,…,πj不全相等的似然比檢驗(yàn)統(tǒng)計量為:Tl=2[l1(m;π,η,θ)-l2(m;π,η,θ)]。當(dāng)原假設(shè)成立,在Nj趨于無窮大時,Tl漸近服從自由度為J-1的卡方分布。 1.3.1 漸近的檢驗(yàn)過程 1.3.2 Bootstrap重抽樣檢驗(yàn)過程 漸近的檢驗(yàn)過程的模擬結(jié)果表明,小樣本下除了score檢驗(yàn)和似然比檢驗(yàn)的其他檢驗(yàn)統(tǒng)計量的表現(xiàn)并不是很好,此時,bootstrap重抽樣檢驗(yàn)過程是一個有效的選擇。因而,基于Twls,Tlog,Tlogit和Tdlog考慮了如下步驟的基于bootstrap重抽樣的檢驗(yàn)過程: Step 1計算觀測數(shù)據(jù)m={(n11j,n10j,n01j,n00j, 基于Bootstrap重抽樣方法的檢驗(yàn)p值為 (q=wls,log,logit,dlog),其中,I(*)為示性函數(shù)。在顯著性水平α下,如果pq<α,則拒絕原假設(shè)(q=wls,log,logit,dlog)。 為了檢驗(yàn)提出的各種檢驗(yàn)的有效性,通過蒙特卡羅模擬方法對各種檢驗(yàn)過程進(jìn)行評價??紤]了J=3的模型和如下的樣本量:平衡設(shè)計樣本量 在顯著性水平α=0.05下,每個檢驗(yàn)統(tǒng)計量犯第一類錯誤的概率為:檢驗(yàn)統(tǒng)計量拒絕原假設(shè)的次數(shù)/5 000(H0成立下);經(jīng)驗(yàn)功效的計算公式為:檢驗(yàn)統(tǒng)計量拒絕原假設(shè)的次數(shù)/5 000(H1成立下)。犯第一類錯誤的模擬結(jié)果見表2—表5。對于功效由于篇幅的限制只列出了中等樣本(平衡與非平衡設(shè)計)的模擬結(jié)果,見表6—表7。 表2 在小樣本下各種檢驗(yàn)犯第一類錯誤的概率(顯著性水平α=0.05) % Table 2 Actual type I error rates of the various procedures in small-sample performance(notability level α=0.05) % 表3 在中等樣本下各種檢驗(yàn)犯第一類錯誤的概率(顯著性水平α=0.05) %Table 3 Actual type I error rates of the various procedures in moderate-sample performance(notability level α=0.05)% 表4 在大樣本下各種檢驗(yàn)犯第一類錯誤的概率(顯著性水平α=0.05) % Table 4 Actual type I error rates of the various procedures in large-sample performance(notability level α=0.05) % 表5 在不平衡樣本下各種檢驗(yàn)犯第一類錯誤的概率(顯著性水平α=0.05) %Table 5 Actual type I error rates of the various procedures in unbalanced-sample performance(notability level α=0.05)% 表6 在中等樣本下各種檢驗(yàn)的檢驗(yàn)功效(顯著性水平α=0.05) % Table 6 Actual test powers of the various procedures in moderate-sample performance(notability level α=0.05) % 表7 在不平衡樣本下各種檢驗(yàn)的檢驗(yàn)功效(顯著性水平α=0.05) % Table 7 Actual test powers of the various procedures in unbalanced-sample performance(notability level α=0.05) % 模擬結(jié)果表明: (1) 即使在小樣本(如(n1,n2,n3,N1,N2,N3)=(30,30,30,50,50,50))下,基于score統(tǒng)計量的漸近的檢驗(yàn)過程犯第一類錯誤的概率都很接近給定的顯著性水平且功效也較高。 (2) 除了在π=0.1外,基于似然比統(tǒng)計量的漸近的檢驗(yàn)過程也表現(xiàn)較好,其第一類的概率接近給定的顯著性水平且具有較高的檢驗(yàn)功效。 (3) 隨著樣本量的增大,基于各種統(tǒng)計量的漸近的檢驗(yàn)過程犯第一類錯誤的概率越來越接近給定的顯著性水平。 根據(jù)Nedelman[15]的文章,世界衛(wèi)生組織和尼日利亞政府在1969—1976年間對尼日利亞的瘧疾進(jìn)行了大規(guī)模的流行病學(xué)和控制研究。按照受試者的年齡將調(diào)查結(jié)果分為了7個年齡段,選取了其中3個成年人組(即19~28歲,29~43歲和44歲以上)的數(shù)據(jù)說明提出的方法。將高級顯微鏡學(xué)家的判斷假定為金標(biāo)準(zhǔn),數(shù)據(jù)結(jié)構(gòu)如表8: 表8 尼日利亞瘧疾數(shù)據(jù)Table 8 Malaria data in Nigeria
π=(π1,…,πJ)′,η=(η1,…,ηj)′,θ=(θ1,…,θj)′,1.2 檢驗(yàn)統(tǒng)計量
1.3 檢驗(yàn)過程
2 模擬研究
3 實(shí)例分析
4 結(jié) 論