張珍, 趙強(qiáng)
(山東師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院, 山東 濟(jì)南 250014)
基于貝葉斯方法的Meta-分析
張珍, 趙強(qiáng)*
(山東師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院, 山東 濟(jì)南 250014)
稀疏數(shù)據(jù); 貝葉斯模型; Jeffreys分布; 鏈接函數(shù); Meta-分析
1976年,英國(guó)心理學(xué)家Glass[1-2]提出Meta-分析,這是以綜合已有發(fā)現(xiàn)為目的, 對(duì)單個(gè)研究結(jié)果的集合的統(tǒng)計(jì)學(xué)研究方法。Meta-分析又稱作薈萃分析、整合分析、匯總分析, 是對(duì)具有相同研究題目的多個(gè)研究進(jìn)行綜合分析的一系列過程, 其中包括提出研究問題、制定納入和排除標(biāo)準(zhǔn)、檢索相關(guān)研究、匯總基本信息、綜合分析并報(bào)告結(jié)果等[3]。
到目前為止, 針對(duì)稀疏數(shù)據(jù)的合并, 大致分為兩個(gè)方向: 一種是對(duì)稀疏數(shù)據(jù)進(jìn)行填補(bǔ), 即對(duì)試驗(yàn)中存在0案例的試驗(yàn)進(jìn)行連續(xù)性修正; 另外一種是無(wú)需進(jìn)行連續(xù)性修正, 運(yùn)用貝葉斯模型直接對(duì)各個(gè)試驗(yàn)結(jié)果進(jìn)行分析。
貝葉斯統(tǒng)計(jì)學(xué)的基礎(chǔ)是貝葉斯公式和貝葉斯定理,貝葉斯公式是基于條件概率的定義和全概率公式推導(dǎo)而來[4], 因此貝葉斯公式的實(shí)踐形式如下: 設(shè)試驗(yàn)E的樣本空間為S,A為E的事件,B1,B2,…,Bn為樣本空間S的一個(gè)劃分, 且p(A)>0,p(Bi)>0,i=1,2,…,n,則由條件概率的定義及全概率公式可得:
貝葉斯公式密度函數(shù)形式如下: 設(shè)x=(x1,x2,…,xn)是來自某總體的樣本, 該總體的概率密度函數(shù)為p(x|θ),當(dāng)給定一組觀察值x=(x1,x2,…,xn)時(shí),θ的條件概率分布為
即在樣本x=(x1,x2,…,xn)下θ的后驗(yàn)分布。其中,π(θ)是參數(shù)θ的先驗(yàn)分布。
為樣本x=(x1,x2,…,xn)的聯(lián)合條件密度函數(shù), 也即似然函數(shù)。
為x的邊緣密度函數(shù), 是一個(gè)與θ無(wú)關(guān)的量。
而在0~1之間的不可觀察的變量x的貝葉斯模型如下:
其中,為了完善Meta-分析中貝葉斯模型的計(jì)算公式, 我們需要一個(gè)鏈接函數(shù)π(θi|θ), 注意這個(gè)條件分布必須兼容早先給的π(θi)和π(θ),也就意味著二維分布π(θi,θ)=π(θi|θ)π(θ)必須滿足積分公式[5]
通常π(θi,θ)可能依賴于不確切的超參數(shù)t。 這里考慮內(nèi)在先驗(yàn)分布類
{πIJ(θi,θ|t),t≥1},
經(jīng)驗(yàn)證
可用作模型的鏈接函數(shù), 上式是一個(gè)單變量Beta密度的混合。因此, 可以用統(tǒng)計(jì)軟件實(shí)現(xiàn)。例如R、Mathematic。 經(jīng)過計(jì)算, 可以得出在給定t下,θi和θ之間的相關(guān)系數(shù)如下:
這是一個(gè)關(guān)于t的遞減函數(shù)[6]。
考慮一個(gè)有不同中心的k個(gè)相互獨(dú)立的隨機(jī)臨床試驗(yàn)結(jié)果, 用(xi,ni),i=1,2,3,…,k表示可觀察到的多中心數(shù)據(jù)集。θi表示數(shù)據(jù)中心的概率效應(yīng), 即xi~B(θi,ni)。 接下來的計(jì)算公式運(yùn)用θi的似然函數(shù)和鏈接分布可得
在給定t下, 參數(shù)θ的似然函數(shù)可有下式表達(dá)出來:
其中,P(x)表示變量x的似然函數(shù)。假設(shè)(xi,ni)對(duì)i=1,2,…,k相互獨(dú)立, 在給定θ的條件下,θi在θ下條件獨(dú)立。然后對(duì)整個(gè)數(shù)據(jù)集有參數(shù)θ的似然函數(shù)如下:
令n=(n1,n2,…,nk),x=(x1,x2,…,xk),而在給定t下,θ的后驗(yàn)概率可由下式給出:
其中關(guān)于參數(shù)θ, 應(yīng)用數(shù)據(jù)(x,n)包含所有的信息, 符號(hào)“∝”表示“正比于”, 注意正常化常數(shù)不能從其封閉形式中得到。這里需要一個(gè)簡(jiǎn)單的一維數(shù)值分析。關(guān)于變量X的預(yù)測(cè)分布, 在給定數(shù)據(jù)(x,n)和超參數(shù)t下, 可得
其中,X=0,1t≥1。
當(dāng)X=1時(shí), 上式得
注意, 處理組的試驗(yàn)成功時(shí)恰好有P(X=1|x,n,t); 并且觀察到只有在0-1隨機(jī)變量的情況下, 預(yù)測(cè)分布的變量和參數(shù)的后驗(yàn)期望一致。然而, 當(dāng)隨機(jī)變量超過兩個(gè)值時(shí), 這個(gè)情況將不會(huì)成立。
滿足條件; 這里,t是一個(gè)超參數(shù). 運(yùn)用θi的似然函數(shù)和鏈接分布可得:
類似2.1的計(jì)算過程, 關(guān)于變量X的預(yù)測(cè)分布, 在給定數(shù)據(jù)(x,n)和超參數(shù)t下, 可由下式得出:
其中,X=0,1,t≥1。當(dāng)X=1時(shí), 上式得
事實(shí)上, 處理組的試驗(yàn)成功時(shí)恰好有P(X=1|x,n,t), 而上面得到是關(guān)于θ的一組向量。
[1]GLASS G V. Primary,secondaryand Meta-analysis of research[J]. Educ Res, 1976, 5(10):3-8.
[2]YATES F. Contingency tables involving small numbers and the chi-squared test[J]. Supplement to the Journal of the Royal Statistical Society,1934,1(2):217-235.
[3]王丹,翟俊霞,牟振云,等. Meta-分析中的異質(zhì)性及其處理方法[J].中國(guó)循證醫(yī)學(xué)雜志,2009.9(10):1115-1118.
[4]COCHRAN W G. Problems arising in the analysis of a series of similar experiments[J]. Supplement to the Journal of the Royal Statistical Society,1937,4(1)102-118.
[5]MANTEL N,HAENSZEL W. Statistical aspects of the analysis of data from retrospective studies of disease[J].Journal of the National Cancer Institute,1959,22(4):719-748.
[6]MORENO E,VAZQUEZ-POLO E J,NEGRIN M A. Objective Bayesian meta-analysis of sparse discrete data[J].Stat Med,2014,33(21)3676-92.
[7]VAZQUEZ-POLO F J,MORENO E, Negrín M A, et al. A bayesian sensitivity study of risk difference in the meta-analysis of binary outcomes from aparse data[J]. Expert Rev Pharmacoecom Outcomes Res,2015,15(2):317-322.
Meta-analysisbasedonBayesianmethod
ZHANGZhen,ZHAOQiang*
(InstituteofMathematicsandStatistics,ShandongNormalUniversity,Jinan250014,China)
∶sparse data;Bayesian model;jeffreys distribution;link function;Meta-analysis
10.3976/j.issn.1002-4026.2017.06.019
2017-03-31
國(guó)家自然科學(xué)基金(11001155)
張珍(1991—), 女, 碩士研究生, 研究方向?yàn)閼?yīng)用統(tǒng)計(jì)。
*通信作者,趙強(qiáng),男,副教授。E-mail:zhaoqstst@126.com
O211
A
1002-4026(2017)06-0115-04